Jacob Posel es ingeniero de software en Common Thread Collective, la agencia de comercio electrónico. Se centra en estrategias para integrar la inteligencia artificial en una empresa. La mejor manera de hacerlo, afirma, es racionalizar los procesos operativos, que de otro modo podrían quedar en manos de asistentes virtuales o mano de obra barata.
En nuestra conversación reciente, habló sobre la IA versus la creatividad humana, la generación de imágenes, los costos y más. El audio completo de esta discusión se incluye a continuación. La transcripción ha sido editada para mayor extensión y claridad.
Eric Bandholz: Danos una visión general de lo que haces.
Jacob Posel: Soy ingeniero de software senior en Common Thread Collective. Dedico la mayor parte de mi tiempo a integrar la inteligencia artificial en el proceso creativo y empresarial. Recientemente me ocupo de la generación de imágenes. El trabajo se extiende a todo el sistema operativo creativo.
Los casos de uso más adecuados para la IA son los procesos comerciales diarios, especialmente aquellos confiados a asistentes virtuales u otras formas de trabajo. Estas tareas generalmente se adaptan bien a la IA. Pero permítanme definir lo que considero que es la IA en este momento, porque se ha convertido en una palabra de moda.
La mayoría de la gente piensa que la IA es un modelo de lenguaje amplio, pero es más amplio que eso. Para los procesos de negocios, me refiero a un sistema que comprende el habla y el texto humanos y una visión del mundo lo suficientemente buena como para desarrollar la intuición. Comenzaría analizando estos procesos y luego determinaría cómo usted y su equipo podrían volverse más eficientes. ¿Qué herramientas tienes? ¿Cómo puede automatizar completamente este proceso una vez que determine cómo encaja en su proceso y su negocio?
Eric Bandholz: ¿Podrías dar un ejemplo?
Jacob Posel: Puede utilizarlo para obtener una imagen más holística de su negocio. Por ejemplo, puede extraer datos de ventas o reseñas. Intégrelos en la Hoja de Google si lo desea, luego determine qué información está tratando de obtener de estos datos y las siguientes acciones. Explique esto a un LLM y AI. Comparta los datos que extrajo y explique su proceso de pensamiento. Luego puede pedirles que los resuman, le proporcionen información o le informen si hay algo que necesite saber.
Eric Bandholz: ¿Cómo mantener la competencia fundamental de la creatividad humana?
Jacob Posel: Leí un artículo de investigación sobre el tema, donde intentaron entrenar un LLM o un modelo de IA en función de sus resultados y luego ver cuántas iteraciones se necesitarían para que todo el proceso fallara. Después de unas 10 iteraciones, no producía más que una absoluta tontería. Si lo piensas bien, el 80% del código en Internet está escrito por IA, al igual que gran parte del texto en línea. Por lo tanto, es legítimo preocuparse de que nos falten datos de entrenamiento para desarrollar nuevos modelos y que estos nuevos modelos eventualmente lleguen a un punto en el que ya no puedan progresar.
Las modelos intentan apoderarse de YouTube y los videos para obtener más ganancias. Pero muchas personas muy inteligentes están descubriendo diferentes técnicas para mejorar estos modelos más allá de los datos de entrenamiento. La mayoría de los modelos ahora obtienen la mayor cantidad de datos de entrenamiento posible, gastan la mayor cantidad de dinero posible en computación y ven lo que producen. Esto no puede continuar indefinidamente.
La idea general es que la IA permite a las personas crear su propio software. Ahora mismo puedes crear lo que quieras. Incluso si no eres un experto en tecnología, dedicar un poco de tiempo a implementar las mejores tecnologías puede resultar frustrante, difícil al principio e imperfecto, pero puedes hacerlo. El futuro de los lenguajes de programación no será Python, JavaScript o SQL. La próxima iteración será el lenguaje natural. Creo que es bastante seguro en este momento.
Eric Bandholz: Generas imágenes usando IA. ¿Cómo procedes?
Jacob Posel: El modelo subyacente con el que he estado jugando se llama Flux. Es diferente del modelo Midjourney. Puedes refinar tus propios modelos. Utilizo principalmente Replicate, una interfaz donde puedes interactuar con unidades de procesamiento de gráficos y refinar tus propios modelos.
Midjourney es una gran herramienta para generar una imagen a partir del texto que proporcionas. Si quieres producir una imagen de un hombre sentado en una silla debajo de un árbol junto a un lago, usaría Midjourney. Pero para crear imágenes que contengan algo específico que existe en el mundo real (un producto o una persona), necesitas entrenar tu propio modelo personalizado. No puedes hacer eso con Midjourney. Por eso uso Flux.
Cabe señalar que a medida que se vuelve más específico con el producto, el modelo muestra menos creatividad en el fondo y todo lo demás en la imagen. Así que con un producto muy simple como una camiseta puedes ponérselo en cualquier lugar a cualquier persona, pero cuando necesitas ser muy específico el modelo se centrará demasiado en tu producto dificultando la realización del resto.
Los datos de entrenamiento son muy importantes. Si desea un ángulo específico, asegúrese de haberles proporcionado una foto desde ese ángulo específico, idealmente varias veces, y también asegúrese de que sea de alta definición.
Eric Bandholz: ¿Cuánto cuesta?
Jacob Posel: El vídeo es el servicio más caro actualmente. El costo incluye texto, imagen y video, como era de esperar. Runway, por ejemplo, utiliza un sistema de créditos. El crédito es en dólares. El plan ilimitado no es genial. Cuesta alrededor de $100 por mes. No es la solución más barata del mundo, pero tampoco es prohibitiva. Esto es costoso en términos de tiempo y lleva tiempo dominar estas instrucciones.
Convertir texto a imagen es un poco más complicado porque estás describiendo algo más claramente. Luego, la conversión de texto a video muestra cuántos cuadros se unen. Se vuelve más caro y más difícil de lograr. Es necesario desarrollar una idea de la terminología utilizada para entrenar estos modelos. Comprenderás la fotografía y el lenguaje cinematográfico a medida que avances. Pero por eso utilizar herramientas más avanzadas es más complejo y más caro.
Lo mejor que puedes hacer es arremangarte y descubrirlo por tu cuenta. En última instancia, esta es la mejor manera de aprender, porque las IA tienen personalidades en este punto y no aprenderás mientras lees. Así es como veo la IA. Debe comprender qué los hace funcionar y cómo lograr que hagan lo que usted desea.
Empiece a pensar en su negocio como sistemas y procesos diferentes. No piense en crear un anuncio como una sola cosa. Divídalo en pasos principales y tenga en cuenta esa perspectiva y base, porque así es como se construye un producto de ingeniería. Y así es como la IA encajará. También será importante conectarse con alguien que comprenda la IA y cómo encaja en su negocio.
Eric Bandholz: ¿Dónde puede seguirte la gente?