ChatGPT y el futuro de la IA: la revolución profunda del lenguaje Terrence J. Sejnowski La prensa del MIT (2024)
Algunos de los ganadores sorpresa de los Premios Nobel de este año fueron los desarrolladores de AlphaFold, un modelo de inteligencia artificial (IA) que puede predecir con precisión la estructura 3D de más de 200 millones de proteínas. AlphaFold funciona con redes neuronales artificiales que pueden obtener patrones de cómo interactúan los aminoácidos en proteínas conocidas y luego usar esa información para modelar el comportamiento de proteínas desconocidas. Los chatbots como ChatGPT se basan en tecnología similar para “aprender” e imitar el lenguaje humano.
La revolución provocada por esta tecnología se explora de manera convincente en el libro de Terrence Sejnowski. ChatGPT y el futuro de la IA – una secuela de su libro de 2018 La revolución del aprendizaje profundo. Sejnowski, un neurobiólogo computacional, lleva a los lectores a un recorrido vertiginoso por la evolución de la IA, desde simples modelos informáticos de una sola neurona construidos en la década de 1950 hasta avances en el aprendizaje profundo en las dos últimas décadas que han dado lugar al nacimiento de importantes modelos de lenguaje. . (LLM), que puede generar respuestas a preguntas similares a las humanas.
ChatGPT un año después: ¿quién lo usa, cómo y por qué?
El libro de Sejnowski es una lectura obligada para quienes buscan comprender el mundo en el que vivimos: un mundo en el que las máquinas están transformando el tejido cognitivo humano. En pocas palabras, una red neuronal es una red de nodos o neuronas interconectados que pueden procesar datos y aprender de ellos ajustando la fuerza de las conexiones entre los nodos. Cuando se cambia la fuerza de estas conexiones para lograr el resultado deseado durante una fase de entrenamiento, el modelo aprende a detectar los patrones subyacentes.
La inspiración fundamental detrás de las arquitecturas de redes neuronales es el cerebro humano. Sejnowski sugiere que desentrañar el misterio de por qué estos modelos simulados del cerebro funcionan tan bien (especialmente cuando se entrenan con grandes cantidades de datos) podría resultar tan fundamental como el descubrimiento del ADN. Al interrogar rigurosamente el “comportamiento sobrenatural” de los LLM, podrían surgir nuevos marcos conceptuales, predice.
Ve paralelismos entre los debates actuales sobre el significado de «inteligencia» y «comprensión» y las discusiones de hace un siglo sobre la naturaleza de la vida. En ese momento, los vitalistas sostenían que la vida era una fuerza no física (una esencia infundida en los seres vivos, pero no en las rocas, por ejemplo), mientras que los mecanicistas creían que la vida podía explicarse plenamente mediante procesos físicos y químicos. Así como el descubrimiento de la doble hélice del ADN llenó vacíos conceptuales y transformó la biología, Sejnowski predice que los avances en la IA traerán revelaciones sobre la inteligencia.
Una comprensión en evolución
El santo grial de la IA, explica Sejnowski, es la inteligencia artificial general: una máquina que puede pensar, aprender y resolver problemas en una amplia gama de tareas, de forma muy parecida a un ser humano. La generación actual de LLM está lejos de eso. Algunos investigadores los denominan peyorativamente “loros estocásticos”, y en su mayoría imitan el lenguaje humano sin ninguna comprensión real.
Listo o no, la IA está llegando a la educación científica y los estudiantes tienen opiniones
Según Sejnowski, el camino a seguir para la IA es el de la colaboración interdisciplinaria, en la que los conocimientos de la biología, la neurociencia y la informática convergen para guiar el desarrollo de la IA. Sejnowski imagina que el conocimiento sobre los “fundamentos de la inteligencia” –como la adaptabilidad, la flexibilidad y la capacidad de sacar conclusiones generales a partir de información limitada– catalizará la próxima generación de inteligencia artificial.
La revolución del lenguaje de IA, como Sejnowski se refiere a la era LLM, ya está remodelando muchos aspectos de la vida humana. A medida que los LLM evolucionen, irán más allá de su función principal como herramientas y comenzarán a actuar como colaboradores en áreas como la atención médica, la educación y el derecho. Esto ya está empezando a suceder, como muestra AlphaFold. El autor utiliza ChatGPT generosamente para proporcionar resúmenes al final de cada capítulo, y las conversaciones con el chatbot se encuentran dispersas a lo largo del libro. Incluso reconoce en broma a ChatGPT como coautor.
El poder de los LLM también radica en la forma en que los usuarios interactúan con ellos. Sejnowski señala la habilidad cada vez más importante de la ingeniería rápida, que enfatiza que cambios sutiles en la forma en que se instruye un modelo pueden moldear su resultado. El autor ofrece consejos útiles: plantee varias respuestas, no sólo una; ser preciso, para que el modelo pueda converger rápidamente hacia la mejor respuesta; Da forma a tu diálogo como si estuvieras hablando con una persona real.
Sejnowski propone una “prueba de Turing inversa”, en la que la inteligencia del apuntador se evalúa en función de la calidad de sus interacciones con la IA. Estas pruebas de habilidad podrían volverse comunes a medida que se generalice el uso de la IA.
¿Puede la IA tener sentido común? Descubrirlo será la clave para lograr la inteligencia artificial
La próxima generación de LLM debe pasar por un proceso de desarrollo similar a la fase de aprendizaje infantil en humanos, plantea su hipótesis, aprendiendo de interacciones del mundo real y de datos. La memoria a largo plazo y el comportamiento dirigido a objetivos deben integrarse para que los sistemas puedan adaptarse y planificar de forma eficaz. La incorporación de robótica y sistemas sensoriomotores permitiría que las herramientas de inteligencia artificial perciban e interactúen con su entorno, impulsando así los modelos actuales hacia una autonomía general artificial.
Aunque Sejnowski es optimista acerca de la tecnología, reconoce que aún quedan muchos desafíos sin resolver que deberán abordarse para garantizar la sostenibilidad a largo plazo de la IA. Esto corre el riesgo de alterar las industrias y el mercado laboral. Y la creciente necesidad de una alta potencia de procesamiento informático ha puesto en primer plano la necesidad de modelos de IA más eficientes y ecológicos.
Aunque todavía estamos muy lejos, también es importante, escribe Sejnowski, considerar seriamente la posibilidad de que la IA supere la inteligencia humana, porque prepararnos ahora nos permitirá anticipar y mitigar amenazas potenciales. Una estrategia cuidadosa y bien regulada para gestionar los riesgos éticos y existenciales (como los errores inducidos por la IA y el uso político de los LLM como arma) es esencial para garantizar que la IA beneficie a la sociedad.
ChatGPT y el futuro de la IA explica cómo la próxima ola de avances impulsados por la IA podría cambiar el propio panorama del conocimiento. La exploración de Sejnowski sirve tanto de guía como de advertencia mientras navegamos por las promesas y los peligros de los rápidos avances en la IA.
Intereses en competencia
El autor no declara intereses en competencia.