En términos generales, el procesamiento del lenguaje natural transforma el lenguaje en constructos que pueden manipularse de manera útil. Dado que las integraciones de aprendizaje profundo han demostrado ser tan poderosas, también se han convertido en las predeterminadas: elija un modelo, integre sus datos, elija una métrica, realice RAG. Para agregar nuevo valor, es útil tener una visión diferente del lenguaje conciso.
El que les voy a compartir hoy comenzó hace años, con un solo libro.
El ladrón de orquídeas es a la vez no ficticio y está lleno de travesuras. Lo leí por primera vez cuando tenía veintitantos años, saltándome la mayoría de las anécdotas históricas y esperando leer sus relatos en primera persona. En ese momento me eché a reír pero pasé las páginas con furia silenciosa, que alguien pudiera vivir tan profundamente y escribir tan bien. No estaba realmente seguro si eran cosas diferentes.
Al cabo de un año me mudé a Londres para empezar de nuevo.
Me metí en los servicios financieros, que es como un parque temático para nerds. Y, durante la siguiente década, sólo aceptaría trabajos que implicaran mucha escritura.
Siendo mucho la palabra clave.
Detrás de la moderna fachada de servicios profesionales, la industria británica sigue viva gracias a sus antiguas fábricas y astilleros. Emplea a Alice para hacer una cosa y luego se la entrega a Bob; gira algunos tornillos y es de Charlie. Un mes después, todos empezamos de nuevo. Como recién llegado, me di cuenta de que los hábitos no eran tanto una zanja en la que caer sino un montículo en el que arriesgarse.
También leo mucho. Vale, lo estaba leyendo Neoyorquinos. Mi parte favorita fue darle la vuelta a uno nuevo, abrirlo por la parte posterior y leer las primeras frases de uno de ellos, Anthony Lane, que escribe reseñas de películas. Durante años y años, ni una sola vez he ido a ver una película.
De vez en cuando un parpadeo me pillaba con la guardia baja. Un hilo apenas visible entre Neoyorquinos corpus y mis resultados no Pulitzer. En ambos corpus, cada pieza era diferente de sus hermanas, pero también…no exactamente. Las similitudes resonaron. Y supe que los de mi trabajo nacían de un proceso repetitivo.
En 2017 comencé a meditar sobre el umbral que separa la escritura, que se siente estereotipado de lo que se puede escribir explícitamente como una fórmula.
El argumento es el siguiente: el volumen de repetición sugiere una forma (normalmente tácita) de toma de decisiones algorítmica. Pero repetir procedimientos deja huellas dactilares. Rastree las huellas dactilares para revelar el procedimiento; examinar el algoritmo; y el software prácticamente se escribe solo.
En mi último trabajo ya no escribía mucho. Mi software era.
En principio, las empresas pueden aprender lo suficiente sobre sus propios flujos para obtener enormes ganancias, pero a pocas les importa. La gente parece mucho más fascinada por lo que alguien más hacer.
Por ejemplo, mis jefes, y más tarde mis clientes, querían que su personal pudiera imitar el Economistael estilo de la casa. Pero ¿cómo encontrar los pasos? Economista ¿Se necesita para terminar sonando así?
Ingrese al análisis de texto
Leer solo uno Economista artículo, y parece aireado y confiado. Lee muchos de ellos y se parecen un poco. Una revista completamente impresa aparece una vez por semana. Sí, estaba apostando por el proceso.
Para divertirnos, apliquemos una función de legibilidad (medida en años de estudio) a varios cientos Economista elementos. Hagamos lo mismo con los cientos de artículos publicados por un frustrado gestor de activos europeo.
A continuación, obtengamos un histograma para ver cómo se distribuyen estos puntajes de legibilidad.
¡Solo dos funciones y mira la información que obtenemos!
Observe qué tan separadas están las curvas; este administrador de activos es no parecido a Economista. Podríamos profundizar más para ver qué causa esta disparidad. (Para empezar, a menudo es frases locas y largas.)
Pero observe también cómo el Economista impone un límite estricto a la puntuación de legibilidad que permiten. La curva es inorgánica, lo que delata que aplican un estricto control de legibilidad en su proceso de edición.
Finalmente, y muchos de mis clientes han luchado con esto, la Economista se compromete a escribir con suficiente claridad para que un estudiante promedio de secundaria pueda digerirlo.
Esperaba estos gráficos. Los había garabateado en un papel. Pero cuando una imagen real iluminó mi pantalla por primera vez, fue como si el lenguaje mismo se hubiera reído.
Ahora bien, no fui exactamente el primero en llegar a la escena. En 1964, los estadísticos Frederick Mosteller y David Wallace aparecieron en la portada de Tiempo revista, su análisis literario forense resolver un debate de 140 años sobre la autoría de una docena de ensayos escritos de forma anónima.
Pero el análisis forense siempre examina un único elemento frente a dos corpus: el creado por el presunto autor y la hipótesis nula. El benchmarking sólo se ocupa de comparar cuerpos de texto.
Construyendo un motor de análisis de texto
Volvamos sobre nuestros pasos: dado un corpus, aplicamos la misma función a cada uno de los textos (la función de legibilidad). Esto asignó el corpus a un conjunto (en este caso, números). En este conjunto aplicamos otra función (el histograma). Finalmente, lo hicimos en dos corpus diferentes y comparamos los resultados.
Si entrecierras los ojos, verás que acabo de describir Excel.
Lo que parece una mesa es en realidad A tubería, analizar columnas secuencialmente. Primero a lo largo de la columna, seguido de las funciones de resultados y luego las funciones de evaluación comparativa.
Bueno, quería Excel, pero para texto.
No cadenas, texto. Quería aplicar funciones como Count Verbs
O First Paragraph Subject
O First Important Sentence
. Y tenía que ser lo suficientemente flexible como para poder preguntar una pregunta; ¿Quién sabe qué terminaría importando?
En 2020, este tipo de solución no existía, así que la construí. ¡Y vaya que este software “prácticamente se escribió solo”! Hacer posible la posibilidad de formular cualquier pregunta requirió buenas decisiones arquitectónicas, en las que me equivoqué dos veces antes de solucionar los problemas.
En última instancia, las funciones se definen una vez, por lo que hacen con un único texto de entrada. Luego, elige las etapas del proceso y los corpus sobre los que actúan.
Con eso, comencé una empresa de consultoría en tecnología de escritura, Texto final. Planeé construir mientras trabajaba con clientes y ver qué se mantenía.
Lo que dice el mercado
El primer caso de uso empresarial que se me ocurrió fue escucha social. Las investigaciones y encuestas de mercado son un gran negocio. Ahora estamos en el apogeo de la pandemia, todos están en casa. Pensé que abordar debates activos en comunidades en línea dedicadas podría ser una nueva forma de acceder al pensamiento de los clientes.
Cualquier primer cliente de software habría parecido especial, pero Éste Fue emocionante, porque mi brebaje realmente ayudó a personas reales a salir de una situación difícil:
Como preparación para un gran evento, planearon lanzar un informe emblemático, con datos de una encuesta pagada de YouGov. Pero sus resultados fueron tibios. Entonces, con el presupuesto restante, compraron un estudio de FinText. Fueron nuestros descubrimientos los que colocaron a la vanguardia en su informe final.
Pero la escucha social no ha despegado. Los terrenos para inversión son extraños porque las reservas de efectivo siempre necesitarán una casa; La única pregunta es quién es el dueño. La mayoría de las personas de la industria con las que hablé querían saber qué estaban haciendo sus competidores.
Entonces, el segundo caso de uso (análisis de contenido competitivo) recibió una respuesta más cálida. He vendido esta solución a aproximadamente media docena de empresas (incluidas, por ejemplo, Inversores Aviva).
Desde el principio, nuestro motor recopiló datos que nadie más tenía. Yo era tal que ni siquiera fue idea mía organizar sesiones de formación, un cliente me pidió una primero. Así aprendí que a las empresas les gusta comprar formación.
De lo contrario, mi visión steampunk de la escritura resultó difícil de vender. Todo era demasiado abstracto. Lo que necesitaba era un panel: gráficos bonitos, con números reales, creados a partir de datos en vivo. Una tubería hizo el trabajo y contraté a un pequeño equipo para hacer los bonitos gráficos.
En el tablero, dos gráficos mostraban un desglose de los temas y el resto analizaba el estilo de escritura. Diré algunas palabras sobre esta elección.
Todos creen que lo que dicen importa. Si a los demás no les importa, es realmente un moral fracaso, de equilibrar el estilo sobre la sustancia. Casi como si el mal gusto fuera algo que sólo tienen los demás.
Los científicos contaron clics, siguieron ojos, monitorearon pergaminos y cronometraron la atención. Sabemos que a los lectores les toma una fracción de segundo decidir si algo es “para ellos”, y lo deciden comparando vagamente la nueva información con lo que ya les gusta. El estilo es un pase de entrada.
Lo que mostró el tablero
Antes, no había seguido los datos recopilados, pero ahora tenía todos estos bonitos gráficos. Y demostraron que tenía razón y que estaba muy, muy equivocado.
Al principio sólo tenía conocimiento directo de unas pocas empresas de inversión grandes y sospechaba que los flujos de sus competidores eran significativamente similares. Esto resultó ser correcto.
Pero también había asumido que las empresas un poco más pequeñas tendrían sólo un poco menos de producción. Esto simplemente no es cierto.
Se ha demostrado que el análisis de textos es útil si una empresa ya tenía capacidad de producción de escritura. De lo contrario, lo que necesitaban era una fábrica en funcionamiento. Había muy pocas empresas en la primera categoría, porque todas las demás se amontonaban en la segunda.
Epílogo
Como producto, el análisis de texto ha sido una mezcla. Ganó dinero, probablemente podría haber ganado más, pero era poco probable que se convirtiera en un éxito arrollador.
Además, había perdido el apetito por Neoyorquinos. En algún momento, todo giró demasiado hacia las fórmulas y la magia desapareció.
Las palabras están ahora en su gran era, con grandes modelos de lenguaje como ChatGPT. Al principio consideré aplicar canalizaciones para determinar si el texto se genera automáticamente, pero ¿de qué serviría eso?
En cambio, a finales de 2023, comencé a trabajar en una solución que ayude a las empresas a aumentar su capacidad de escribir para clientes expertos. Es una aventura completamente diferente, todavía en su infancia.
Al final, llegué a ver el análisis de texto como un par de gafas extra. A veces el desenfoque se vuelve nítido. Lo guardo en mi bolsillo, por si acaso.