
Durante el verano, lo invitamos a encontrar artículos distribuidos este año en el sitio. Hoy un artículo publicado originalmente el 16/01/2023.
La lanzamiento de ChatGPT el 30 de noviembre marcó una nueva etapa en el desarrollo de las tecnologías de procesamiento del lenguaje. En cualquier caso, es la primera vez que un sistema de IA, resultado directo de la investigación, suscita tanto entusiasmo: han aparecido numerosos artículos en la prensa especializada pero también general. ChatGPT (o OpenAI, la compañía que desarrolla ChatGPT, o ambos) son tendencias constantes en Twitter incluso hoy.
¿Por qué tal eco? ¿Son las capacidades de ChatGPT una desviación de las tecnologías anteriores capaces de generar texto?
ChatGPT puede chatear
Claramente, ChatGPT ha permitido un salto cualitativo: es capaz de responder, de forma a menudo relevante, a casi cualquier consulta en lenguaje natural. GPT2, luego GPT3, los modelos de lenguaje anteriores desarrollados por OpenAI, ya eran muy buenos para generar texto a partir de unas pocas palabras o frases dadas como indicaciones (lo que se llama "indicación"): a menudo hablamos de "loros" (loros estocásticos), como se propuso emily dobladora, y muchos otros investigadores opiniones de estas técnicas. De hecho, se podría decir que estos sistemas producían texto a partir de fragmentos de oraciones extraídas de los inmensos corpus a su disposición... incluso si esta imagen del loro debe matizarse: los sistemas no repiten extractos palabra por palabra, sino que producen en general un texto original recogiendo, parafraseando, combinando elementos vistos en varios corpus.
ChatGPT toma estas características, pero la parte de "chat" (diálogo) le agrega una dimensión completamente diferente y, a menudo, parece sorprendente.
El sistema ya no produce solo un párrafo a partir de una oración dada como entrada. Ahora es capaz de responder preguntas simples y complejas correctamente, puede proporcionar elementos de razonamiento, hablar diferentes idiomas, analizar o producir código de computadora, entre otras cosas.
Por ejemplo, si se pregunta si dos personajes pudieron encontrarse, el sistema es capaz de determinar las fechas correspondientes a su existencia, comparar estas fechas y deducir una respuesta. Esto es trivial para un ser humano, pero ningún sistema hasta ahora podría responder a este tipo de preguntas con tanta precisión sin ser altamente especializado. Más allá del idioma, ChatGPT también puede proporcionar elementos del razonamiento matematico (pero a menudo se equivoca) Y analizar código de computadora principalmente.
Desde este punto de vista, ChatGPT está un paso por delante de sus competidores.
ChatGPT, un sistema cerrado
Respecto al funcionamiento del sistema, difícil decir más, porque OpenAI, a pesar de su nombre, desarrolla sistemas cerrados. Es decir, el código informático (código fuente) utilizado no está disponible y la investigación relacionada con ChatGPT sigue siendo por el momento en gran medida un secreto comercial, aunque, obviamente, deotros equipos están trabajando en sistemas similares, también basado en el aprendizaje profundo. Entonces tenemos una idea de lo que usa OpenAI.
Otras empresas han mantenido un modelo más abierto, por ejemplo Meta con el trabajo realizado en FAIR, generalmente abiertos y publicados en las principales conferencias en el campo. Pero, de manera más general, estamos viendo cada vez más un cierre de la investigación. Por ejemplo, aunque Apple siempre ha tenido un modelo de desarrollo privado y muy secreto, Deepmind tenía un modelo abierto y probablemente lo sea un poco menos, ahora que la empresa está bajo el control de Google.
El sistema ChatGPT en sí mismo podría volverse comercial: OpenAI está financiado por Microsoft quien podría decidir cerrar el acceso al sistema un día cercano, si es de su interés.
Al probar ChatGPT, contribuyes (gratis) a mejorarlo
Mientras tanto, OpenAI se beneficia de la enorme publicidad que le brinda su herramienta, y también de todas las interacciones de los usuarios con ella. Si un usuario informa que una respuesta no es buena, o solicita a la herramienta que reformule su respuesta teniendo en cuenta un elemento adicional, esta es toda la información que el sistema almacena y puede reutilizar para refinar su respuesta la próxima vez, a la solicitud solicitada. o en una solicitud similar. Al probar ChatGPT, trabajamos gratis para OpenAI !
Volviendo al sistema en sí, la parte del diálogo es, por lo tanto, lo que hace la fuerza y la particularidad de ChatGPT (en comparación con GPT3, por ejemplo). Ya no es un modelo de lenguaje "simple" capaz de generar texto "por kilómetro", sino un verdadero sistema de diálogo. Este probablemente se ha beneficiado de millones o miles de millones de ejemplos. evaluado por humanos, y la fase actual, donde cientos de miles de usuarios “juegan” casi gratis con el sistema, todavía permite mejorarlo continuamente, ya que todas las interacciones obviamente se registran y se utilizan para esto.
Ahora es bastante sencillo acceder a corpus de miles de millones de palabras para desarrollar un modelo de lenguaje tipo "GPT", al menos para idiomas que están muy extendidos en Internet.
Pero los datos que permitieron el desarrollo de ChatGPT (diálogos, interacciones con humanos) no son públicos, y esto es lo que le da a OpenAI una ventaja significativa sobre la competencia.
Por ejemplo, Google tiene datos diferentes, pero sin duda también utilizables para este tipo de sistema, especialmente porque Google ha estado desarrollando durante varios años un gráfico de conocimiento que podría generar respuestas con mayor confiabilidad que ChatGPT. En concreto, el análisis de las secuencias de consultas del buscador de Google podría aportar información valiosa para orientar la interacción con el usuario... Pero, mientras tanto, es OpenAI quien tiene ChatGPT, y no Google: OpenAi tiene la ventaja.
Más allá de ChatGPT, ¿qué aplicaciones habrá en el futuro?
De hecho, aunque es posible omitir los límites de ChatGPT, el sistema se niega a explicar cómo crear una bomba, producir cuentos eróticos o transmitirle sentimientos (ChatGPT responde con frecuencia que es una máquina, queno tiene sentimientos ni personalidad). OpenAI obviamente se ha ocupado de su comunicación. La compañía también ha puesto mucho cuidado en “blindar” el sistema, para permitirle frustrar la mayoría de las trampas que pueden arruinar este tipo de aplicaciones en unas pocas horas, como suele suceder con los sistemas abiertos al público en general.
Podemos citar, por ejemplo, a Meta, que el pasado mes de noviembre tuvo que retira su sistema llamado “Galactica” dos días después de ponerlo en línea. Galactica había sido formada en el campo científico y diseñada para ofrecer servicios a los investigadores. Fue presentado por primera vez como capaz de escribir artículos científicos automáticamente desde un indicador…antes de que la empresa aclarara que obviamente era solo una ayuda editorial. Pero esta desafortunada estrategia de comunicación desató una polémica que obligó a Meta a desconectar rápidamente a Galactica.
Por el contrario, ChatGPT todavía está en línea y todavía despierta tanta pasión entre una gran audiencia. Sin embargo, quedan preguntas: ¿qué impacto tendrá ChatGPT? ¿Qué aplicaciones se derivarán de ella? ¿Y a qué modelo económico apunta la empresa OpenAI (y Microsoft, su principal inversor)?
Thierry poibeau, DR CNRS, École normale supérieure (ENS) - PSL
Este artículo ha sido publicado de nuevo. La conversación bajo licencia Creative Commons. Lee elarticulo original.