Imagine que a Ud. le piden completar la siguiente frase: “Juanito compró un..”, a lo que probablemente contestará “huevito”. Ahora pregúntese ¿Por qué contestó eso? Seguramente dirá, “por experiencia”, “porque lo he escuchado muchas veces”, “porque me lo han enseñado así”, etc. Con la misma lógica, Ud. podría no sólo completar una palabra sino una frase faltante: “..huevito porque se lo encargó su mamá”. Por tanto, aunque Ud. no se dé cuenta y lo haga casi conscientemente, su tarea de análisis de lenguaje se convierte implícitamente en un problema: a partir de una secuencia de palabras (frase principal) cómo Ud. puede predecir (o adivinar) otra secuencia de palabras (frase completada). Esto es posible gracias a que Ud. ha aprendido con los años no sólo a comprender la lengua sino también a producirla, sin cuestionarse mucho los cómo y los por qué.
Ahora imagine que recientemente ha llegado una raza de extraterrestres (ET) a Chile que son super amistosos y Ud. ha sido elegido para comunicarse con ellos. Ellos pueden aprender rápidamente y poseen una gran capacidad de memoria, pero lamentablemente no saben español. Ud. podría enseñarle las reglas gramaticales y formas de interpretar significados de oraciones en español. Sin embargo, al poco andar desistiría de dicha alternativa pues la cantidad de combinaciones y variaciones en el lenguaje son tales que sería casi imposible cubrir toda la lengua. Dado que Ud. sabe que estos ETs pueden aprender rápido, otra alternativa es entregarles contenido escrito por humanos (ej. Wikipedia, libros) y que ellos lo digieran, y lo lean, de modo que puedan aprender la forma en que se asocian las palabras y sus contextos. Ud. se podrá dar cuenta de que aunque esto es un enfoque más efectivo, los ETs no comprenden las frases que están recibiendo o produciendo, pero le darán la impresión de que se están comunicándose con Ud., aunque en realidad están repitiendo y “adivinando” palabras o frases como loros, según la cercanía con lo aprendido.
Si la tarea realizada por los ETs ahora la queremos llevar a un computador, necesitaríamos dotarlo de capacidades de aprendizaje que le permitan adquirir patrones de uso de la lengua a partir de textos o contenido generado por humano. Luego, la máquina tendrá la habilidad para predecir (o completar) secuencias de palabras dadas otras secuencias. Esto de alguna forma más simple es lo que Ud. puede ya haber utilizado cuando escribe mensajes en su celular y el sistema le auto-completa el texto.
Recientemente, se generó todo un revuelo a nivel internacional pues la empresa OpenAI de Seattle, USA, liberó e hizo accesible a todo el mundo, una de sus últimas tecnologías: un modelo de lenguaje que utiliza técnicas de Inteligencia Artificial (IA), llamado ChatGPT. Este posee la capacidad de interactuar (chat) con personas y responder preguntas, a partir de lo aprendido desde muchas fuentes de contenido escrito por humanos. Esto lo hace utilizando técnicas avanzadas de Inteligencia Artificial llamadas redes neuronales profundas, que en simple permiten aprender a modelar secuencias de palabras para convertirlas en otras secuencias. A estas alturas, quizás Ud. se está preguntando: “¿Cómo un simple auto-completador puede generar tal impacto?. Aquí viene lo interesante y recuerde el problema inicial: predecir secuencias de palabras a partir de otras secuencias de palabras. Pues bien, ahora esto puede ser mucho más potente si se considera las siguientes posibilidades de lo que puede ser una secuencia de entrada y una secuencia de salida (predicción):
Entrada: pregunta sobre algún tema, Salida: respuesta construida
Entrada: descripción de problema a resolver, Salida: programa computacional que lo resuelve
Entrada: algún tópico de discusión, Salida: un ensayo generado automáticamente a partir de dicho tópico.
Entrada: descripción de algún problema, Salida: posible solución de ese problema
Entrada: descripción de una frase, Salida: completación de lo frase
Este tipo de funcionalidades es la que permite ChatGPT y en principio, podrían ser todas beneficiosas para muchos sectores productivos. De ahí que sus aplicaciones proyectadas y su impacto podrían ser variadas: generar automáticamente ensayos para estudiantes de colegio, producir campañas de marketing, mejorar la productividad en el desarrollo de software, agilizar la resolución de casos legales, diagnóstico preliminar de algunas patologías médicas, etc. Sin embargo, este tipo de tecnología puede conllevar algunos inconvenientes pues el contenido generado no sólo es a veces indistingibles de lo escrito por humanos, sino que nada de lo que la herramienta produce está validado ni fundamentado con fuentes reales. Si es que esto no se controla adecuadamente puede ser un potencial productor de hechos falsos, y ya han surgido muchos casos en que a veces sin darse cuenta, la gente no se percata que está frente a información inventada. Para muestra un botón: un buen amigo, utilizó ChatGPT ayer y le preguntó que “¿Quién era John Atkinson que trabaja en Inteligencia Artificial?”. La respuesta de un par de párrafos producida por ChatGPT, aunque bien hilada, fue completamente falsa y genérica en cada una de las palabras. En otros casos, mucha gente realiza preguntas, la herramienta contesta bien, pero la persona le indica que está incorrecta (bromeando), a lo que el sistema le obedece y comienza a inventar una respuesta inconsistente, claramente las ventajas y desventajas están a la vista.
Debido al uso de chatGPT y sus limitantes, ya han surgido variadas polémicas. Una de ellas tiene que ver con la prohibición de ciertos estados de USA de que los niños la utilicen en los colegios para escribir ensayos pues podría mermar sus capacidades de análisis y resolución de problemas. Por otro lado, ya han surgido potenciales aplicaciones en el ámbito de resolución de casos legales como también la evaluación de exámenes como estudiante de medicina, por parte de ChatGPT, para mostrar su conocimiento general.
Claramente, como nueva tecnología ChatGPT tiene mucho espacio de mejora y abre nuevas áreas de trabajo. Sin embargo, poniéndolo las cosas en perspectiva se debe aclarar que ChatGPT no es el único en su tipo, y es sólo la que ha recibido más exposición mediática, algo muy propio de tecnologías y empresas en que ha invertido el empresario Elon Musk. Tiempo atrás Google ya había hecho lo suyo con el modelo LaMDA, además de varias otras herramientas que permiten interactuar para generar código a partir de la especificación del problema. Así, ChatGPT es una de tantas tecnologías disponibles.
Por otro lado, ya comienzan a surgir variados mitos y fake news alrededor de ChatGPT que en realidad es parte de la imaginación o interpretación de las mismas personas. Algunos de los más populares han incluido:
“ChatGPT reemplará a Google”: la herramienta es un sistema de predicción de secuencias y no un motor de búsqueda como Google, por lo que su funcionalidad es muy diferente. Naturalmente, es algo complementario a un motor de búsqueda y es exactamente la razón por la que recientemente Microsoft adquirió parte de OpenAI para disponer de ChatGPT en algunos de sus productos, incluidos el buscador Bing.
“ChatGPT está comprendiendo lo que se le escribe”: esto no es verdadero pues ChatGPT es sólo un loro que predice y contesta en base a las mejores predicciones que encuentra desde lo aprendido. Más aún, ni siquiera entiende aspectos gramaticales básicos: haga una prueba, realice una pregunta y obtenga la respuesta, luego desordene las palabras de la misma pregunta y vea la respuesta, será la misma!.
“ChatGPT está siendo consciente de lo que le estoy explicando”: esto es totalmente falso y ya paso con el sistema equivalente de Google, donde uno de sus ingenieros “pensó” que al dialogar con la máquina, está se había hecho consciente. Nuevamente, la máquina es simplemente un loro predictor, que repite lo que aprendió.
“ChatGPT reemplazará a los programadores humanos”: esto no es verdadero pues lo que es hace esta y otras herramientas de generación de código es simplemente apoyar tareas de programación, incrementando productividad, pero en funcionalidades específicas, que incluso aún deben ser validadas por los humanos.
Existe un futuro promisorio para ChatGPT y tecnologías similares. Sin embargo, es importante que las personas pongan las cosas en perspectiva, se informen y no crean ciegamente lo que aparece en los medios. Sólo cabe recordar que hasta medios internacionales publicitaron la supuesta interacción de la tecnología de Google con uno de sus ingenieros que encontró que la máquina era consciente, algo que fue claramente una fake news. Además, es importante destacar que siempre que aparecen ciertas tecnologías importantes que podrían generar algunas dificultades en ciertos ámbitos, aparece la contra-tecnología que aborda algunos de esos problemas. Recientemente, ya se difundió una nueva tecnología que es capaz de distinguir si el contenido de algo es generado por un sistema de IA o por humanos