Si algo caracteriza a los recientes avances tecnológicos es que los saltos son cada vez mayores y en menor cantidad de tiempo, es decir, son exponenciales. Aún no hemos terminado de asimilar por completo qué es posible realizar con ChatGPT, motorizada por su versión 3.5, que ya se ha lanzado GPT-4, y promete dejar a su predecesora, al menos desde las cifras, digamos que pequeñita.
“Aunque es menos capaz que los humanos en muchos escenarios del mundo real, GPT-4 exhibe un rendimiento a nivel humano en varios puntos de referencia profesionales y académicos”, de esta manera OpenAI presentó en sociedad la nueva versión de esta herramienta que permite a los chatbots comprender, resolver problemas y generar lenguajes de manera similar a la de una persona con una naturalidad impactante.
Una de las principales novedades que introduce es que se trata de un modelo multimodal, o sea que mientras que la versión anterior aceptaba entradas o indicaciones sólo de texto, la nueva permite también ingresar imágenes como referencia, por lo tanto, es capaz de extraer información y contexto a partir de esas imágenes.
Las salidas que emite, por el momento, son sólo en texto, pero no faltará mucho para que se integre con herramientas como Dall-E, tecnología desarrollada también por OpenAI, que hace el camino inverso, es decir, crea imágenes a partir de descripciones textuales, y ya hay quien se anima a vaticinar que las próximas generaciones de esta herramienta emitirán, además, música y videos.
OpenAI asegura que en interacciones simples con el chatbot la diferencia con su versión anterior no parece significativa, pero cuando la tarea es más compleja, GPT-4 es más estable, confiable, creativa y precisa.
Sus creadores también sostienen que posee un 82% menos de probabilidades de responder a solicitudes para contenido no permitido y un 40% más de dar respuestas verídicas que GPT-3.5. Esto se debe a que ha sido entrenada con un conjunto de datos diez veces más amplio, desde libros, artículos y páginas web hasta publicaciones en redes sociales y registros de chat, y además puede dar respuestas más actuales porque la versión anterior tenía información sólo hasta el año 2021.
Las alucinaciones, como se ha denominado a los errores en los que la herramienta “inventa” información, no desaparecieron pero desde OpenAI prometen que sucederán con menos frecuencia. Y también sostienen que la reducción del sesgo político en las respuestas es otra característica mejorada.
GPT-4 está disponible, de momento, solo en la versión de pago, llamada ChatGPT Plus, que tiene un costo de 20 dólares al mes. Hay también una opción para experimentar a través de una lista de espera. Luego, en la versión de prueba de ChatGPT, que es gratuita, está disponible la versión 3.5, para la que sólo es necesario registrarse.
Pero una forma rápida de acercarse y probar las características de esta tecnología es a través del buscador Bing, de Microsoft, que utiliza una versión personalizada de GPT-4 optimizada para buscadores. Existen dos opciones. La primera es a través del cuadro principal de búsqueda, y la segunda es desde la pestaña Chat, que aparece debajo del clásico buscador.
Un breve repaso de la base de ChatGPT
Para acercarnos de manera amigable a lo que estas herramientas representan, repasemos algunos conceptos de forma rápida. La inteligencia artificial es la técnica que permite a las máquinas imitar la inteligencia humana. Para hacerlo, la IA se basa en el aprendizaje automático, que es la capacidad que tienen los equipos de aprender tareas mediante la experiencia, es decir, mejora las habilidades que tenía previamente.
Siguiendo a Microsoft, el aprendizaje automático usa algoritmos para identificar patrones en los datos, y esos patrones luego se usan para crear un modelo de datos que puede hacer predicciones. Con más experiencia y datos, los resultados del aprendizaje automático son más precisos, de forma muy similar a cómo los humanos mejoramos con más práctica.
El aprendizaje profundo es un subconjunto del aprendizaje automático basado en redes neuronales artificiales. El proceso de aprendizaje se llama profundo porque la estructura de redes neuronales artificiales se compone de varias capas de entrada, salida y ocultas. Cada capa contiene unidades que transforman los datos de entrada en información que la capa siguiente puede usar para realizar una tarea de predicción determinada.
GPT-3, la versión de ChatGPT que se dio a conocer en noviembre pasado, tiene 8 capas y 175.000 millones de parámetros. En tanto, GPT-4 posee 12 capas y los parámetros utilizados para su entrenamiento ascienden a 100 billones.
En resumen, se abren múltiples posibilidades de respuestas y sus creadores afirman que sus funciones completas todavía no han sido descubiertas por los usuarios.