Tecnología

|

Suscriptores

Los robots aprenden, los chatbots visualizan: cómo se vislumbra el avance en materia de IA en 2024

La inteligencia artificial avanza a un ritmo vertiginoso, haciéndose más poderosa y extendiéndose al mundo físico. 

Los robots aprenden, los chatbots visualizan: cómo 2024 será un ‘gran avance’ en materia de IA

La inteligencia artificial avanzará a un ritmo rápido, volviéndose más poderosa y extendiéndose al mundo físico. (Foto Prensa Libre: Victor Arce/The New York Times)

En un evento celebrado en San Francisco en noviembre, le preguntaron a Sam Altman, director ejecutivo de la empresa de inteligencia artificial OpenAI, qué sorpresas depararía este campo en 2024.

Los chatbots en línea como ChatGPT de OpenAI tendrán “un avance que nadie esperaba”, respondió de inmediato Altman.

Sentado a su lado, James Manyika, un ejecutivo de Google, asintió y dijo: “Estoy de acuerdo”.

El sector de la IA de este año se va a definir por una característica principal: una mejora extraordinariamente rápida de la tecnología a medida que los avances se acumulen unos sobre otros, permitiendo a la IA generar nuevos tipos de medios, imitar el razonamiento humano de nuevas maneras y filtrarse en el mundo físico a través de un nuevo tipo de robots.

En los próximos meses, los generadores de imágenes basados en IA, como DALL-E y Midjourney, ofrecerán al instante videos e imágenes fijas. Y se fusionarán gradualmente con chatbots como ChatGPT.

Esto significa que los chatbots irán mucho más allá del texto digital, ahora manejarán fotos, videos, diagramas, gráficos y otros medios. Su comportamiento se parecerá cada vez más al razonamiento humano y realizarán tareas cada vez más complejas en campos como las matemáticas y la ciencia. A medida que la tecnología avance hacia los robots, también ayudará a resolver problemas más allá del mundo digital.

Muchos de estos avances ya han empezado a surgir en los principales laboratorios de investigación y en productos tecnológicos. Pero en 2024, la potencia de estos productos comienza a crecer de manera significativa y es utilizada por mucha más gente.

“El rápido progreso de la IA continuará”, afirmó David Luan, director ejecutivo de Adept, una empresa emergente de IA. “Es inevitable”.

OpenAI, Google y otras empresas tecnológicas están haciendo avanzar la IA mucho más rápido que otras tecnologías debido al modo en que se construyen los sistemas subyacentes.

La mayoría de las aplicaciones de software son creadas por ingenieros, una línea de código informático a la vez, un proceso que suele ser lento y tedioso. Las empresas están mejorando la IA más rápidamente porque la tecnología se basa en redes neuronales, sistemas matemáticos que pueden aprender habilidades analizando datos digitales. Al detectar patrones en datos como artículos de Wikipedia, libros y textos digitales extraídos de internet, una red neuronal puede aprender a generar texto por sí sola.

A continuación, una guía de cómo va cambiando la IA este año, empezando por los avances a más corto plazo, que conducirán a nuevos progresos en sus capacidades.

Videos instantáneos

Hasta ahora, las aplicaciones basadas en IA generaban sobre todo texto e imágenes fijas en respuesta a instrucciones. Por ejemplo, DALL-E puede crear imágenes fotorrealistas en cuestión de segundos a partir de peticiones como “un rinoceronte zambulléndose en el puente Golden Gate”.

Pero es probable que este año empresas como OpenAI, Google, Meta y Runway, con sede en Nueva York, desplieguen generadores de imágenes que permitan también crear videos. Estas empresas ya han creado prototipos de herramientas capaces de elaborar videos al instante a partir de breves instrucciones de texto.

Es probable que las empresas tecnológicas incorporen los poderes de los generadores de imágenes y videos a los chatbots, haciéndolos más potentes.

Chatbots multimodales

Los chatbots y los generadores de imágenes, desarrollados en un principio como herramientas separadas, se están fusionando gradualmente. El año pasado, cuando OpenAI presentó una nueva versión de ChatGPT, el chatbot podía generar imágenes además de texto.

Las empresas de IA están creando sistemas multimodales, lo que significa que la IA puede manejar varios tipos de elementos multimedia. Estos sistemas adquieren destrezas analizando fotos, textos y, potencialmente, otros tipos de medios, como diagramas, gráficos, sonidos y videos, para luego poder producir sus propios textos, imágenes y sonidos.

Pero eso no es todo. Como los sistemas también aprenden las relaciones entre distintos tipos de medios, serán capaces de entender un tipo de medio y responder con otro. En otras palabras, alguien puede introducir una imagen en el chatbot y este responderá con texto.

Mejor razonamiento

Cuando Altman habla de que la IA está avanzando, se refiere a los chatbots que son mejores “razonando” por lo que pueden asumir tareas más complejas, como resolver problemas matemáticos complicados y generar programas informáticos detallados.

El objetivo es construir sistemas capaces de resolver un problema de manera lógica y minuciosa mediante una serie de pasos discretos, cada uno de ellos basado en el siguiente. Así es como razonan los humanos, al menos en algunos casos.

Los principales científicos discrepan sobre si los chatbots pueden razonar realmente así. Algunos sostienen que estos sistemas solo parecen razonar cuando repiten comportamientos que han visto en los datos de internet. Pero OpenAI y otros están construyendo sistemas que pueden responder de un modo más fiable a preguntas complejas relacionadas con materias como las matemáticas, la programación informática, la física y otras ciencias.

“A medida que los sistemas sean más fiables, se harán más populares”, afirmó Nick Frosst, antiguo investigador de Google que dirige Cohere, una empresa de IA.

Si los chatbots razonan mejor, podrán convertirse en “agentes de IA”.

Agentes de IA

A medida que las empresas enseñan a los sistemas de IA a resolver problemas complejos paso a paso, también pueden mejorar la capacidad de los chatbots para utilizar aplicaciones de software y sitios web en su nombre.

Los investigadores están transformando los chatbots en un nuevo tipo de sistema autónomo llamado agente de IA. Esto significa que los chatbots pueden utilizar aplicaciones de software, sitios web y otras herramientas en línea, como hojas de cálculo, calendarios en línea y sitios de viajes. De este modo, las personas podrían delegar a los chatbots el tedioso trabajo de oficina. Pero estos agentes también podrían quitar puestos de trabajo por completo.

Los chatbots ya actúan como agentes a pequeña escala. Pueden programar reuniones, editar archivos, analizar datos y elaborar gráficos de barras. Pero estas herramientas no siempre funcionan tan bien como deberían. Los agentes se descomponen por completo cuando se aplican a tareas más complejas.

Este año, las empresas de IA están preparadas para presentar agentes más fiables. “Deberías poder delegar en un agente cualquier trabajo informático tedioso del día a día”, afirmó Luan.

Esto podría incluir el seguimiento de los gastos en una aplicación como QuickBooks o el registro de los días de vacaciones en una aplicación como Workday. A largo plazo, se extenderá más allá del software y los servicios de internet y se adentrará en el mundo de la robótica.

Robots más inteligentes

En el pasado, los robots se programaban para realizar la misma tarea una y otra vez, como recoger cajas que siempre tienen el mismo tamaño y forma. Pero con el mismo tipo de tecnología en la que se basan los chatbots, los investigadores están dotando a los robots de la capacidad de realizar tareas más complejas, incluidas las que nunca antes habían visto.

Del mismo modo que los chatbots pueden aprender a predecir la siguiente palabra de una frase analizando grandes cantidades de texto digital, un robot puede aprender a predecir lo que ocurrirá en el mundo físico analizando innumerables videos de objetos que se pinchan, levantan y mueven.

Este año, la IA potenciará a los robots que operan entre bastidores, como los brazos mecánicos que doblan camisas en una lavandería o clasifican pilas de cosas en un almacén. Titanes de la tecnología como Elon Musk también trabajan para introducir robots humanoides en los hogares.

ESCRITO POR: