La “inteligencia ambiental” acelerará los avances de la Inteligencia Artificial (IA) general
El Vicepresidente Senior y científico de Alexa, Rohit Prasad, habla de cómo, la ciencia obsesionada por el cliente (haciendo referencia a la filosofía de Amazon) está acelerando la inteligencia general.
Nueva York – A medida que el mundo se ha ido conectando cada vez más y que la informática se ha extendido por nuestro entorno, surge un nuevo paradigma de la IA: la inteligencia ambiental. En este paradigma, nuestro entorno responde a nuestras peticiones y se anticipa a nuestras necesidades, proporciona información o sugiere acciones, y luego pasa a un segundo plano.
Esta visión de la inteligencia ambiental no es tan diferente a la de Star Trek. Pero durante la mayor parte de la última década, el enfoque se ha centrado en la asistencia reactiva, que implica, por ejemplo, garantizar que las peticiones a Alexa, iniciadas por el cliente, cumplan sus expectativas.
En la visión de la inteligencia ambiental, un servicio de IA como Alexa, tiene en cuenta el estado de tu entorno, incluyendo los dispositivos, sensores, objetos, personas y actividad a tu alrededor, para ayudarte en cualquier situación en la que necesites asistencia, ya sea de forma reactiva (iniciada por el cliente) o proactiva (iniciada por la IA).
Para explotar el máximo potencial de la inteligencia ambiental, Alexa debe reunir lo mejor de las capacidades de la inteligencia de las máquinas con lo mejor de las capacidades de la inteligencia humana, lo cual es el barómetro de la inteligencia general actual.
La definición más pragmática de la inteligencia general es la capacidad de (1) aprender múltiples tareas de forma conjunta, en lugar de modelar cada tarea de forma independiente; (2) adaptarse continuamente a los cambios dentro de un conjunto de tareas conocidas, sin supervisión humana explícita; y (3) aprender nuevas tareas directamente al interactuar con los usuarios finales.
Mientras que estas características de inteligencia general se aplican a todos los tipos de sistemas de IA, para los servicios de IA interactivos como Alexa, hay dos atributos más que son fundamentales: (1) inteligencia multisensorial y multimodal, que es la capacidad de procesar datos procedentes de múltiples sensores de entrada (por ejemplo, micrófonos, cámaras, ultrasonido), fusionar los datos de los sensores para mejorar la comprensión de los objetivos del cliente y generar resultados en diferentes modalidades (por ejemplo, voz, texto, imagen, video); y (2) habilidades de interacción, que es la capacidad de conversar de manera similar a la humana y abarca no solo el dominio del lenguaje natural, sino también la capacidad de reconocer y responder al afecto.
Más competente: las funciones y skills de Alexa se ampliarán mucho más rápido gracias a la inteligencia multitarea. Además, Alexa mejorará a través del autoaprendizaje, siendo menos dependiente de los datos identificados. Alexa recibe miles de millones de peticiones al mes, y es fundamental que responda a cada una de ellas de forma satisfactoria para los clientes. A través de los avances en grandes modelos de lenguaje preentrenado, estamos facilitando la expansión de la funcionalidad de Alexa en términos de habilidades e idiomas. Específicamente, hemos entrenado un “Modelo de maestro de Alexa”, un modelo grande, preentrenado y multilingüe con miles de millones de parámetros que codifica el idioma, así como patrones destacados de interacciones con Alexa.
Más natural y conversacional: las interacciones de Alexa serán tan fluidas como las humanas a través de la inteligencia multisensorial, los modelos de lenguaje generalizables, el razonamiento de sentido común y el modelado de afectos
Mayor personalización: Alexa se adaptará a cada individuo utilizando el habla y la visión por computadora Además, los clientes podrán personalizar directamente a Alexa de forma explícita e implícita. Con la enseñanza de preferencias, los clientes pueden enseñar explícitamente a Alexa qué skills deben contestar las preguntas relacionadas con: el clima o los equipos deportivos que siguen. Con la detección de eventos de sonido predeterminados, los clientes pueden entrenar a Alexa para que reconozca nuevos sonidos – como el timbre de la puerta – entre algunos otros ejemplos.
El camino por delante
Reconozco que hay múltiples caminos hacia la IA general, cada uno con años de investigación fundamental por delante. Creo que Alexa y su visión subyacente de la inteligencia ambiental ofrecen un camino pragmático hacia la IA general, en el que cada avance hace que Alexa sea más útil para nuestros clientes en su vida diaria.
Me asombra el ritmo de invención del equipo de Alexa en las circunstancias más difíciles. Ahora que llegamos al segundo año de la pandemia de COVID, espero que los avances que la comunidad mundial de investigadores de IA está haciendo en todas las disciplinas de la IA, nos ayuden a prevenir futuras pandemias.