Créditos de imagen: NVIDIA
Probablemente no le sorprenda saber que la IA generativa es un tema candente en el mundo de la robótica. Hay una serie de ideas diferentes que circulan sobre las mejores formas de adoptar tecnologías emergentes, desde comandos de lenguaje natural hasta diseño. Le pregunté a Deepu Talla, vicepresidente y director general de Embedded & Edge Computing de Nvidia, sobre la IA generativa durante una visita reciente a la sede de la empresa en South Bay.
“Creo que eso habla de los resultados. Ya se nota la mejora en la productividad”, me dijo el ejecutivo. “Él puede escribirme un correo electrónico. Eso no es del todo cierto, pero no necesito empezar de cero. Eso me da el 70%. Hay algunas cosas obvias que ya puedes ver y que definitivamente están funcionando mejor que antes. Resumir algo no es perfecto. No voy a dejar que me lea y me resuma. Así pues, ya se pueden ver signos de mejora de la productividad.
Resulta que Nvidia estaba a solo unas semanas de anunciar sus novedades sobre el tema. El anuncio de ROSCon va acompañado de varias otras noticias relacionadas con sus diversas ofertas de robótica, incluida la disponibilidad general de las plataformas Nvidia Isaac ROS 2.0 y Nvidia Isaac Sim 2023.
Los sistemas están adoptando IA generativa, lo que debería ayudar a acelerar su adopción por parte de los robóticos. Después de todo, como señala Nvidia, unos 1,2 millones de desarrolladores han interactuado con las plataformas Nvidia AI y Jetson. Esto incluye algunos clientes de renombre como AWS, Cisco y John Deere.
Uno de los elementos más interesantes aquí es Generative AI Playground para Jetson, que brinda a los desarrolladores acceso a grandes modelos de lenguaje de código abierto. La empresa escribe:
NVIDIA Jetson Generative AI Playground brinda a los desarrolladores acceso a herramientas y tutoriales optimizados para implementar LLM de código abierto, modelos de transmisión para generar interactivamente imágenes asombrosas, modelos de lenguaje de visión (VLM) y Vision Transformers (ViT) que combinan la visión AI y el procesamiento del lenguaje natural para proporciona una comprensión integral de la escena.
La llegada de este tipo de modelo puede ayudar enormemente a los sistemas a determinar un curso de acción en circunstancias para las que aún no han sido entrenados (la simulación en sí solo llega hasta cierto punto). Después de todo, aunque lugares como almacenes y fábricas están más estructurados que, digamos, una carretera, todavía hay innumerables variables que gestionar. La idea es poder realizar ajustes sobre la marcha y proporcionar una interfaz de lenguaje más natural para los sistemas.
«La IA generativa acelerará significativamente los despliegues de IA en el borde con una mejor generalización, facilidad de uso y mayor precisión que antes», dijo Talla en un comunicado vinculado a las noticias de hoy. «Esta extensión de software más grande de nuestros marcos Metropolis e Isaac en Jetson, combinada con el poder de los modelos de transformadores y la IA generativa, aborda esta necesidad».
Las últimas versiones de las plataformas también traen mejoras en la percepción y simulación.
«Emprendedor. Aficionado incurable al twitter. Gamer. Aficionado apasionado de la cerveza. Practicante de la web. Estudiante típico».