Gemini, la plataforma de IA multimodal que supera a los humanos en comprensión multitarea

LinkedIn
Twitter
Facebook
WhatsApp
Email
Este último avance de Google redefine los límites al procesar texto, código, imágenes, audio y vídeo, superando a los humanos en comprensión masiva del lenguaje multitarea.

Google ha lanzado Gemini, su plataforma de inteligencia artificial (IA) multimodal que, asegura la empresa, supera a los humanos en comprensión masiva del lenguaje multitarea (MMLU). La versión Ultra de Gemini, que estará disponible a principios del próximo año, es considerada el “mayor y más capaz modelo de IA” de Google. Gemini puede procesar y generar texto, código, imágenes, audio y video desde diversas fuentes de datos, destacando por su capacidad para entender el mundo de manera similar a las personas y actuar como un colaborador útil.

Durante la presentación, Gemini demostró su capacidad para identificar formas geométricas, analizar problemas matemáticos y proponer soluciones, así como interpretar datos de imagen, texto y voz. Obtuvo una puntuación de más del 90% en la evaluación MMLU, superando a los expertos humanos en este estándar de la industria. Gemini también ha aprobado un examen de comprensión de tareas multimodales, mostrando habilidades de razonamiento deliberado.

La plataforma Gemini no es una aplicación en sí, sino una infraestructura que se integrará en servicios existentes de Google, como el chat Bard, el buscador y otros servicios en dispositivos Android y centros de datos a gran escala. Estará disponible en tres tamaños: Nano, Pro (disponible a partir del 13 de diciembre) y Ultra.

La empresa anunció que Gemini se incorporará al chat Bard en inglés para 180 países y se extenderá gradualmente a otros idiomas, con la inclusión en todas las aplicaciones compatibles. El proceso de implementación en Bard se realizará en dos fases, utilizando primero una versión de Pro y luego mejoras que culminarán con la adopción de la versión Ultra a principios del próximo año.

Google destaca la seguridad de Gemini, afirmando que ha superado evaluaciones exhaustivas y se somete a un examen continuo que incluye pruebas de estrés. Aunque reconocen que Gemini no es infalible y puede arrojar errores y alucinaciones, la compañía destaca los avances logrados y su compromiso con la seguridad y ética en el desarrollo de IA.

Gemini representa un avance significativo en la carrera por la inteligencia artificial, ofreciendo una plataforma multimodal capaz de comprender y generar información desde diversas fuentes de datos. Su capacidad para superar a los humanos en comprensión multitarea y su integración en servicios existentes sugieren un impacto significativo en aplicaciones prácticas y desarrollo de software, posicionándolo como un modelo destacado en la industria de la IA.

LinkedIn
Twitter
Facebook
WhatsApp
Email

Noticias relacionadas

Translate »