Revista Opinión

Google i/o 2024: recap y principales novedades

Publicado el 15 mayo 2024 por Albertofernandezdiaz @albertofdezxbcn

Google I/O: Recap y principales novedades de Google para este año

google io 2024 recap y principales novedades

Este martes 14 de mayo se celebró la conferencia anual de Google para desarrolladores: Google I/O 2024. En esta conferencia, la compañía anuncia las principales que han lanzado o lanzarán en sus aplicaciones, desde la búsqueda de Google, hasta Gmail o Google fotos.

IA Generativa

Como no podía ser de otra forma, la IA Generativa fue el tema estrella de la conferencia de Google I/O 2024. Entre las principales novedades relacionadas con la IA Generativa que el gigante tecnológico anunció, destaca:

Nueva versión disponible de la IA Generativa de Google: Gemini 1.5 Flash y 1.5 Pro

Google anunció Gemini 1.5 Flash y 1.5 Pro, la nueva versión de Gemini, su modelo de IA Generativa, una nueva versión que indican que es más rápida y eficiente y que está disponible en más de 35 idiomas. Tanto 1.5 Pro como 1.5 Flash están disponibles en vista pública con una ventana de contexto de un millón de tokens en Vertex AI y en AI Studio – actualmente, mucho más grande que cualquier otra a día de hoy.  

google io 2024 gemini

Además, también anunciaron que están integrando esta versión de 1.5 Pro en los productos de Google, incluidos Gemini Advanced y las aplicaciones Workspace

google io 2024 workspace

Concretamente, con este nuevo modelo indican que Gemini Advanced podrá ayudar en tareas como:

  • Como analista de datos: revelando tendencias y creando visualizaciones personalizadas sobre la marcha a partir de los archivos de datos que hayas subido, como hojas de cálculo.
  • Interpretando imágenes: Gemini es multimodal de forma nativa, y el modelo 1.5 Pro aporta grandes mejoras en la comprensión de imágenes. Por ejemplo, puedes hacer una foto a un plato de tu restaurante favorito y pedir la receta, o hacer una captura de un problema matemático y obtener instrucciones paso a paso para resolverlo. Todo ello a partir de una sola imagen.

Google presenta PaliGemma y Gemma 2 

Gemma son un conjunto de modelos abiertos de inteligencia artificial (IA) ligeros y generativos. Los modelos de Gemma están disponibles para ejecutarse en aplicaciones y en el hardware, en dispositivos móviles o en servicios alojados. Los usuarios pueden usar modelos de Gemma para casos de uso de generación de código, peró también para otras funcionalidades, como para mejorar el rendimiento en tareas específicas. En conclusión, el objetivo de un modelo de Gemma ajustado, según Google, tiene el objetivo de poder ayudar a qué soluciones de IA generativa sean más orientadas y eficientes.

En Google I/O 2024, Google presentó la última versión de Gemma, con Gemma 2, y una expansión con PaliGemma. 

PaliGemma es un modelo optimizado para la interpretación de imágenes. Concretamente, está diseñado para ofrecer un rendimiento de precisión para tareas de visión-lenguaje. Esto incluye funcionalidades como el subtitulado de imágenes y vídeos cortos, la respuesta a preguntas visuales, la comprensión de texto en imágenes o la detección y segmentación de objetos.

google io 2024 gemma

Google incluirá una marca de agua a sus imágenes generadas con IA

Google anunció que abriría el código de SynthID, su herramienta de marca de agua capaz de determinar si una imágen ha sido generada por inteligencia artificial.

Más allá de la IA Generativa

Aunque las novedades en IA Generativa fueron los temas estrellas de Google I/O 2024, la compañía también presentó otras novedades destacadas.

Sería el caso de de las novedades en desarrollo móvil y Android, donde Google anunció que ha potenciado las experiencias de desarrollo móvil para Android mediante APIs avanzadas, herramientas y guías que mejoran la productividad de los desarrolladores, destacando que, próximamente, Gemini en Android Studio soportará entradas multimodales usando Gemini 1.5 Pro, lo que promete revolucionar aún más el desarrollo en Android.

Finalmente, Google también introdujo Project IDX en beta abierta para ofrecer una experiencia de desarrollo simplificada en aplicaciones full-stack y multiplataforma, integrando herramientas como Chrome DevTools y Cloud Run. Además, Firebase ha evolucionado para soportar aplicaciones modernas impulsadas por IA, permitiendo conectar con bases de datos PostgreSQL y facilitando despliegues seguros y escalables desde GitHub. También se han mejorado las herramientas de Flutter y Dart para ofrecer un rendimiento gráfico y de aplicaciones notablemente superior, junto con nuevas funcionalidades experimentales para optimizar la experiencia de desarrollo en Dart.


Volver a la Portada de Logo Paperblog

Revistas