¿Qué características esperamos de Gemini y Google AI?

¿Qué características esperamos de Gemini y Google AI?

Durante el año pasado, Google introdujo una serie de funciones de inteligencia artificial de la marca Gemini y otras en sus aplicaciones para consumidores. Aquí está todo lo que se ha anunciado y cuándo podrían estar disponibles.

Píxeles

Al final de la conferencia Made by Google 2023, se anunció para el Pixel 8 Pro una función Zoom Enhance que «rellena de forma inteligente los espacios entre píxeles y predice los detalles más finos». Basándose en un “modelo de imagen generativo personalizado impulsado por IA” integrado en el dispositivo, Google promocionó la función como útil cuando se olvida hacer zoom.

Esta es una increíble aplicación de IA generativa, que abre una gama de posibilidades para encuadrar y editar tus imágenes. Entonces, el tipo de mejora de zoom que estás acostumbrado a ver en la ciencia ficción está justo en el teléfono que tienes en tus manos.

En octubre, Google dijo que «vendría más tarde». Después de tres lanzamientos de funciones de píxeles, aún no ha llegado. No está claro si el modelo al que se refiere Google es Gemini Nano con multimodalidad. En este punto, también podría debutar con el Pixel 9 Pro como la función fotográfica insignia de ese teléfono.

Página principal de Google

En la aplicación Google Home, se utilizará IA generativa para resumir los eventos en una «vista simplificada de lo que sucedió recientemente». Este “resumen rápido y sencillo” utilizará viñetas, mientras que también puede “hacer preguntas sobre su hogar” a través del chat para buscar clips del historial de video y obtener automatizaciones. Las “funciones experimentales” estarán disponibles para los suscriptores de Nest Aware en 2024.

Fitbit

Fitbit Labs permitirá a los usuarios de Fitbit Premium probar y proporcionar comentarios sobre las capacidades experimentales de IA.

Una de esas características es un chatbot que te permite hacer preguntas sobre tus datos de Fitbit de forma natural y conversacional. Este “entrenamiento personalizado” que tiene en cuenta los objetivos de acondicionamiento físico tiene como objetivo generar “mensajes y consejos prácticos”, con respuestas que pueden incluir gráficos personalizados.

  • “Por ejemplo, puedes profundizar en cuántos minutos de zona activa (AZM) tienes y cómo se correlaciona con qué tan reparador es tu sueño. »
  • “…este modelo puede analizar variaciones en los patrones y la calidad del sueño y luego sugerir recomendaciones sobre cómo cambiar la intensidad de su entrenamiento en función de esta información. »

Detrás de escena, esto está impulsado por un nuevo LLM de salud personal de Fitbit y Google Research basado en Gemini. A partir de marzo llegará «a finales de este año» para un «número limitado de usuarios de Android inscritos en el programa Fitbit Labs en la aplicación móvil de Fitbit».

Fotos de Google

Ask Photos te permite hacer preguntas sobre imágenes y videos en tu biblioteca. Además de buscar imágenes, la aplicación puede extraer información y brindarle una respuesta de texto. Con Gemini, las consultas incluyen «Muéstrame la mejor foto de cada parque nacional que he visitado» y «¿Qué temas elegimos para la fiesta de cumpleaños de Lena?» » Se puede utilizar para “sugerir mejores fotos” y crear títulos para ellas. Ask Photos es una «función experimental» que se implementará pronto y Google ya anunciará más funciones en el futuro.

Gmail + espacio de trabajo de Google

En Gmail para Android e iOS, encontrará un botón Gemini en la esquina superior derecha que le permite mostrar el equivalente móvil de un panel lateral para ingresar indicaciones completas. Gmail también obtiene respuestas inteligentes contextuales que ofrecen sugerencias más personalizadas, detalladas y matizadas. Esto se implementará en Workspace Labs en julio.

En la conferencia Cloud Next 2024 en abril, Google también presentó una vista previa de una función de mensaje de voz para Ayúdame a escribir en Gmail móvil. Mientras tanto, una función de “pulido instantáneo” “convertirá notas sin procesar en un correo electrónico completo con un solo clic”.

En la web de escritorio, el panel lateral está disponible en Gmail, Google Drive y Docs/Sheets/Slide. Luego, Gemini llega al chat de Google para resumir las conversaciones y responder preguntas.

mapas de Google

En febrero pasado, Google anunció que Maps utilizaría LLM para impulsar un chatbot «Preguntar». Puede usarlo para encontrar lugares que coincidan con su mensaje con soporte para preguntas de seguimiento. Se basa en detalles sobre 250 millones de lugares y fotografías, vídeos y reseñas enviadas por los usuarios.

Cromo

Gemini Nano llegará al escritorio de Chrome para optimizar funciones del navegador como «Ayúdame a escribir». Debería estar disponible en la mayoría de las computadoras portátiles y de escritorio modernas.

Además de lanzar vistas previas de IA, Google presentó una vista previa de una serie de funciones próximas que estarán disponibles por primera vez en Search Labs:

  • Podrá tomar la descripción general original de la IA y hacerla “más simple” (en solo unas pocas oraciones) o “desglosarla” (respuesta más larga).
  • Las capacidades de razonamiento de varios pasos le permitirán formular una pregunta compleja de una vez en lugar de dividirla en varias consultas.
  • Planificación de comidas y viajes.
  • Página de resultados de búsqueda seleccionada por IA
  • Búsquedas de vídeos: graba un vídeo y haz una pregunta al respecto.

Androide

Gemini Nano con multimodalidad se lanzará en Pixel «más adelante este año» y ofrecerá funciones como descripciones de TalkBack en el dispositivo/fuera de línea y alertas de estafas en tiempo real que escuchan una llamada para detectar patrones reveladores. Google compartirá más detalles a finales de este año.

En I/O 2024, Google también mostró una vista previa de cómo Gemini en Android pronto será un panel superpuesto en lugar de abrir una interfaz de usuario en pantalla completa para ver los resultados. Además de preservar el contexto, esto le permitirá arrastrar y soltar una imagen generada en una conversación. Para los suscriptores de Gemini Advanced, los botones «Solicitar este video» y «Solicitar este PDF» mostrarán videos de Gemini y documentos resumidos, respectivamente. Esta función se implementará «en los próximos meses». Además, las sugerencias dinámicas utilizarán Gemini Nano con multimodalidad para comprender lo que hay en su pantalla:

Por ejemplo, si habilitas a Gemini en una conversación sobre pickleball, las sugerencias pueden incluir «Encontrar clubes de pickleball cerca de mí» y «Reglas de pickleball para principiantes».

Otra incorporación que resultará especialmente útil en dispositivos móviles es la extensión Gemini para Google Calendar, Tasks y Keep. Esto te permitirá tomar una foto de una página con varias fechas próximas que Géminis puede convertir en eventos del calendario. En los próximos meses, una “Utilidad” permitirá al móvil Gemini acceder a la aplicación Reloj de Android.

También esperamos que el móvil Gemini llegue a la tableta Pixel este verano.

Geminis

Live te permitirá tener una conversación bidireccional con Géminis. Para que la experiencia sea más natural, Géminis te devolverá respuestas concisas que podrás interrumpir para agregar nueva información o pedir una aclaración. Puede elegir entre 10 voces diferentes, y Google imagina que Gemini Live es útil para prepararse para una entrevista o ensayar un discurso. Estará disponible en los “próximos meses” para los miembros de Gemini Advanced.

“Más adelante este año”, Gemini Live te permitirá iniciar un modo de cámara en vivo. Simplemente muestra algo del mundo real y haz una pregunta al respecto. Esto está impulsado por el Proyecto Astra.

Las gemas son versiones personalizadas de Gemini que te permiten tener un «compañero de gimnasio, un segundo chef, un compañero de codificación o una guía de escritura creativa». Los miembros de Gemini Advanced podrán crear gemas personalizadas, mientras que todos los usuarios tendrán acceso a gemas prefabricadas, como Learning Coach.

Simplemente describe lo que quieres que haga tu Gema y cómo quieres que responda, como por ejemplo «tú eres mi entrenador de carreras, dame un plan de carrera diario y sé positivo, optimista y motivador». Gemini tomará estas instrucciones y, con un clic, las mejorará para crear una gema que satisfaga sus necesidades específicas.

Los usuarios de Gemini Advanced también se beneficiarán de un «planificador inmersivo» que va más allá de simplemente sugerir actividades, sino que tiene en cuenta los tiempos de viaje y las paradas, así como los intereses de las personas, para crear un itinerario detallado. Gemini utilizará los detalles de vuelos/viajes en Gmail, recomendaciones de Google Maps para restaurantes y museos cerca de su hotel y buscará otras actividades.

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.