Les modèles multimodaux Gemini de Google comprenaient Gemini Nano, conçu pour les appareils mobiles, notamment le Pixel 8 Pro.
A Article de blog de Google a dévoilé de nombreuses nouvelles fonctionnalités alimentées par l'IA pour les téléphones Pixel, activées par Gemini Nano, une variante spécialisée de... Le modèle d'IA Gemini de Google optimisé pour les opérations sur l'appareil.
Gemini Nano est extrêmement léger mais performant, ce qui signifie qu'il peut traiter les données localement sur l'appareil plutôt que de les envoyer et de les recevoir depuis le nuage. Gemini Nano est alimenté par la puce Tensor G3 du Pixel 8.
Il offre deux nouvelles fonctions de pointe alimentées par l'IA. La première est la fonction "Summarize" de l'application d'enregistrement sonore, qui permet d'analyser et de condenser les conversations enregistrées, en exploitant la capacité de Gemini à transformer l'audio en texte.
La seconde est une fonction de réponse intelligente dans l'application Gboard, actuellement adaptée à WhatsApp, qui propose des suggestions de réponse en fonction du contexte.
Parmi les autres fonctionnalités, citons "Video Boost", une collection d'outils d'amélioration vidéo basés sur les capacités de traitement vidéo de Gemini. Il s'agit notamment d'améliorations en matière d'étalonnage des couleurs, de réglage de l'éclairage, de stabilisation et de réduction du grain afin d'améliorer la qualité de la vidéo.
Video Boost intègre notamment la technologie Night Sight de Google, qui permet de réaliser des vidéos de qualité supérieure dans des conditions de faible luminosité. Toutefois, cette fonctionnalité nécessite le téléchargement des vidéos vers Google Photos pour traitement.
Les Pixel 8 et Pixel 8 Pro proposent également Night Sight en mode Timelapse, s'appuyant sur les performances impressionnantes de la série en matière de faible luminosité. En outre, la fonction Photo Unblur a également été affinée grâce à l'IA.
Parmi les autres ajouts figurent la fonctionnalité permettant d'utiliser les smartphones Pixel (Pixel 6 et suivants) comme webcams, une mise à jour du gestionnaire de mots de passe Google et un nouveau mode de réparation qui protège les données de l'utilisateur lors de l'entretien de l'appareil.
Il n'y a pas si longtemps, Google annonce des fonctions d'édition d'images par l'IALe site propose également de nouvelles fonctionnalités, dont "Best Take", qui permet aux utilisateurs d'échanger les visages des personnes après la prise de la photo. Cela a contribué à alimenter le débat en cours sur les "deep fakes", certains soulignant que la manipulation d'images est aujourd'hui plus simple que jamais.
Andrew Pearsall, photographe chevronné, explique : "Une simple manipulation, même pour des raisons esthétiques, peut nous entraîner sur une voie sombre."
Cependant, comme l'a rétorqué le professeur Rafal Mantiuk de l'université de Cambridge, "les gens ne veulent pas capturer la réalité... Ils veulent capturer de belles images".
Quoi qu'il en soit, l'IA locale arrive sur les smartphones, à commencer par le Pixel 8 Pro. Elle finira par devenir la norme.