Alphabet insiste pour finir l’année 2024 en beauté. Les nouveautés IA de Google sont nombreuses, discrètement annoncées (généralement, sur le blog de Google) et font grand bruit. À tel point que la tempête judiciaire qui le secoue violemment se trouve absente du débat public. Pourtant, elle façonnera l’avenir de beaucoup de secteurs et de géants de l’informatique.
Google n’affronte pas uniquement le Département américain de la justice, il subit également des attaques commerciales agressives de la part de ses concurrents :
- Open IA : générateur de vidéos Sora, de sa fonction d’analyse vidéo dans ChatGPT, Projects et SearchGPT qui devient gratuit.
- X IA : Grok 2 devient gratuit, l’idée d’un XMail n’est pas rejetée par Elon Musk.
La liste des nouveautés IA Fin 2024 est plus longue. À notre avis, la plus révolutionnaire et impactante demeure l’annonce à propos de la puce quantique Willow de Google.
Retournons après ce survol des nouveaux outils IA aux nouveautés IA de Google pour 2025.
Les nouveautés IA de Google pour Décembre 2024
Veo 2 : meilleure qualité et moins d’hallucinations
En mai, Google avait présenté Veo, son modèle de génération de vidéo IA. Celui-ci bénéficie désormais d’une mise à jour : Veo 2. Selon Google, cette technologie offre « une meilleure compréhension de la physique du monde réel ainsi que des nuances des mouvements et de l’expression humaine » (Comprendre que les vidéos générées seront plus réelles).
Comme lors de l’annonce initiale de Veo, Google met en avant la capacité de son modèle à s’adapter à des demandes spécifiques et à comprendre le langage cinématographique.
Demandez un travelling en contre-plongée qui se glisse au milieu d’une scène, ou un gros plan sur le visage d’une scientifique qui regarde dans son microscope, et Veo 2 le créera. Suggérez « objectif 18 mm » dans votre demande et Veo 2 saura créer le plan grand angle pour lequel cet objectif est connu, ou estompez l’arrière-plan et concentrez-vous sur votre sujet en indiquant « faible profondeur de champ »
Source : Google.
Veo 2 permet de générer des vidéos « allant jusqu’à plusieurs minutes » en 4K alors que son prédécesseur était limité à des productions en 1080p. Par ailleurs, Google se veut rassurant au sujet des ‘fameuses’ hallucinations qui caractérisent les vidéos IA : « les doigts supplémentaires ou les objets inattendus » seront moins fréquentes avec Veo 2.
Imagen 3 : Google améliore son générateur d’images
Imagen 3, le générateur d’images de Goole, se réinvente également. Les images générées seraient « plus lumineuses et mieux composées », avec des styles plus variés (« du photoréalisme à l’impressionnisme, de l’abstrait à l’anime ») et restitués avec une meilleure précision.
Imagen 3 est disponible dans Gemini depuis août 2024, mais cette dernière mise à jour sera, pour l’instant, déployée uniquement dans ImageFX.
Whisk : mixez vos images
Google a récemment introduit une nouvelle expérimentation nommée Whisk. Cet outil innovant permet de fusionner plusieurs images pour en créer une nouvelle. En pratique, vous pouvez importer (ou générer) des images représentant un personnage, une scène et un style visuel. Whisk combine ensuite ces trois éléments en une seule image. De plus, vous pouvez affiner les images obtenues en utilisant des requêtes textuelles pour des ajustements précis.
Source : présentation de Whisk par Press-citron
La prédiction lancée lors d’un forum Davos qui ‘révèle’ que les deux tiers des métiers d’avenir ne sont pas encore connus serait bien douce.
Il est indéniable que l’humanité entre dans une nouvelle ère ! Elle a connu bien d’autres dans le passé.