Google I/O 2022 : le récap de Talan
De l’intelligence artificielle à haute dose dans tous les services.
L'intelligence artificielle au cœur de la stratégie produit de Google
L’évènement annuel de Google s’est tenu les 11-12 mai 2022 derniers, en physique à Mountain View et avec une série impressionnante d’annonces de nouveautés, comme il se doit.
Lors du keynote d’ouverture Sundar Pichai (CEO) a rappelé la raison d’être de Google : « Notre objectif est d'organiser les informations à l'échelle mondiale pour les rendre accessibles et utiles à tous ». Il a ensuite enchaîné, avec ses équipes, sur une démonstration claire et concrète de leurs principales réalisations autour de leur gamme de services (Translate, Maps, Search, Android, Pixel, Nest, …).
Il était flagrant de voir à quel point l’Intelligence Artificielle progresse dans la composition et la sophistication de leurs services. Nous creuserons donc particulièrement cet axe.
Prenons la traduction simultanée écrite et orale, qui constitue une orientation stratégique forte et répond à des besoins concrets de communication et d’accès à l’information. Google a travaillé sur des modèles de machine learning qui passent d’une logique bilingue à une logique monolingue. Ainsi, 24 nouvelles langues ont été ajoutées, dont le Quechua. On retrouve cette thématique dans le domaine des assistants, des vidéos YouTube avec des sous-titres générés automatiquement en 16 langues et de la réalité augmentée avec les nouveaux prototypes de Google Glasses.
Cartographie : une expérience utilisateur toujours plus immersive et engagée dans une démarche éco-responsable
Du côté de la cartographie (Google Maps), c’est le renfort de modèles de Computer Vision qui permet de détecter des bâtiments à partir d’images satellites. Depuis juillet 2020, cela a permis de multiplier par cinq les bâtiments identifiés en Afrique. Plus globalement, 20% des bâtiments ont été détectés en utilisant ces techniques.
Une nouvelle expérience est également ajoutée : « immersive view ». Elle combine la 3D et le machine learning pour mieux appréhender un lieu, à l’avance. Cette fonctionnalité sera disponible essentiellement pour les grandes villes dans un premier temps.
Il est également question d’empreinte carbone des déplacements et de leur coût. On pourra ainsi choisir le trajet le plus économe et « eco-friendly ». Par exemple, un itinéraire plus long de trois minutes peut permettre d’économiser 18% de carburant. Il en va de même pour Google Flights qui affichera l’estimation de l’empreinte carbone entre les différentes options de vols pour une destination. Sundar Pichai a rappelé que, face au fort développement de leurs infrastructures, Google réaffirme son engagement d’opérer sans impact carbone d’ici 2030.
Synthèse de contenus automatisée et Image Processing
En matière de synthèse de contenus, Google annonce avoir fait progresser ses algorithmes de NLP (Natural Language Processing) pour permettre de produire des synthèses de Google Docs et bientôt de conversations chats, notamment sur Google Meet.
Soucieux de notre image en visio-conférence, Google a de nouveau fait appel à l’Image Processing pour améliorer le rendu visuel quelques soient les conditions initiales. Des fonctionnalités « studio like » ont été développées. Un travail spécifique a été apporté aux tonalités de peaux dans un soucis d’inclusion et de diversité. On retrouvera cet aspect dans les nouveautés de Google Search.
Le Search, service phare de Google
La logique « any way, anywhere » se décline de manière toujours plus sophistiquée, au-delà du NLP ou de la recherche voix. Le concept de « multi-search & multi-search near me » va ajouter la partie visuelle. Il est aussi question d’enrichir cette dimension avec une « scene exploration » qui doit permettre de distinguer à partir d’une vue, via un mobile par exemple, quel objet correspond à vos critères de recherche (via le Knowledge Graph de Google). Afin de s’assurer que les algorithmes de machine learning prennent mieux en compte la variation de tonalités de peau, Google a travaillé avec le professeur Monk de l’Université d’Harvard, spécialiste du sujet. Le groupe a mis en accès libre une partie de ses recherches.
AI Test Kitchen by Google : pour une intelligence artificielle plus éthique et inclusive
AI Test Kitchen est une application où les gens peuvent expérimenter et donner leur avis sur certaines des dernières technologies d'IA de Google. L'objectif est d'apprendre, d'améliorer et d'innover ensemble de manière responsable en matière d'IA. Cette application a été imaginée pour anticiper les problèmes liés à l’Intelligence Artificielle, comme des résultats très erronés voir offensants, avec une audience plus large et de manière participative. Il utilise LaMDA 2, la solution conversationnelle intelligente de Google et se décline en trois options de conversation : « Imagine It », « Talk about it » et « List it ». Les retours des utilisateur-trice.s seront mis à profit pour améliorer la pertinence des algorithmes.
La fin de "OK Google" ?
Les « assistants » (ex. Nest Hub Max) vont s’affranchir du « OK Google » systématique via une fonctionnalité « look and talk » qui fait appel à la reconnaissance faciale et vocale, exécutée sur l’équipement lui-même (privacy / latency), pour ajouter de la fluidité dans l’interaction. Des algorithmes améliorés de NLUs (Natural Language Undertsanding) ont été optimisés pour réduire ce temps d’interaction.
Une cybersécurité augmentée par l’intelligence artificielle
Une longue partie du keynote était dédiée à la « AI-powered cybersecurity » avec comme mot d’ordre « safer with Google » et qui doit garantir chaque jour la protection des utilisateur.trices contre des attaques qui se présentent essentiellement sous la forme de « phishing » (90%).
Pathways : de premiers résultats pour la nouvelle architecture IA de Google
Google a présenté leur nouveau Large Language Model (LLM) appelé PaLM 540B (Pathways Language Model) qui est le premier résultat de « Pathways », la nouvelle architecture IA de Google. Le modèle et l’application d’une logique « chain-of-thought » (qui décompose une problématique) aboutit à une meilleure précision des résultats. L’ambition est de gérer un nombre considérable de tâches en parallèle et d’apprendre très rapidement de nouvelles tâches.
Des nouveautés côté Android
Google a aussi égrainé ses nouveautés sur Android, sur le nouveau modèle de téléphone mobile moyen de gamme Pixel 6A, sur le Pixel 7, sur la très attendue Pixel Watch, la montre connectée intégrable avec Fitbit. les Pixel Buds Pro et leur positionnement premium, etc.
La technologie au service de l'humain : une vision que nous partageons
Google continue d’investir massivement dans l’Intelligence Artificielle et s'appuie sur des infrastructures hors-normes et pour des applications très concrètes. La simplicité d’utilisation des services est sans cesse recherchée en masquant l’extrême complexité technique. Une forme de prouesse. L’inclusion, l’éthique ou les biais de l’IA et la durabilité montent en puissance en lien avec les problématiques sociétales.
En parallèle, de manière assez remarquable et alors qu’il s’invite dans tous les domaines, le métavers n’a pas été évoqué. Une omission parfaitement consciente de la part du Groupe qui n’est ainsi pas tombé dans le travers de la communication sur des réalisations estampillées "metavers" sans réflexion de fond ni ancrage dans le monde réel...
*Néanmoins, lors de la clôture du keynote, Sundar Pichai, a mis l’accent sur la nouvelle frontière que représentait la réalité augmentée en opposition à un monde complètement virtuel :
Les capacités de réalité augmentée sont déjà utiles sur les téléphones et la magie prendra vraiment vie lorsque vous pourrez les utiliser dans le monde réel sans que la technologie ne vienne vous gêner. Ce potentiel est ce qui nous enthousiasme le plus dans ce domaine : la possibilité de passer du temps à se concentrer sur ce qui compte dans le monde réel, dans nos vies réelles. Parce que le monde réel est extraordinaire ! Il est important que nous concevions nos produits de manière à ce qu'ils soient conçus pour le monde réel - et qu'ils ne vous en éloignent pas. La réalité virtuelle nous offre de nouveaux moyens d'y parvenir.
Sundar Pichai, CEO, Google
Il y avait du niveau du côté de Mountain View !