Google lance Gemini, son nouveau modèle d'IA générative multimodal
Google dévoile sa réponse au GPT-4 d'OpenAI. Baptisé Gemini, il s'agit d'un modèle multimodal, qui fonctionne aussi bien avec du texte que des images ou des vidéos, et ce à bas niveau.
Il n'est pour l'instant disponible qu'en anglais, et sa version la plus puissante, Gemini Ultra, ne sera commercialisée que l'année prochaine.
“C'est le début d’une nouvelle ère”, assure Sundar Pichai, le directeur général de Google. Mercredi 6 décembre, le géant de Mountain View a officiellement dévoilé son nouveau modèle d’intelligence artificielle générative, devant rivaliser avec GPT-4, déployé en mars par la start-up OpenAI.
Trois tailles
Selon le moteur de recherche, Gemini est le fruit de “l’un des plus grands efforts scientifiques et techniques [qu'il a] entrepris depuis [sa] création”. Il a été développé par la nouvelle unité dédiée à l’IA, rassemblant les équipes de ses deux laboratoires, le britannique DeepMind et l'américain Google Brain.
Comme promis au printemps lors de la conférence I/O, le nouveau modèle de Google est doté de trois tailles différentes : Ultra, pour les tâches les plus complexes, Pro, pour la majorité des requêtes, et Nano, pour les tâches “embarquées”, c’est-a-dire réalisées directement sur un appareil, sans passer par le cloud, selon Usine-Digitale.