Accueil
Toute l'actualité

En continu Photojournalisme Notre recommandation
La tribune
International
Économie
Faits Divers
Sport
Infographie
Vidéos

2026/6/5 7:24 CET

Mode sombre

Langues

عربي
فارسى
Türkçe
français
አማርኛ

Réseaux sociaux d'Al-Ain

Faits Divers

Où les chatbots d'IA puisent-ils leurs connaissances ?

Al Ain

Published on: 2023/5/12 19:52 CET Last updated on: 2023/5/12 20:55 CET

Photo d’illustration

les chatbots d'IA actuellement disponibles, comme ChatGPT d'OpenAI ou Bard de Google, ne sont pas à proprement parler intelligents et ne possèdent pas de conscience propre.

Quelle est la popularité d'Uber dans le monde ?

Contrairement à la perception que l'on pourrait avoir, les chatbots (ou robots conversationnels) d'IA actuellement disponibles, comme ChatGPT d'OpenAI ou Bard de Google (dont l'intégration dans les services Google a été annoncée à la conférence I/O 2023), ne sont pas à proprement parler intelligents et ne possèdent pas de conscience propre. Les grands modèles de langage (LLM) sur lesquels ils s'appuient sont entraînés à partir d'informations déjà disponibles sur Internet. Ces connaissances sont ensuite restituées de façon à ce que le résultat résiste à un test de probabilité considérant tous les codes du langage naturel (orthographe, syntaxe, grammaire, etc.). Notre graphique, basé sur une étude publiée par le Washington Post, montre les sources d'informations qui sont les plus utilisées.

Le journal américain a analysé, en collaboration avec l'Allen Institute for AI, le corpus C4 publié par Google, une immense base de données regroupant 15 millions de sites web qui ont été utilisés pour entraîner des IA. Ils ont ensuite pu déterminer la répartition des "tokens" par source, c'est-à-dire la provenance des éléments de texte contenus dans le corpus. Avec 0,46 % du contenu, le moteur de recherche de brevets de Google, "patents.google.com", représente de loin la plus grande part. Cette plateforme indexe les brevets et demandes de brevet provenant du monde entier depuis 2006 et en regroupe aujourd'hui plus de 120 millions.

En deuxième position, on trouve "wikipedia.org" avec une part de 0,19 % du contenu, suivi de "scribd.com" avec 0,07 %. Ce dernier interpelle notamment en ce qui concerne le respect des droits d'auteur pour les textes générés par l'IA. Alors que les contenus de Wikipédia sont placés sous licences Creative Commons et sont diffusables librement, Scribd est un site de partage de documents en ligne sur lequel de nombreuses œuvres protégées ont été téléchargées. Plusieurs organes de presse tels que le New York Times, le Guardian et Forbes figurent également dans le top 8. Il est important de souligner que l'analyse du Washington Post ne prétend pas à l'exhaustivité ou à une exacte représentativité, car aucun modèle d'IA n'est entraîné sur la base d'un seul et unique corpus de données, rapport Statista.

Alors que la réglementation et la législation en matière d'IA est plutôt à la traîne jusqu'à présent, certaines autorités nationales et internationales ont commencé à s'activer dans cette direction. L'Italie a été la première à agir : estimant qu'OpenAI avait enfreint le RGPD avec ChatGPT, le pays a décidé de bloquer son accès fin mars jusqu'à ce que la société se remette en règle. Dans l'Union européenne, les États membres discutent actuellement de l'introduction de l'AI Act, qui doit créer un cadre juridique transnational pour l'utilisation de l'IA dans l'UE.

Les faits divers françaises et internationales

#Infographie
#Technologie
#Notre_recommandation

Actualités connexes

Les 5 enfants les plus riches du monde

Les 5 enfants les plus riches du monde

Manchester City: Classement des buteurs de la saison 2022-2023

Manchester City: Classement des buteurs de la saison 2022-2023

Les Emirats et la France.. ensemble pour la sécurité et la paix

Les Emirats et la France.. ensemble pour la sécurité et la paix

Classement des meilleurs buteurs de l'histoire en Ligue des champions

Classement des meilleurs buteurs de l'histoire en Ligue des champions

Les tendances

Sport

Ligue des champions féminine : Lyon s'impose à Munich et se rapproche des demi-finales

Faits Divers

Séisme de magnitude 5,1 ressenti à Alger et ses environs : pas de dégâts signalés

International

Procès Sarkozy : la justice face aux soupçons de financement libyen

Sport

Mbappé évite Zidane pour calmer les rumeurs

Notre recommandation

International

Après le Burkina Faso et le Niger, le Mali quitte à son tour l'Organisation internationale de la Francophonie

Économie

Liban: le prix du dollar face à la LL ce mercredi 19 mars 2025

Faits Divers

Séisme de magnitude 4,1 à Nice : quelles sont les régions françaises les plus exposées aux tremblements de terre ?

Faits Divers

Ramadan 2025 : Les musulmans accusés de la pénurie d'œufs en France

Suivez-nous

Télécharger ou mettre à jour l'application

Les catégories

International
Économie
Faits Divers
Sport

Langues

عربي
فارسى
Türkçe
français
አማርኛ

Al-Ain Français

À propos de nous
Contactez-nous
Publiez vos annonces sur Al-Ain
Politique de confidentialité

Tous les droits réservés à Al-Ain pour les médias et les études © 2026

Ce site utilise des cookies pour améliorer votre expérience de navigation Politique de confidentialité