Glossaire Didak’TIC n°8

Image générée par l’Intelligence Artificielle Firefly, par Adobe.

Glossaire Didak’TIC n°8


A

Agents Conversationnels : ce sont des programmes capables d’interagir avec les utilisateurs via le langage naturel. Les chatbots et les assistants virtuels sont des exemples d’agents conversationnels. (Anna Koleva – Une brève histoire de l’IA)

Algorithme : ensemble des règles opératoires propres à un calcul ; suite de règles formelles. (Anna Koleva – Une brève histoire de l’IA)

Apprentissage Supervisé et Non Supervisé des LLM : l’apprentissage supervisé utilise des exemples étiquetés pour entraîner un modèle, tandis que l’apprentissage non supervisé explore les structures cachées dans les données sans étiquette. (Anna Koleva – Une brève histoire de l’IA)

B

Bruit dans les données : réfère à des variations ou perturbations aléatoires qui altèrent les données collectées, rendant difficile l’apprentissage des relations que l’on cherche à prédire et pouvant même rendre la modélisation impossible. (Rayen Soltani – Les Défis de l’Anonymisation des Données DANS L’IA génÉrative : Techniques et Limites)

C

Chatbot : un chatbot, également appelé agent conversationnel, est un programme informatique capable d’imiter le comportement des humains pour mener une conversation avec un utilisateur, via une plateforme ou une application. (Anna Koleva – Interview – l’ia gÉnÉrative au cŒur de la transformation mÉtier)

D

Dataset : regroupe plusieurs données ayant un lien cohérent entre elles. Il se présente sous forme de tableau permettant d’analyser chaque donnée qui le compose. (Rayen Soltani – Les Défis de l’Anonymisation des Données DANS L’IA génÉrative : Techniques et Limites)

Deep Learning : une sous-catégorie du machine learning qui utilise des réseaux de neurones profonds pour résoudre des problèmes complexes.  (Anna Koleva – Une brève histoire de l’IA)

Données d’Entraînement : les modèles génératifs apprennent à partir de données d’entraînement. Plus les données sont variées et de haute qualité, meilleure est la performance du modèle. (Anna Koleva – Interview – l’ia gÉnÉrative au cŒur de la transformation mÉtier)

Données synthétiques : Les données synthétiques sont des données générées artificiellement plutôt que recueillies à partir de sources réelles. Elles sont utilisées pour entraîner des modèles d’intelligence artificielle et de machine learning, effectuer des tests logiciels, ou créer des jeux de données pour des recherches sans compromettre la confidentialité des données réelles. Ces données permettent de simuler des scénarios variés et de garantir la diversité des situations auxquelles un modèle peut être confronté, sans risques liés à la gestion des données sensibles. (Rayen Soltani – Les Défis de l’Anonymisation des Données DANS L’IA génÉrative : Techniques et Limites)

E

Encryption homomorphique : c’est une méthode de cryptographie qui permet de réaliser des calculs sur des données chiffrées sans avoir besoin de les déchiffrer. Cela signifie que l’on peut effectuer des opérations comme l’addition et la multiplication directement sur les données chiffrées, et le résultat, une fois déchiffré, sera le même que si les opérations avaient été effectuées sur les données non chiffrées. (Rayen Soltani – Les Défis de l’Anonymisation des Données DANS L’IA génÉrative : Techniques et Limites)

F

Fair use (usage loyal) : le fair use, également appelé usage loyal, est un ensemble de règles de droit, d’origine législative et jurisprudentielle, qui apportent des limitations et des exceptions aux droits exclusifs de l’auteur sur son œuvre (droit d’auteur). Il essaie de prendre en compte à la fois les intérêts des bénéficiaires des droits d’auteur et l’intérêt public, pour la distribution de travaux créatifs, en autorisant certains usages qui seraient, autrement, considérés comme illégaux. (Natacha Fonteneau – COMMENT les IA génératives se nourrissent DE nos informations disponibles sur Internet)

I

Industrie 4.0 (aussi appelée industrie du futur ou quatrième révolution industrielle) : correspond à une nouvelle façon d’organiser les moyens de production. Cette nouvelle industrie s’affirme comme la convergence du monde virtuel, de la conception numérique, de la gestion (opérations, finance et marketing) avec les produits et objets du monde réel. (Emma Lavallée – l’’Intelligence artificielle gÉnÉrative au service DE l’aéronautique le cas safran)

Intelligence Artificielle Générative (Gen AI) : un modèle d’agent conversationnel capable de générer divers contenus tels que du texte ou des images en réponse à des « prompts ». C’est le type d’IA le plus utilisé par les marketeurs et les créateurs de contenu. (Anna Koleva – Une brève histoire de l’IA)

Intranet : réseau informatique interne (à une entreprise, un organisme…), utilisant les techniques d’Internet. (Emma Lavallée – l’’Intelligence artificielle gÉnÉrative au service DE l’aéronautique le cas safran)

K

K-anonymité : propriété d’ensemble de données qui indique la possibilité de restaurer l’identification de ses enregistrements. Un ensemble de données est considéré comme k-anonyme si les quasi-identifiants de chaque individu dans l’ensemble de données sont identiques à au moins K-1 autre individu figurant également dans l’ensemble de données. (Rayen Soltani – Les Défis de l’Anonymisation des Données DANS L’IA génÉrative : Techniques et Limites)

L

Large Language Model (LLM): un Large Language Model (LLM) est une forme d’intelligence artificielle conçue pour comprendre et générer du langage naturel, similaire à la manière dont les humains communiquent. Ces modèles sont construits sur des réseaux de neurones profonds, qui sont des algorithmes informatiques inspirés par les structures et fonctions du cerveau humain. (Natacha Fonteneau – COMMENT les IA génératives se nourrissent DE nos informations disponibles sur Internet)

L-diversité : c’est une extension de la K-anonymité qui garantit qu’il y a au moins L « valeurs bien représentées » pour l’attribut sensible dans chaque groupe anonymisé. (Rayen Soltani – Les Défis de l’Anonymisation des Données DANS L’IA génÉrative : Techniques et Limites)

M

Machine Learning (Apprentissage Automatique) : le domaine qui permet aux modèles d’apprendre à partir de données et d’améliorer leurs performances au fil du temps. (Natacha Fonteneau – COMMENT les IA génératives se nourrissent DE nos informations disponibles sur Internet)

Modèles de Langage (LLM) : ces modèles sont essentiels pour la génération de texte. Ils apprennent à prédire la probabilité d’un mot donné en fonction du contexte. Des exemples incluent GPT-3 et GPT-4. (Anna Koleva – Une brève histoire de l’IA)

O

Open Source : l’open Source, également appelé source ouverte, désigne un modèle de développement logiciel où le code source est accessible au public. (Anna Koleva – Interview – l’ia gÉnÉrative au cŒur de la transformation mÉtier)

P

Prompt :  un « prompt » est une instruction ou une amorce donnée à un modèle génératif pour qu’il produise une sortie spécifique. Ils sont cruciaux pour obtenir des résultats pertinents et cohérents. (Anna Koleva – Une brève histoire de l’IA)

R

Réseaux de neurones génératifs (GAN) :  les GAN sont des modèles composés de deux réseaux de neurones, un générateur et un discriminateur, qui s’entraînent en compétition. Le générateur crée de nouvelles données, tandis que le discriminateur évalue si ces données sont réelles ou générées. Les GAN peuvent être entraînés sur divers ensembles de données, tels que des images, du texte ou de la musique, pour générer des données réalistes et originales.  (Anna Koleva – Une brève histoire de l’IA)

T

T-proximité : méthode d’anonymisation qui vise à protéger la distribution des valeurs dans le jeu de données. Cette méthode vérifie les éléments statistiques sur la distribution des valeurs et plus T est proche de 1, plus la distribution est similaire à celle de la base réelle. Si T est fixé à 1, cela signifie que la distribution des valeurs dans le jeu de données est identique à celle de la base réelle. (Rayen Soltani – Les Défis de l’Anonymisation des Données DANS L’IA génÉrative : Techniques et Limites)

Traitement du Langage Naturel (NLP pour Natural Language Processing) : le Traitement du Langage Naturel (NLP) est une discipline qui se situe à l’intersection de l’informatique, de l’intelligence artificielle, et de la linguistique. Il permet aux machines de comprendre, d’interpréter et de réagir au langage humain. (Emma Lavallée – l’’Intelligence artificielle gÉnÉrative au service DE l’aéronautique le cas safran)

Transformer : le Transformer est un modèle de Deep Learning qui a révolutionné le traitement automatique du langage naturel (TALN). Le transformer est un modèle de type séquence à séquence (ou seq2seq). Contrairement aux modèles précédents basés sur des réseaux de neurones récurrents, le Transformer n’utilise que le mécanisme d’attention. (Anna Koleva – Une brève histoire de l’IA)