Blog

  • l’IA générative en entreprise nécessite une approche spécifique

    l’IA générative en entreprise nécessite une approche spécifique

    Traiter un projet d’IA Générative comme un projet d’intelligence artificielle classique serait une erreur. Il s’agit bien des mêmes origines techniques, les réseaux de neurone, mais ce ne sont pas les mêmes cas d’usages, les compétences nécessaires sont très différentes et le pilotage dans l’entreprise n’est pas au même niveau. l’IA générative n’est pas non plus réservée aux grandes entreprises, maintenant les PME peuvent en bénéficier.

    Revenons sur les concepts pour bien en comprendre les enjeux pour l’entreprise.

    Le Machine Learning

    Les premiers programmes d’apprentissage en autonomie par des ordinateurs sont apparus avec les jeux de stratégies. En particulier, Arthur Samuel en 1952 avec un jeu de dames qui pouvait déjà défier un bon amateur. Cet apprentissage est fondé sur des approches mathématiques et statistiques. C’est le démarrage du Machine Learning.

    Aujourd’hui, elle est au coeur de notre quotidien, pour des usages comme la classification : déterminer des types films préférés en fonction de l’âge, du sexe et de la situation de famille, la prédiction de valeur (la régression), prédire la valeur d’un bien immobilier à partir d’entrées telles que le nombre de pièces, l’année de construction, la surface du terrain, l’emplacement ou  la recherche de regroupements (clustering) sur des données non préparées : analyse de clientèle, segmentation de marché.

    En entreprise, le Machine Learning nécessite des jeux de données importants, un savoir faire pour retravailler ces données ainsi que de bonnes compétences en mathématiques et en statistique pour déterminer le bon algorithme à utiliser pour entraîner les modèles.

    Le Deep Learning

    Les réseaux de neurones sont apparus au niveau théorique aussi très tôt dans les années 60. Mais peu de gens y ont cru jusqu’aux travaux de Yann Lecun, Geoffrey Hinton et Yoshua Bengio dans les années 2000-2010. Ce fut le début du Deep Learning.

    En 2012, Geoffrey Hinton et son équipe  gagnent brillamment la compétition ImageNet ILSVRC avec des améliorations d’algorithme et surtout l’utilisation de carte graphique (GPU) qui accélèrent les calculs. C’est le vrai démarrage des réseaux de neurones. Tout le monde s’y intéresse. C’est le début de beaucoup d’applications autour de l’image, texte, audio.

    Le Deep Learning offre des possibilités bien plus riches que le Machine Learning traditionnel, notamment dans des domaines comme le traitement du langage naturel (compréhension, traduction), la reconnaissance d’images ou les moteurs de recommandation (par exemple, dans le streaming). 

    Naissance de l’IA Générative

    En 2017, la publication de l’article “Attention Is All You Need” (Vaswani et al.) a été décisive. Il ouvre la voie à de un nouveau type d’algorithme d’IA les transformers. Leur principal apport est de pouvoir analyser les différents composants d’une phrase  en parallèle et non plus séquentiellement comme avant. Ce qui permet notamment des entraînements sur de plus gros volumes de  données.

    L’année suivante, deux projets majeurs, basés sur ces transformers, voient le jour. Google dévoile BERT, un modèle focalisé sur la compréhension du sens des phrases, tandis qu’une jeune société nommée OpenAI entre dans la course avec GPT (Generative Pre-trained Transformer), axé sur la génération de texte. Les bases de l’IA générative sont posées.

    OpenAI et apparition des LLM

    Le véritable coup de génie d’OpenAI réside dans son ambition d’entraîner des modèles sur des volumes de données massifs : 110 millions de paramètres pour GPT-1 en 2018, 1,5 milliard pour GPT-2, puis 175 milliards avec GPT-3. La première phase s’est appuyée sur des données brutes issues d’Internet, suivie d’un affinement grâce à des retours humains, rendant les modèles capables de converser de manière naturelle.

    Cependant, une telle ambition nécessitait une puissance de calcul colossale. Microsoft, avec un investissement d’un milliard de dollars en 2019, a fourni l’infrastructure nécessaire pour transformer cette vision en réalité. Les résultats ont surpris même les leaders établis comme Google.

    Basés au départ sur un principe statistique de prédire le mot suivant dans un début de phrase, ces modèles sont capables de proposer des services d’analyse et de génération de texte, tels que le résumé, la traduction. Mais surtout de répondre à des questions sur les informations qui ont servi à l’entrainement, l’occurence, tout ce qui se trouve sur Internet. C’est en quelque sorte une encapsulation de l’intelligence dans une solution technique facile à exploiter.

    Le lancement public de ChatGPT en novembre 2022 et son adoption massive par le grand public, imposent rapidement ces nouvelles fonctionnalités, les ‘Large Language Model’ ou LLM sur le devant de la scène.

    Aujourd’hui, les LLM se concentrent sur l’amélioration du raisonnement et la planification d’actions complexes avec les Agents autonomes.

    Pour les entreprises, l’IA générative offre trois grands types d’usages :

    • l’assistance aux collaborateurs dans leurs tâches quotidiennes,
    • la valorisation des données non structurées (via le Retrieval-Augmented Generation ou RAG),
    • l’automatisation de tâches complexes grâce à des agents autonomes.

    Mais l’évolution ne s’arrête pas là. L’IA générative est désormais multi-modale : elle peut comprendre et produire du texte, des images, des sons et des vidéos, ouvrant de nouvelles perspectives dans presque tous les domaines d’activité.

    Spécificités de l’IA Générative pour l’entreprise

    Une fois précisées les technologies en présence, l’IA prédictive avec le Machine Learning et le Deep Learning d’une part et l’IA Générative, intéressons-nous à ce qui différencie ses approches dans le contexte de l’entreprise. 

    Des compétences techniques distinctes

    Dans un projet d’IA prédictive, le cycle comprend plusieurs étapes bien définies : collecte et préparation des données, sélection de l’algorithme pertinent, entraînement et ajustement des hyperparamètres, déploiement et suivi des performances. Ces projets mobilisent principalement des experts techniques tels que des ingénieurs data et des data scientistes.

    À l’inverse, un projet basé sur l’IA générative repose sur des modèles pré-entraînés les ‘Large Language Models’, dont l’entraînement initial a été réalisé par des fournisseurs spécialisés. Le rôle de l’entreprise se limite alors à assembler des briques technologiques existantes : LLM, bases vectorielles, frameworks agentiques, etc. Ce travail demande des compétences classiques en ingénierie IT, avec une expertise spécifique dans l’utilisation et l’intégration des LLM.

    Notons que dans certains cas, très spécifiques,  il est souhaitable d’affiner le modèle de langage. Mais en raison des coûts élevés liés à l’entraînement, besoin de GPU, volumes massifs de données, ce processus reste en dehors du périmètre de la plupart des entreprises.

    Des interlocuteurs différents

    Les projets de d’IA prédictive mobilisent des équipes techniques pointues, mêlant experts en data science et spécialistes métier. Ils se déroulent sur plusieurs semaines et nécessitent souvent une intégration avec le système d’information (SI) de l’entreprise. De ce fait, ces projets sont généralement pilotés par la direction informatique.

    En revanche, un projet d’IA générative s’appuie sur des composants techniques en cours de standardisation et nécessite une collaboration étroite avec les équipes métier pour définir les besoins. Lorsque des données internes de l’entreprise sont utilisées (par exemple, dans une architecture RAG), elles concernent souvent des services spécifiques et sont plus faciles à gérer. Par ailleurs, l’interaction avec les utilisateurs finaux est plus fréquente, notamment dans les phases de validation.

    Ces projets, plus accessibles et agiles, sont donc souvent pilotés par les équipes métiers elles-mêmes.

    Des tailles d’entreprise variées

    Les projets de IA prédictive, en raison de leurs besoins en données massives et d’ infrastructures nécessaires, sont généralement réservés aux grandes entreprises, capables d’assumer les coûts et les contraintes techniques.

    À l’inverse, les projets d’IA générative sont accessibles à des entreprises de toutes tailles. Ils ne nécessitent pas de volumes importants de données et couvrent une grande variété de cas d’usage. Cela les rend particulièrement attractifs pour les PME, qui peuvent les adopter rapidement pour des besoins spécifiques.

    Des outils adaptés aux contextes

    Les outils utilisés dans les projets de IA prédictive sont souvent complexes et nécessitent une expertise technique approfondie. Ils sont difficiles à standardiser et à rendre accessibles à des non-spécialistes.

    En revanche, l’IA générative bénéficie d’un écosystème d’outils en rapide expansion. De nombreux éditeurs proposent des solutions, disponibles soit en SaaS (via API), soit en open source pour des installations locales. Ces outils permettent, par exemple, de configurer rapidement des cas d’utilisation comme l’exploitation de documents via des interfaces graphiques intuitives (drag-and-drop).

    Des plateformes dédiées commencent également à émerger pour industrialiser les projets d’IA générative à l’échelle de l’entreprise. Ces solutions intègrent des chaînes d’ingestion de données standardisées, des outils centralisés pour gérer les prompts, des mécanismes de contrôle qualité des réponses, et des systèmes d’orchestration d’agents.

    IA Prédictive
    (ML/DL)
    IA Générative
    FonctionnalitésClassification,
    Prédiction,
    Regroupement
    Analyse de texte, Traduction,
    Résumé,
    Génération de code,
    Planification de taches,


    UsagesPrévisions financières,
    Maintenance prédictive,
    Reconnaissance d’images,
    Moteurs de recommandation
    Aide aux collaborateurs,

    Valorisation des documents de l’entreprise

    Automatisation de processus complexes
    CompétencesIngénieur Data, Data ScientisteIngénieur IT,
    Architecte SI
    OutillageOutils bas niveau spécialisés en IABriques techniques standards
    Type
    d’entreprise
    Grande entreprise possédant de gros jeux de donnéesTous types d’entreprises
    Pilotage des projetsDirection informatiqueDirections métiers

    Conclusion

    Alors que l’IA prédictive s’appuie sur des processus techniques complexes nécessitant des données massives et des expertises pointues, l’IA générative se distingue par son accessibilité, sa modularité, et son potentiel d’adoption rapide, même pour les petites et moyennes entreprises.

    Cette démocratisation des technologies de l’IA Générative ouvre un large éventail de cas d’usage, allant de l’automatisation documentaire à la création de nouvelles interactions avec les utilisateurs.

    Grâce à des outils en constante évolution et des plateformes de plus en plus standardisées, les entreprises peuvent désormais intégrer l’IA générative à leurs processus avec des efforts techniques et financiers réduits.

    Dans un contexte où l’agilité et l’innovation sont des leviers clés de compétitivité, l’IA générative représente une opportunité stratégique pour toutes les organisations souhaitant exploiter les bénéfices de l’intelligence artificielle, quelle que soit leur taille ou leur secteur d’activité.

    n.b. :
    Dans un prochain article, je traiterai de la pertinence et des modalités de la mise en place d’une plateforme technique dédiée à l’IA Générative dans l’entreprise en 2025.