Structurer et valoriser votre RSE pour anticiper les exigences à venir
Par Piergiorgio Panero, Consultant
Inspiré par le problème des sept ponts de Königsberg, à l’époque ville allemande, le célèbre mathématicien suisse Leonard Euler introduisit le concept de graphe en 1741. Cette notion, aussi simple que puissante, lui permit de résoudre cette question, et de révolutionner les mathématiques connues en donnant naissance à la topologie.
Pendant les trois siècles qui nous séparent d’Euler, les spécialistes ont employé cette notion de multiples fois dans les sciences modernes et appliquées. Les graphes sont omniprésents en urbanisme, dans la modélisation de la transmission des maladies, la détection des fraudes, les systèmes de recommandation ou encore la cybersécurité. Un graphe, qui n’est rien d’autre qu’une collection d’objets avec pour chaque paire d’objets un ensemble d’arêtes (ou liens), permet de formaliser très facilement de nombreux problèmes et cas d’usage. C’est pour cette raison que dès les années ’60, les informaticiens ont introduit les premières bases de données orientées graphe. En effet, ces dernières sont un type de base de données conçu pour stocker et exploiter des relations complexes entre des données. Grâce à l’augmentation de puissance de calcul et à l’arrivée de l’intelligence artificielle, ces systèmes ont évolué drastiquement dans les dernières années jusqu’à la création des réseaux neuronaux graphiques.
Les premières théories datent des années 2000, quand Franco Scarselli et ses collègues ont réalisé des travaux novateurs et conceptuellement forts. En 2017, les chercheurs Kipf et Welling de l’université d’Amsterdam ont appliqué l’idée des réseaux neuronaux convolutifs (CNN : Convolutional Neural Network en anglais) aux bases de données orientées graphes. Ils ont ainsi introduit une nouvelle approche pour la classification semi-supervisée. Contrairement aux réseaux de neurones traditionnels qui fonctionnent avec des données de type tableau, les réseaux neuronaux graphiques (GNN : Graph Neural Network en anglais) sont conçus pour explorer les données structurées sous forme de graphes. Chaque nœud d’un graphe est associé à un vecteur de caractéristique qui capture ses attributs. Le GNN met à jour ces plongements en agrégeant les informations provenant des nœuds et des arêtes voisines.
Mais pourquoi avons-nous besoin des GNN ?
Essentiellement, les GNN permettent d’utiliser la richesse des données relationnelles présentes dans les graphes pour prédire, détecter des tendances et obtenir des informations à partir des systèmes complexes. En outre, les GNN consentent à exploiter les rapports entre les objets, souvent aussi importants que les données elles-mêmes. Toutefois, plusieurs enjeux majeurs restent à lever afin de faire adopter ces technologies dans le secteur industriel.
En effet, malgré leurs performances, l’adoption des GNN subsiste plus complexe que celle d’autres modèles pour plusieurs raisons. Tout d’abord, la forte dépendance à la qualité des graphes peut empêcher d’obtenir des résultats pertinents. En outre, les pipelines de données sont beaucoup plus lourds, ce qui rend l’intégration plus difficile dans les architectures existantes dans les industries. La maturité des outils progresse, mais ceci reste un enjeu clé sur lequel les multiples acteurs sont en train de travailler.
Un défi historique des GNN est leur coût de computation élevé sur les graphes de grande taille. Les innovations récentes portent donc sur des techniques de sampling plus intelligentes, la parallélisation et l’entraînement distribué, la séparation calcul graphe/calcul neuronal, et l’inférence rapide à grande échelle (Web-Scale graphs). Ces avancées rapprochent les GNN d’un usage industriel à grande échelle.
Enfin, les GNN sont souvent perçus comme des boîtes noires relationnelles, ainsi que leurs homologues CNN et les réseaux neuronaux en général. Or, dans des domaines sensibles (santé, finance, sciences), les entreprises travaillent pour expliquer quels rapports influencent une prédiction, comprendre les biais structuraux des graphes, et garantir la robustesse aux perturbations. L’Explainable AI pour graphes reste un champ de recherche très actif.
Plusieurs études ont évalué le marché mondial des réseaux neuronaux graphiques à 320 millions de dollars en 2024. D’ici 2030, il devrait atteindre 1,65 milliard de dollars, avec un taux de croissance annuel composé de 31,2 % sur la période de prévision.
L’essor rapide des applications d’intelligence artificielle basées sur les graphes dans tous les secteurs, notamment la détection des fraudes, la découverte de médicaments et les systèmes de recommandation, ne fait qu’alimenter cette expansion. En effet, les innovations récentes (architectures plus expressives, hybridation avec les Transformers, apprentissage autosupervisé et modèles dynamiques) repoussent les limites théoriques et pratiques des réseaux neuronaux graphiques. Cela fait que les entreprises choisissent de plus en plus les GNN pour extraire des informations relationnelles à partir de données complexes et interconnectées.
Un autre facteur entraînant cette prévision est l’augmentation des investissements dans la recherche en IA, combinée à l’intégration des GNN dans les outils d’IA commerciaux et les plateformes cloud, qui accélère leur validation à grande échelle. Face à la demande croissante de solutions d’analyse avancées, les GNN sont prêts à être déployés massivement dans de nombreux cas d’usage.
Cependant, des défis importants subsistent en termes de scalabilité et d’interprétabilité afin que la technologie soit adoptable à un niveau industriel. Les études actuelles montrent une tendance claire : faire des GNN des modèles génériques, robustes et exploitables à grande échelle, capables de raisonner sur des systèmes complexes et relationnels.
Malgré l’introduction récente des GNN, et comme démontrée par les forts investissements dans le secteur, plusieurs axes d’innovation sont ouverts et plusieurs entreprises se lancent dans des travaux de recherche et développement sur cette technologie.
Un axe d’exploration majeur concerne la puissance de représentation des GNN. Les premiers modèles (GCN, GraphSAGE, GAT) reposaient sur des mécanismes d’agrégation locale relativement simples. En effet, le paradigme dominant (Message Passing) avait montré ses limites en termes d’expressivité. Les travaux récents cherchent à augmenter l’expressivité des GNN au-delà du test de Weisfeiler-Lehman (WL), à capturer des systèmes graphiques complexes (cycles, motifs, sous-graphes), et à améliorer la distinction entre graphes similaires.
Afin d’atteindre ces objectifs, les scientifiques ont suggéré plusieurs approches notables, comme les Higher-Order GNN, où les modèles sont basés sur des hypergraphes, graphes de lignes ou graphes simpliciaux. D’autres opérations ont développé les Subgraph GNN, qui apprennent à partir de sous-structures locales. Enfin, une nouvelle démarche propose le Message Passing enrichi, qui intègre plus d’information contextuelle dans les messages.
Un autre développement très actif est la convergence entre les GNN (efficaces sur les hiérarchies relationnelles) et les Transformers, qui dominent en NLP et Computer Vision. Cette convergence s’est traduite par des Graph Transformers, qui utilisent des mécanismes d’attention globale, par l’introduction d’encodage structurel et par une meilleure modélisation des interactions à longue portée dans les graphes. Cette hybridation vise à dépasser la limite classique des GNN, souvent restreints à un voisinage local, tout en contrôlant la complexité de calcul.
Inspiré par le succès du self-Supervised Learning en NLP et en vision, le préentraînement sur graphes est devenu un axe central. Les innovations majeures incluent des travaux prétextes (prédiction de nœuds masqués, reconstruction de graphes), des approches contrastives entre vues de graphes, et des représentations transférables entre tâches et domaines. L’objectif visé par cet axe est de réduire la dépendance aux données annotées, qui sont souvent coûteuses ou rares dans les graphes réels, selon le champ d’application (chimie, biologie, etc.).
Un quatrième axe d’innovation très important est celui des graphes dynamiques. En effet, beaucoup de graphes réels dépendent du temps, par exemple les réseaux sociaux évolutifs, les graphes de transactions ou les interactions biologiques. Les travaux de recherche portent donc sur les Temporal GNN, qui intègrent explicitement le temps, mais aussi sur la modélisation d’événements discrets et continus, avec la prise en compte de la causalité et de la chronologie. Ces nouveaux modèles permettent de mieux répondre à des tâches comme la prédiction de phénomènes futurs ou la détection d’anomalies.
Les porteurs de projets R&D peuvent bénéficier de plusieurs aides de financement. L’une des plus intéressantes sur le sujet des GNN est le dispositif « Pionniers de l’IA » de Bpifrance. Ce dispositif a pour ambition de soutenir des opérations de R&D à fort potentiel de rupture technologique, capables de générer un impact durable sur l’économie et de contribuer à la souveraineté nationale grâce à des innovations en IA. À savoir, pour la phase 1 de « Pionniers de l’IA », la part de subvention est de 100 %. Elle est de 50 % au maximum pour les entreprises et de 100 % pour les établissements de recherche, pour les phases 2 et 3.
Un deuxième appel à projets est celui d’Horizon Europe, qui a pour but d’accélérer la découverte des molécules chimiques et des matériaux avancés à l’aide de l’intelligence artificielle et de la digitalisation. Plus en général, au niveau européen, le programme Horizon Europe constitue un levier majeur. Doté d’un budget de 95,5 milliards d’euros pour la période 2021–2027, il finance des opérations de recherche et d’innovation dans tous les domaines.
Parmi les appels à projets plus génériques, il y a également France 2030 : ce plan d’investissement massif, piloté par le Secrétariat général pour l’investissement (SGPI), consacre plusieurs milliards d’euros à l’IA. Il subventionne entre autres des projets sur les technologies numériques, afin de promouvoir la souveraineté numérique avec l’IA. Les appels à projets sont portés par Bpifrance, l’ADEME ou l’ANR, et couvrent aussi bien la recherche fondamentale que l’industrialisation.
Parmi les innovations marquantes de ces dernières années, les GNN ont joué un rôle majeur dans la découverte d’une nouvelle molécule, réalisée par les scientifiques des universités Westlake et Zhejiang de Hangzhou, en Chine. Historiquement, dans le secteur de la découverte des médicaments, les experts décrivaient une molécule comme un vecteur de « features » (fingerprints chimiques) ou comme une chaîne (SMILES). Cependant, ces représentations perdent une partie de la structure réelle, et ne consentent pas à exploiter complètement les informations contenues dans la molécule elle-même. Or, les GNN ont permis d’effectuer un changement de paradigme, passant de la « molécule comme vecteur » à la « molécule comme graphe ». Les atomes incarnant les nœuds et les liaisons chimiques les arêtes, la structure chimique devient le modèle et pas une simple approximation.
En chimie, cela constitue une innovation particulièrement forte, car cela crée un alignement parfait avec la physique du problème : les GNN respectent les relations locales et capturent les impacts globaux. Contrairement à ce qui advient avec les CNN ou le MLP, les GNN ne forcent pas la structure, mais apprennent des connexions complexes, des effets à longue distance et du contexte chimique. En outre, les GNN traitent dans un même cadre la prédiction de propriétés (comme la toxicité et la solubilité), l’interaction protéine-ligand, la génération de molécules et l’optimisation de médicaments admissibles. Le fait que le GNN représente le moteur central du pipeline est donc une innovation clé mise en avant par cette étude, qui montre que cette technologie demeure puissante et prometteuse.
Depuis les premières intuitions de Léonard Euler au XVIIIᵉ siècle jusqu’aux architectures neuronales les plus avancées du XXIᵉ siècle, les graphes apparaissent comme un fil conducteur discret, mais fondamental de l’histoire des sciences. Les réseaux neuronaux graphiques s’inscrivent pleinement dans cette continuité : ils constituent moins une rupture qu’un aboutissement, en permettant enfin d’examiner de manière unifiée la structure, la dynamique et la sémantique des systèmes complexes.
En offrant un cadre mathématique et algorithmique capable d’exploiter simultanément les entités et leurs relations, les GNN ont profondément renouvelé la façon dont l’IA aborde des domaines difficiles à modéliser. Leur habileté à traiter les données non euclidiennes, à capturer des dépendances locales et globales, et à s’adapter à des graphes dynamiques les rend aujourd’hui l’un des piliers les plus prometteurs de l’IA moderne.
En définitive, les réseaux neuronaux graphiques ne doivent pas être considérés comme une simple spécialisation du Deep Learning, mais plutôt une brique fondatrice de l’IA de demain, susceptible de raisonner sur des mondes complexes, interconnectés et en constante évolution. De même que le problème des ponts de Königsberg, les défis actuels de nos sociétés restent profondément relationnels. En conséquence, les graphes, et donc les GNN, se trouvent naturellement au cœur des outils appelés à les comprendre et à les transformer.
Structurer et valoriser votre RSE pour anticiper les exigences à venir
Aussi