Exploration de l'apprentissage machine dans la chimie : tendances et opportunités

Zach Baum , Information Scientist, CAS

machine learning hero image

Au cours des 20 dernières années, les progrès de l'intelligence artificielle (IA), en particulier de l'apprentissage machine, ont transformé notre approche de la recherche scientifique. De la cartographie des séquences du génome et de la découverte de nouveaux antibiotiques à la modélisation des impacts du changement climatique sur la terre et même à la cartographie de la galaxie pour rechercher des planètes similaires à la terre, l'IA transforme la recherche dans une multitude de disciplines.

La chimie est l'un de ces domaines de la science qui progressent à grands pas dans l'adoption de l'IA. Notre tout dernier livre blanc, « L'intelligence artificielle en chimie : panorama actuel et opportunités futures », explore le lien entre l'IA et la chimie en utilisant nos propres technologies pour cartographier les paysages des publications et des brevets. Nous avons découvert les domaines de la chimie qui sont en pointe dans l'IA et ceux qui ont le plus fort potentiel d'être dynamisés par l'adoption de la technologie de l'intelligence artificielle.

Dans quels domaines de la chimie l'IA a-t-elle progressé ?

Le nombre de publications et de brevets de chimie impliquant l'IA a explosé et a été multiplié par six au cours de la période 2015 - 2020. Nous avons identifié les principales disciplines qui contribuent aux publications et aux brevets liés à l'IA et les avons comparées pour comprendre quels domaines profitent de cette technologie émergente. Les disciplines de pointe dans l'adoption de l'IA comprennent la chimie analytique, la biochimie, la chimie industrielle et le génie chimique, tandis que les domaines qui devraient adopter l'IA englobent la chimie des produits naturels et la chimie organique (figure 1).

Affichage multi-graphique présentant les disciplines de la chimie qui utilisent l'apprentissage machine
Figure 1 : Pourcentage le plus élevé des publications liées à l'IA parmi toutes les disciplines

Nous avons exploré les relations entre ces publications et les brevets de 2000 à 2020 pour comprendre en quoi l'utilisation de l'IA a aidé les chercheurs à résoudre des problèmes (figure 2). Par exemple, du début des années 2000 à 2014, la cible des publications et des brevets concernant l'IA est passée de l'exploration des diagnostics de maladie chez les humains aux algorithmes génétiques et à leur application à la découverte de médicaments et aux micro-ARN.

Récemment, alors que les types de problèmes nécessitant des solutions ont changé, les publications et les brevets se sont davantage orientés vers la méthylation de l'ADN et le cancer. Plus récemment encore, l'accent s'est orienté vers la découverte de médicaments liés à la COVID-19.

Ligne chronologique illustrant l'évolution des concepts concomitants dans les publications de revues de chimie liées à l'IA de 2000 à 2020.
Figure 2 : Évolution des concepts concomitants dans les publications de revues de chimie liées à l'IA de 2000 à 2020

Il n'est pas surprenant de noter que notre recherche a également révélé que les petites molécules étaient l'élément le plus important dans les publications et les brevets concernant l'IA qui ont été analysés. Cela englobe des sujets liés à la découverte de médicaments, à la rétrosynthèse et à l'optimisation des réactions, reflétant les pays où les investissements des laboratoires pharmaceutiques sont les plus importants.

Où sont les opportunités d'apprentissage machine en chimie ?

Dans notre analyse de plus de 70 000 publications, nous avons examiné les contributions interdisciplinaires, en notant les disciplines primaires et secondaires (figure 3). Cela nous a permis de tracer chaque discipline sur une carte thermique sur laquelle l'intensité des couleurs reflète la force de la contribution pour chaque discipline. En un coup d'œil, on peut voir les domaines d'étude en chimie qui sont en pointe avec l'IA et ceux qui n'ont pas encore pleinement atteint leur potentiel.

Graphique présentant une carte thermique des disciplines primaires et secondaires qui utilisent l'intelligence artificielle dans leurs processus.
Figure 3 : Prévalence relative des études interdisciplinaires publiées dans des articles de revues (les colonnes indiquent les domaines de recherche primaires, les lignes désignent les domaines de recherche secondaires et chaque carré indique une paire interdisciplinaire de domaines de recherche principal et secondaire)

Par exemple, les publications multidisciplinaires sont plus courantes en chimie analytique et en biochimie, où les algorithmes d'apprentissage machine sont utilisés pour améliorer l'analyse des protéines, des peptides, des lipides et des acides nucléiques, ainsi que pour prévoir les réactions chimiques et même découvrir de nouvelles molécules. L'IA est aussi largement utilisée dans la science des matériaux et la chimie physique, où les deux disciplines visent à prédire les matériaux fonctionnels, les relations entre structure et propriétés et l'optimisation des processus chimiques.

Les obstacles à l'adoption de l'IA en chimie

Les experts de premier plan ont discuté des obstacles potentiels à l'adoption de l'IA dans notre webinaire, l'intelligence artificielle en chimie : tendances actuelles et opportunités futures. Ils ont identifié trois obstacles clés à l'adoption de l'IA en chimie :

Qualité des données : les prédictions optimales dépendent de jeux de données robustes et de haute qualité qui fournissent à la fois des exemples positifs et négatifs pour l'entraînement. L'accès, la normalisation et la préparation des données est un défi significatif aujourd'hui pour de nombreuses organisations.

Technologie : malgré les améliorations apportées à la puissance de calcul (approches quantiques et cloud), les utilisateurs perçoivent encore des limites. Toutefois, les progrès récents dans les logiciels et les interfaces utilisateurs suppriment les exigences de programmation pour permettre à davantage de scientifiques d'utiliser l'apprentissage machine dans leurs recherches.

Pénurie de talents : la science des données souffre d'une pénurie de talents bien documentée, et les chimistes ne comprennent peut-être pas toujours à quel point l'IA est devenue abordable. La collaboration croissante entre la chimie et les autres disciplines scientifiques peut contribuer à accélérer l'intégration de l'IA.

Une opportunité de croissance de l'apprentissage machine en chimie

L'IA et les jeux de données d'entraînement sont utilisés pour résoudre les problèmes et innover dans les institutions scientifiques du monde entier en présentant une opportunité majeure pour l'analyse des données et la découverte de médicaments.

Notre livre blanc récent décrivait plusieurs domaines de la chimie susceptibles de bénéficier des investissements dans la technologie de l'IA. Les obstacles à l'adoption n'ont jamais été aussi faibles et les partenaires comme CAS peuvent favoriser l'accès à de vastes jeux de données de qualité pour réaliser des analyses. Il est possible de résoudre certains des problèmes les plus pressants et d'effectuer de grands pas en avant au-delà de ce qui est possible avec l'analyse des données traditionnelle par le biais de l'intégration de l'intelligence artificielle à la recherche scientifique.

Découvrez l'intégralité de notre analyse et les enseignements que nous en avons tirés en lisant notre livre blanc ou contactez-nous pour savoir comment l'IA peut favoriser vos activités de recherche.