Explorando o aprendizado de máquina em química: tendências e oportunidades

Zach Baum , Information Scientist, CAS

machine learning hero image

Nos últimos 20 anos, os avanços em inteligência artificial (IA), mais especificamente o aprendizado de máquina, transformaram a maneira como abordamos a pesquisa científica. A IA está transformando a pesquisa em várias disciplinas, seja no mapeamento de sequências genômicas, na descoberta de novos antibióticos, passando pela modelagem dos impactos das mudanças climáticas na Terra e até o mapeamento da galáxia em busca de outros planetas semelhantes à Terra.

A química é uma das áreas da ciência que está dando grandes saltos na adoção da IA. Nosso relatório técnico mais recente, “Inteligência artificial na química: cenário atual e oportunidades futuras”, explora a conexão entre a IA e a química usando nossas próprias tecnologias para mapear cenários de publicações e patentes. Descobrimos as áreas da química que estão liderando o campo com IA e outras, com grande potencial ainda ser desbravado pela adoção da tecnologia de IA.

Onde cresceu a IA na química?

O número de publicações e patentes de química envolvendo IA explodiu, com um aumento de seis vezes observado no período de 2015 a 2020. Identificamos as principais disciplinas que contribuíram para publicações e patentes relacionadas à IA e as comparamos para entender quais áreas estão capitalizando essa tecnologia emergente. Dentre as disciplinas que lideram a adoção de IA estão a química analítica, a bioquímica, a química industrial e a engenharia química, enquanto as áreas com oportunidade para adoção de IA incluem produtos naturais e química orgânica (Figura 1).

Exibição de um multigráfico mostrando disciplinas de química que usam aprendizado de máquina
Figura 1: Maior porcentagem de publicações relacionadas à IA entre todas as disciplinas

Exploramos as relações entre essas publicações e patentes de 2000 a 2020 para entender como o uso da IA ajudou os pesquisadores a resolver problemas (Figura 2). Por exemplo, entre o início dos anos 2000 e 2014, o foco das publicações e patentes de IA mudou. Em vez de explorar diagnósticos de doenças em humanos, ele passou para algoritmos genéticos e a aplicação deles à descoberta de medicamentos e microRNA.

Mais recentemente, à medida que os tipos de problemas que precisam de solução mudaram, as publicações e patentes mudaram sua direção para a metilação do DNA e o câncer. E ainda mais recentemente, o foco tem se voltado para a descoberta de medicamentos relacionados à covid-19.

Linha do tempo que mostra a evolução de conceitos coocorrentes em publicações de revistas de química relacionadas à IA dos anos de 2000 a 2020
Figura 2: a evolução de conceitos coocorrentes em publicações de revistas de química relacionadas à IA de 2000 a 2020

Não é nenhuma surpresa que nossa pesquisa também identificou que pequenas moléculas foram o maior foco das publicações e patentes de IA analisadas. Elas abrangem tópicos na descoberta de medicamentos, retrossíntese e otimização de reações, refletindo onde normalmente há mais investimento de empresas farmacêuticas.

Onde estão as oportunidades de aprendizado de máquina em química?

Em nossa análise de mais de 70.000 publicações, analisamos as contribuições interdisciplinares, observando as disciplinas primárias e secundárias (Figura 3). Isso nos permitiu traçar cada disciplina em um mapa de calor, onde a intensidade da cor reflete a força da contribuição de cada disciplina. De imediato podemos ver as áreas de estudo na química que estão liderando o caminho com a IA e as com potencial não realizado.

Gráfico que mostra mapa de calor de disciplinas primárias e secundárias usando inteligência artificial em seus processos
Figura 3: prevalência relativa de estudos interdisciplinares publicados em artigos de periódicos (as colunas indicam áreas de pesquisa primárias, linhas indicam áreas de pesquisa secundárias e cada quadrado indica um par interdisciplinar de áreas de pesquisa primárias e secundárias)

Por exemplo, publicações multidisciplinares são mais comuns em química analítica e bioquímica, onde algoritmos de aprendizado de máquina estão sendo usados para melhorar a análise de proteínas, peptídeos, lipídios e ácidos nucleicos, bem como prever reações químicas ou até mesmo descobrir novas moléculas. A IA também está sendo amplamente utilizada na ciência dos materiais e na físico-química, onde as duas disciplinas visam prever materiais funcionais, relações estrutura-propriedade e otimização de processos químicos.

As barreiras para a adoção da IA na química

Os principais especialistas discutiram as possíveis barreiras à adoção da IA em nosso webinar, Inteligência Artificial em Química: Tendências Atuais e Oportunidades Futuras.  Eles identificaram três principais barreiras para a adoção da IA na química:

Qualidade dos dados: as previsões ideais dependem de conjuntos de dados robustos e de alta qualidade que fornecem exemplos positivos e negativos para treinamento. Acessar, normalizar e preparar os dados é um desafio significativo hoje para muitas organizações.

Tecnologia: embora estejam sendo feitas melhorias em relação à potência computacional (abordagens quânticas e baseadas em nuvem), os usuários ainda acham que há limitações. No entanto, os avanços em software e interfaces de usuário hoje removem a necessidade de programação para permitir que mais cientistas utilizem o aprendizado de máquina em suas pesquisas.

Escassez de talentos: a ciência de dados tem uma escassez de talentos bem documentada e os químicos podem não entender como a IA é acessível hoje. O aumento da colaboração entre a química e outras disciplinas científicas pode ajudar a acelerar a integração da IA.

Uma oportunidade para o crescimento do aprendizado de máquina em química

Estão sendo usados conjuntos de dados de IA e treinamento para resolver problemas e inovar em instituições científicas em todo o mundo, apresentando uma oportunidade significativa para a análise de dados e descoberta de medicamentos.

Nosso relatório técnico recente descobriu várias áreas da química que podem se beneficiar do investimento em tecnologia de IA. As barreiras à adoção nunca foram tão baixas e parceiros, como o CAS, podem ajudar no acesso a grandes conjuntos de dados de qualidade para análise. É possível resolver alguns dos problemas mais urgentes e dar grandes passos além do que seria factível com a análise de dados tradicional por meio da incorporação de inteligência artificial à pesquisa científica.

Saiba tudo sobre nossa análise e os insights que descobrimos lendo nosso relatório técnico ou entre em contato com o CAS se tiver alguma dúvida sobre como a tecnologia de IA pode apoiar sua pesquisa.