Modelos de IA e de aprendizado de máquina ajudam no planejamento retrossintético, mas ficam limitados pelos dados de treinamento que analisaram. Continue lendo para saber mais sobre as maneiras de gerar novas previsões, garantindo que seus dados tenham a diversidade e a qualidade necessárias para otimizar as principais iniciativas de planejamento sintético.
A evolução das moléculas de medicamentos existentes tem sido o pilar da inovação na descoberta de medicamentos. No entanto, à medida que olhamos para o futuro, pequenas moléculas estruturalmente originais podem se revelar terapias mais valiosas do que adaptações de medicamentos atuais. Com 65% dos medicamentos de pequenas moléculas aprovados em 2020 sendo estruturalmente inovadores, essas moléculas têm 2,5 vezes mais probabilidade de serem designadas como terapias inovadoras pela FDA e 2 vezes mais probabilidade de se tornarem medicamentos de grande sucesso comercial em até 5 anos após o lançamento.
Porém, sintetizar novas moléculas não é uma tarefa fácil. As ferramentas de previsão retrossintética estão se tornando vitais para o design de novas abordagens e otimização da eficiência da produção. Essas ferramentas aproveitam sistematicamente pesquisas atualizadas de todo o mundo para possibilitar resultados mais rápidos no mercado. A redução de custos em todo o pipeline de desenvolvimento também pode ser obtida com a criação de moléculas com restrições específicas, como preço ou fornecedores.
A aplicação bem-sucedida da IA à síntese química é limitada pela qualidade e diversidade dos dados, cuja falta dificulta a exatidão da previsão. Isso ficou demonstrado em nossa recente colaboração, na qual a Bayer buscava otimizar o uso de IA para a retrossíntese de novas moléculas pequenas. Ao enriquecer seu conjunto de treinamento existente com nossos dados de reações diversificados e de alta qualidade, conseguimos ajudar a melhorar a precisão das previsões geradas para classes de reação raras em 32 pontos percentuais.
Dados diversos e precisos impulsionam o sucesso do modelo de IA
No planejamento da síntese química, o objetivo é gerar conjuntos de rotas sintéticas tão diversas e precisas quanto possível. No entanto, as aplicações de IA são tão boas quanto os dados subjacentes. O poder preditivo depende da qualidade, diversidade e precisão dos dados de treinamento. Um desafio importante é a diversidade de dados, porque se os dados de treinamento não representarem subespaços químicos pouco povoados, além da química comum, a plicação de IA fornecerá resultados limitados em termos de escopo e originalidade.

O CAS Reactions oferece uma gama diversificada de dados de reação que podem impactar significativamente o poder preditivo do planejamento de síntese. A coleção, que mais que dobrou de tamanho nos últimos 10 anos, reúne as informações químicas mais robustas e detalhadas de patentes, periódicos e publicações científicas de todo o mundo. Essa curadoria está em andamento e continua em sintonia com o aprendizado de máquina para capacitar e enriquecer o planejamento de síntese da IA.
A Bayer e a CAS colaboram para maximizar a IA para tornar a descoberta de medicamentos mais eficiente
Em uma colaboração entre a Bayer e a CAS, um amplo conjunto de treinamento de aprendizado de máquina foi enriquecido com dados da CAS direcionados a tipos raros de reação, aumentando drasticamente o poder preditivo do modelo de IA para a descoberta de medicamentos.
O modelo é composto por um filtro de viabilidade que consiste em uma rede neural que avalia se uma etapa de reação prevista tem probabilidade de ser bem-sucedida. A rede foi treinada sobre um conjunto de dados de reações conhecidas e um conjunto predominantemente teórico de reações com falha. Foi criado um conjunto de dados de treinamento adicional com dados da CAS para quantificar a capacidade preditiva do filtro de viabilidade. A adição das reações da CAS aumentou a precisão em classes de reações raras de 16% para 48%, um aumento de 32 pontos percentuais.
As melhorias na precisão do filtro de viabilidade têm um efeito multiplicador no pipeline, criando uma taxa mais alta de reações utilizáveis. Esse poder preditivo aprimorado abre categorias "raras" que anteriormente escapavam aos modelos preditivos, contribuindo com novos resultados que iluminam as áreas sombreadas da descoberta de medicamentos de pequenas moléculas.
Este estudo demonstra que mesmo um conjunto de tamanho médio de reações selecionadas por cientistas da CAS Content CollectionTM pode melhorar significativamente o poder preditivo de uma ferramenta de planejamento de síntese. Esse efeito foi observado em apenas uma pequena classe de reações, sugerindo que um poder preditivo ainda maior será visto com novos acréscimos ao conjunto de treinamento de base com dados fortes, de alta qualidade e diversos em todos os modelos. Esta impressionante prova de conceito tem amplas aplicações, principalmente para uma descoberta mais eficiente de novos alvos de medicamentos de moléculas pequenas.
- Veja a recente apresentação do Dr. Yugal Sharma, da CAS, e do Dr. Martin Villalba, da Bayer, na Conferência Virtual Pistoia Alliance
- Baixe o relatório técnico: Previsão de novas reações químicas: o impacto de dados de treinamento de alta qualidade na previsão dos resultados das reações
O CAS pode otimizar seus resultados
O CAS Custom ServicesSM pode projetar conjuntos de dados de treinamento para potencializar seus esforços de aprendizado de máquina. Entre em contato com nossa equipe para discutir suas necessidades e melhorar a precisão de suas previsões.
