Predizendo a nova química: impacto dos dados de treinamento de alta qualidade na previsão dos resultados da reação

Predicting New Chemistry White Paper thumbnail

Os modelos de aprendizado de máquina que apoiam aplicações de planejamento de síntese são amplamente limitados à química vista no treinamento, e a precisão e a diversidade de suas previsões geralmente são diminuídas em subespaços químicos escassamente povoados. Ao medir como diferentes conjuntos de dados afetam o desempenho de modelos treinados, podemos fazer afirmações mais robustas sobre a cobertura esperada e a originalidade das soluções de planejamento de síntese e projetar conjuntos de dados que abrirão as portas de áreas da ciência que antes eram difíceis. 

Neste estudo, os cientistas da Bayer demonstram o impacto significativo que as reações, com curadoria feita por cientistas, do CAS Content Collection têm sobre o poder preditivo de um modelo de planejamento de síntese. A precisão na previsão de resultados em classes de reações raras aumentou significativamente – um aumento de 32 pontos percentuais – expandindo a compreensão para uma química nova e útil.

Capa do relatório técnico Predizendo a nova química

Solicite o relatório do CAS Insights ou entre em contato com nossa equipe de Custom Services para projetar um conjunto de dados que abra as portas de áreas desafiadoras da ciência.

O Relatório do CAS Insights foi publicado em colaboração com cientistas da Bayer.

Autores:

  • Miriam Wollenhaupt, Ph.D., Química computacional, Bayer AG
  • Martín Villalba, Ph.D., Especialista em Matemática Aplicada, Bayer AG
  • Orr Ravitz, Ph.D., Soluções de planejamento de síntese, CAS