Deformulação química preditiva vira o desafio da formulação

Andrea Jacobs , Senior Manager, CAS Product Management

photo of bottles depicting cosmetic formulations

A deformulação é o processo de determinação da composição precisa de produtos conhecidos. Partindo de proporções relativas conhecidas de ingredientes, quantidades precisas de cada ingrediente são determinadas. A deformulação também é conhecida como engenharia reversa química. 

A deformulação de produtos químicos permite que as organizações:

  • extrapolem novas receitas a partir de formulações existentes;
  • melhorem a inteligência competitiva;
  • criem parâmetros de referência para produtos competitivos;
  • identifiquem falsificações;
  • desenvolvam produtos de marca própria.

Embora os pesquisadores tenham se voltado para o aprendizado de máquina para a descoberta e otimização de produtos químicos e materiais, a deformulação geralmente é realizada experimentalmente, com a ajuda de métodos de química analítica. A quantidade relativamente limitada de dados estruturados disponíveis para formulações químicas dificulta muitos esforços de deformulação impulsionados por IA. Muitos dos dados de formulação amplamente disponíveis são incompletos e inconsistentes em seus registros de ingredientes e suas quantidades. 

Treinando modelos preditivos para permitir sugestões rápidas com base em dados de receitas de formulação 

A publicação Industrial Engineering Chemistry Research, Toward Predictive Chemical Deformulation Enabled by Deep Generative Neural Networks, mostra que é possível treinar modelos generativos não supervisionados, autoencoders variacionais (VAEs), para permitir sugestões rápidas baseadas em dados de receitas de formulação. 

A rede neural VAE treinada com dados de formulação curados por cientistas do CAS aprende representações significativas de formulações em várias classes de produtos, como antitranspirantes e cuidados bucais, que tiveram melhor desempenho, em média, do que as abordagens mais convencionais. O artigo afirma que esta abordagem "produz estimativas significativamente mais precisas do que os métodos do concorrente mais próximo, extrapola melhor para formulações significativamente diferentes daquelas vistas anteriormente e fornece uma maneira de alavancar grandes conjuntos de dados para recursos industrialmente relevantes".  

As formulações selecionadas no CAS Content Collection™ oferecem representações consistentes e altamente estruturadas das formulações e identidades químicas dos seus componentes. Devido a processos de curadoria exclusivos, que utilizam tecnologias especializadas e conhecimento científico, o CAS pode identificar consistentemente os componentes químicos de cada formulação, seus agrupamentos e suas quantidades. Os autores relatam que “sem o conjunto de dados do CAS, a validação prática desses métodos generativos para aplicações de deformulação não teria sido possível”.

Explore essas descobertas na publicação: "Toward Predictive Chemical Deformulation Enabled by Deep Generative Neural Networks".

Quer obter previsões de deformulação mais precisas? O CAS Custom Services adapta nossas tecnologias especializadas, conhecimento científico e conteúdo inigualável para atender às suas necessidades exclusivas.