AI와 머신러닝 모델은 역합성 계획에 도움을 주지만, 학습 데이터에 의해 제한을 받습니다. 주요 종합 계획 이니셔티브를 최적화하는 데 필요한 데이터의 다양성과 품질을 확보하여 새로운 예측을 생성하는 방법에 대해 알아보세요.
기존 약물 분자의 진화는 신약 개발의 혁신 초석이 되어 왔습니다. 그러나 미래를 내다볼 때 구조적으로 새로운 저분자가 기존 약물을 개량한 것보다 더 가치 있는 치료제로 입증될 수 있습니다. 2020년에 승인된 저분자 의약품 중 65%가 구조적으로 새로운 것으로, 이러한 분자는 FDA에서 획기적인 치료제로 지정될 가능성이 2.5배, 출시 후 5년 이내에 블록버스터 의약품이 될 가능성이 2배 더 높습니다.
하지만 새로운 분자를 합성하는 것은 결코 쉬운 일이 아닙니다. 역합성 예측 도구는 새로운 접근 방식을 설계하고 생산 효율성을 최적화하는 데 필수적인 요소가 되고 있습니다. 이러한 도구는 전 세계의 최신 연구를 체계적으로 활용하여 시장 출시 기간을 단축할 수 있도록 지원합니다. 가격이나 공급업체와 같은 특정 제약 조건이 있는 분자를 구축하여 개발 파이프라인 전반의 비용을 절감할 수도 있습니다.
화학 합성에 AI를 성공적으로 적용하려면 데이터 품질과 다양성에 의해 제한되며, 데이터 품질과 다양성이 부족하면 예측 정확도가 떨어집니다. 이는 최근 Bayer이 새로운 저분자 물질의 재합성을 위해 AI를 최적화하고자 했던 협업에서 입증된 바 있습니다. 고품질의 다양한 반응 데이터로 기존 학습 세트를 강화함으로써 희귀 반응 클래스에 대한 예측 정확도를 32% 포인트 향상시킬 수 있었습니다.
다양하고 정확한 데이터로 AI 모델의 성공 견인
화학 합성 계획에서 목표는 가능한 한 다양하고 정확한 합성 경로 세트를 생성하는 것입니다. 하지만 AI 응용 부문은 기반 데이터만큼만 좋은 성능을 발휘합니다. 예측력은 학습 데이터의 품질, 다양성, 정확도에 따라 달라집니다. 핵심 과제는 데이터 다양성입니다. 학습 데이터가 공통 화학 외에 드문 화학 부분 공간을 대표하지 않는다면, AI 응용 부문은 범위와 참신성 측면에서 제한된 결과를 제공할 수 있기 때문입니다.

CAS Reactions은 합성 계획의 예측력에 큰 영향을 미칠 수 있는 다양한 반응 데이터를 제공합니다. 지난 10년 동안 크기가 두 배 이상 증가한 이 컬렉션은 전 세계의 특허, 학술지 및 과학적 간행물에서 가장 강력하고 상세한 화학 정보를 엄선합니다. 이 큐레이션은 현재 진행 중이며 머신러닝과 함께 AI 합성 계획을 강화하고 강화하기 위해 계속되고 있습니다.
Bayer과 CAS, 보다 효율적인 신약 개발을 위해 AI 활용 극대화 협력
Bayer과 CAS의 협업으로 광범위한 머신러닝 학습 세트에 희귀 반응 유형을 대상으로 하는 CAS 데이터를 보강하여 신약 개발 AI 모델의 예측력을 획기적으로 향상시켰습니다.
이 모델은 예측된 반응 단계의 성공 가능성을 추정하는 신경망으로 구성된 실행 가능성 필터로 구성되었습니다. 네트워크는 알려진 반응의 데이터 세트와 주로 이론적으로 실패한 반응의 데이터 세트로 학습되었습니다. 생존율 필터의 예측 기능을 정량화하기 위해 CAS 데이터로 추가 학습 데이터 세트를 만들었습니다. CAS의 반응을 추가하여 희귀 반응 클래스의 정확도가 16%에서 48%로 32% 포인트 증가했습니다.
생존율 필터 정확도가 향상되면 파이프라인에서 배가 효과가 발생하여 사용 가능한 반응의 비율이 높아집니다. 이렇게 향상된 예측력은 이전에는 예측 모델에서 다루지 않았던 '희귀' 카테고리를 열어 저분자 신약 개발의 그늘진 영역에 빛을 비추는 새로운 결과를 제공합니다.
이 연구는 과학자가 선별한 CAS Content CollectionTM의 적당한 크기의 반응 세트만으로도 합성 계획 도구의 예측력을 크게 향상시킬 수 있음을 보여줍니다. 이러한 효과는 일부 반응 클래스에서만 나타났으며, 모든 템플릿에 걸쳐 강력하고 고품질의 다양한 데이터로 기본 학습 세트를 더욱 보강하면 예측력이 훨씬 더 높아질 수 있음을 시사합니다. 이 인상적인 개념 증명은 특히 새로운 저분자 약물 표적을 보다 효율적으로 발견하는 데 폭넓게 응용될 수 있습니다.
- Pistoia Alliance 가상 컨퍼런스에서 CAS의 Yugal Sharma 박사와 Bayer의 Martin Villalba 박사의 최근 프레젠테이션을 확인하세요.
- '새로운 화학 반응 예측: 고품질 학습 데이터가 반응 결과 예측에 미치는 영향' 백서를 다운로드하세요.
CAS는 결과를 최적화할 수 있습니다
CAS Custom ServicesSM은 머신러닝 작업을 지원하는 학습 데이터 세트를 설계할 수 있습니다. 요구 사항을 논의하고 예측 정확도를 개선하려면 저희 팀에 문의하세요.
