과학분야 인공지능(AI)은 과학적 발견을 근본적으로 변화시키고 있습니다. 대규모 데이터 세트를 분석할 수 있는 대형 언어 모델(LLM), 신경망, 생성형 AI, 머신러닝의 능력 덕분에 인간 연구자만으로 할 수 있는 것보다 더 많은 정보를 그 어느 때보다 짧은 시간 내에 평가할 수 있습니다. AI 기반 기술의 발전으로 개인 맞춤형 의료부터 석유화학에 이르기까지 다양한 분야에서 새로운 가능성이 열리고 있는 가운데, AI가 과학적 발견에 어떻게 의미 있는 영향을 미치고 있는지 보여주는 몇 가지 최근 사례를 소개합니다.
원하는 성질을 기반으로 새로운 재료를 설계할 수 있는 생성형 AI

특정 속성을 가진 재료를 설계하는 것은 전문가가 방대한 후보 목록을 수동으로 선별하고 시행착오 실험을 거쳐야 하는 느린 과정이 될 수 있습니다. 생성형 AI는 재료 과학에서 패러다임 전환을 가능하게 하여 연구자들이 재료의 성질을 첫 번째 원리로부터 예측하고, 훨씬 더 많은 재료를 훨씬 더 빠르게 선별하여 더 많은 후보를 평가할 수 있도록 돕습니다.
생성형 AI는 연구원들이 기존 재료로 실험을 반복하는 대신 최종 목표를 염두에 두고 시작할 수 있게 해줍니다. 이것은 단순히 시간을 절약하는 것에 그치지 않고, 연구자들이 색다른 조합을 탐색하여 수천, 수백만 개의 가상 화합물을 빠르게 생성함으로써 AI를 사용하여 혁신의 잠재력을 증가시킬 수 있게 합니다. 예를 들어, 지난 몇 년 동안 재료 설계 프로세스를 최적화하기 위한 여러 새로운 생성형 AI 모델이 등장했습니다.
- Microsoft Research의 MatterGen은 재료 생성의 기초로 확산 모델을 사용합니다.
- MatAgent는 재료 지식 기반으로 보강된 LLM을 활용하여 새로운 구성을 제안하고, 확산 모델 구조 추정기를 사용하여 제안된 구성을 기반으로 결정 구조를 결정하며, 그래프 신경망(GNN) 기반 특성 평가기를 활용하여 해당 결정 구조의 성질을 예측합니다.
- IBM Research는 또한 전문가 조합 접근법을 사용하는 일련의 모델을 출시했으며, 이는 PFAS 대체 설계에 유망한 것으로 입증되었습니다.
그리고 Meta는 최근 분자 발견을 발전시키기 위한 데이터 세트인 Open Molecules 2025와 원자에 대한 유니버설 모델(UMA)을 출시했습니다.
머신러닝은 후보 재료의 성질을 예측하는 데에도 매우 효과적이었습니다. Microsoft는 능동 학습, 생성 모델, 분자 역학 시뮬레이션을 혼합한 데이터로 학습된 딥 러닝 모델인 MatterGen의 보조 도구인 MatterSim을 개발했습니다. Google은 또한 "자료 검색을 위한 알파폴드"라고 불리는 자료 검색용 도구인 GNoME를 출시했습니다. 연구원들은 DeepMind를 사용하여 220만 개의 재료 목록을 381,000개로 줄인 후, GNoME를 사용하여 가장 안정적인 재료를 예측하여 배터리에 사용할 수 있는 528개의 잠재적인 리튬 이온 전도체를 도출했습니다.
정밀 의학의 부상에 힘을 실어주는 과학용 AI

AI 기반 유전자 모델링은 이제 방대한 양의 유전자, 후성유전학, 생물정보학 데이터를 분석하고 해석하여 연구자들이 유전적 변이와 그 의미를 이해할 수 있도록 돕습니다. 이 접근 방식은 머신러닝 알고리즘과 기타 AI 도구를 사용하여 유전자 정보 내의 패턴과 상관관계를 식별하여 각 개인에게 예방 조치, 치료법 및 의약품을 맞춤화합니다. 목표는 조기 개입을 강화하고 부작용을 최소화하며 비용을 절감하여 개별 환자의 필요에 맞춘 맞춤형 치료 프로그램을 만드는 것입니다.
유전자 모델링에 AI를 적용하면서 다음과 같은 분야에서 상당한 진전이 있었습니다.
- 데이터 통합 및 분석: AI 모델은 DNA 염기서열(예: 전체 엑솜/게놈 염기서열), 전사체, 프로테옴, 대사체 데이터를 포함한 대량의 데이터를 처리하여 기존 알고리즘이 놓칠 수 있는 통찰력을 발견합니다. 컨볼루션 신경망(CNN)과 순환 신경망(RNN)은 바이오마커, 질병 위험, 약물 반응 사이의 복잡한 연관성을 식별합니다. 이러한 모델은 기존의 통계적 방법이 간과할 수 있는 게놈 데이터 내의 복잡한 패턴을 포착하여 질병 감수성과 치료 결과를 보다 정확하게 예측할 수 있습니다.
- 예측 분석: AI는 개인의 유전적 프로필, 가족력, 심지어 의사의 소견까지 바탕으로 특정 질병의 발병 가능성을 예측하는 데 적용되고 있습니다. 이 접근법은 머신러닝 알고리즘과 임상 정보학을 사용하여 복잡한 유전자 데이터와 가족 패턴을 분석하여 예방 조치와 맞춤형 치료 계획에 대한 통찰력을 제공합니다.
- 맞춤형 치료 계획: AI는 개인의 고유한 게놈과 후성유전체에 기반하여 정밀 치료법 개발을 지원합니다. AI 모델은 질병 위험과 치료 반응에 영향을 미칠 수 있는 특정 변이와 돌연변이를 분석하고 식별합니다. AI 솔루션은 또한 DNA 메틸화 및 히스톤 변형과 같은 후생유전학적 변형을 조사하여 환경적 요인과 라이프스타일 선택이 유전자 발현에 미치는 영향을 이해할 수 있습니다.
- 멀티 오믹스 데이터 통합: 연구자들은 게놈, 전사체, 단백질체, 대사체 데이터를 연관시키는 AI의 능력을 활용하여 보다 포괄적인 생물학적 시스템 모델을 구축할 수 있습니다. 이 포괄적인 접근법은 질병의 발생과 진행에서 유전적 요인, 비유전적 요인, 환경적 영향 간의 복잡한 상호 작용을 더 깊이 이해할 수 있게 합니다.
AI 기반 솔루션은 방대한 양의 데이터를 분석하여 각 환자의 다양한 요인을 고려한 진단 및 치료법 개발에 도움을 줄 수 있습니다. 환자의 건강 프로필에 대한 옴니오믹 모델에 가까워지거나, 유전 및 후생유전 데이터의 계산 복잡성을 해결하는 것이든, AI는 정밀 의학 발전의 원동력이 될 것입니다.
탄소 포집 및 격리의 효율성을 향상시키는 AI 알고리즘

지금 당장 모든 이산화탄소 배출이 중단된다 하더라도, 이미 대기 중에 있는 이산화탄소는 계속해서 열을 가두어 지구 온난화를 주도할 것입니다. 기후변화에 관한 정부 간 협의체(IPCC)가 지적했듯이 CO2 포집 및 제거가 배출량 감축을 대체할 수는 없지만, 2°C의 온난화를 유지하기 위해서는 온실가스 배출량을 줄여야 합니다.
과학용 AI는 탄소 포집 및 격리(CCS), 강화 암석 풍화(ERW) 등 CO2 포집을 위한 다양한 접근 방식에서 점점 더 중요한 역할을 하고 있습니다.
- 탄소 포집 및 격리(CCS): AI 알고리즘이 운영 데이터를 분석하여 효율성을 향상시키기 위해 탄소 포집 시스템을 최적화하고 있습니다. 예를 들어, 강화 학습 알고리즘은 필요한 운영 에너지를 최소화하면서 산업용 배기가스에서 CO2 제거를 위한 공정 최적화에 사용되었습니다. 그 결과 예측 모델과 알고리즘을 통해 70% 이상의 사례에서 에너지 비용을 절감할 수 있는 것으로 나타났습니다. 머신러닝은 전통적인 방법보다 더 빠르게 흡착을 위한 다공성 재료를 식별할 수 있습니다. 거친 입자 확산 모델인 Microsoft MOFDiff는 탄소 포집에 매우 효과적인 금속-유기 프레임워크(MOF)의 구조를 생성합니다.
- 향상된 암석 풍화(ERW): ERW는 정상적인 지질학적 과정을 가속화하여 대기에서 CO2를 제거합니다. 농경지와 같은 토지에 분쇄된 규산염 또는 탄산염 암석의 얇은 층을 추가하면, 빗물과 함께 화학적 풍화 과정을 통해 대기 중 이산화탄소가 중탄산염 이온으로 전환됩니다. AI 기반 솔루션은 대상 위치와 토양 상태를 식별하고, 프로젝트 효과를 결정하는 데 필요한 예측 모델을 실행하여 ERW 노력을 지원할 수 있습니다.
AI가 탄소 포집 활동에 많은 응용 부문이 있지만, AI 운영과 관련된 배출량도 고려해야 한다는 점을 주의하는 것이 중요합니다. 그렇지 않으면 지구 온난화를 완화하기는커녕 오히려 지구 온난화에 기여하게 됩니다.
디지털 트윈을 통한 석유화학 운영의 안전성과 효율성 향상

'디지털 트윈'은 물리적 공간의 고충실도 가상 복제본을 생성하여 실시간 데이터를 분석하고 결과를 예측하는 데 사용되는 AI 기반 기술입니다. 석유화학 산업에서 이러한 복제품을 사용하면 복잡한 화학 공정의 시뮬레이션, 분석 및 최적화가 가능합니다. 디지털 트윈은 상세한 운영 데이터와 반응 속도를 내장하여 다양한 조건에서 제조 공장 시스템에 대한 통찰력을 제공합니다.
디지털 트윈 소프트웨어는 최근 몇 년 동안 상당히 성숙해졌으며, 많은 산업이 이러한 시뮬레이션이 제공하는 예측 기능을 활용하고 있습니다. 석유화학 제조에서 디지털 트윈을 성공적으로 구현하기 위해서는 여러 핵심 기술에 의존해야 합니다.
- 고충실도 시뮬레이션 플랫폼: Aspen HYSYS, gPROMS, AVEVA와 같은 소프트웨어 도구는 상세한 화학 반응 속도론 및 열역학을 통합하여 석유화학 공정의 정밀한 가상 복제본을 생성합니다.
- IoT 및 센서 통합: 광범위한 센서 네트워크는 실시간 데이터 피드를 제공하여 디지털 트윈을 지속적으로 업데이트하고, 이를 통해 현재 운영 상태를 정확하게 반영합니다.
- 머신러닝과 AI 통합: AI 기반 분석은 예측 기능을 향상시켜 디지털 트윈이 운영 장애를 예측하고 플랜트 성능을 사전에 최적화할 수 있도록 합니다.
이러한 혁신은 석유화학 회사들이 예측 유지보수와 자산 관리를 실행할 수 있게 합니다. 디지털 트윈은 장비 고장이 발생하기 전에 이를 예측하고, 사전에 유지 관리 일정을 잡고, 다운타임과 운영 비용을 크게 줄여서 안전을 개선할 수도 있습니다. 실시간 분석을 통합하여 프로세스를 동적으로 조정함으로써 수율을 최적화하고 에너지 소비를 줄일 수 있습니다. 예를 들어, 디지털 트윈은 에틸렌 크래커의 상세 모델링을 가능하게 하여, 정확한 운영 조정을 통해 원료 활용도와 제품 수율을 극대화합니다.
AI 모델을 사용한 신약 개발 및 약물 용도 변경 가속화
약물 용도 변경은 제약 개발 분야에서 오랫동안 성공적인 전략으로 자리 잡았습니다. 그러나 임상 관찰 및 연구 문헌을 검토하고 광범위한 테스트와 검증을 거쳐야 하는 느리고 노동 집약적인 작업이 필요한 경우가 많습니다. 이제 제약 회사는 과학용 AI를 사용하여 "제로 샷 추론"이라는 방법을 통해 새로운 매개변수나 데이터 없이도 약물 적응증과 금기 사항을 보다 효율적으로 예측할 수 있습니다.
약물 용도 변경에 AI를 적용하는 방법은 다음과 같습니다.
- 지식 그래프를 활용하는 AI 기반 모델은 인간 연구자 혼자서 할 수 있는 것보다 더 많은 질병과 잠재적 신약 후보를 더 빠르게 평가합니다.
- 유전학 데이터 네트워크 생물학을 사용하여 질병 경로의 여러 부분을 표적으로 하는 여러 약물을 식별하기 위해 용도 변경 후보를 식별합니다.
- 다약리학을 통해 연구자들이 다른 약물과 병용해서 사용할 수 있는 표적 외 효과를 연구할 수 있습니다.
이러한 노력의 성공 여부는 양질의 데이터의 가용성에 크게 좌우되며, 이는 여전히 과제로 남아 있습니다. 일부 추정에 따르면 조직 지식의 55%는 오랜 시간 동안 축적된 비정형 정보인 '다크 데이터'라고 합니다. 일반적으로 조화되지 않고 서로 다른 시스템 내에 저장되는 다크 데이터는 접근성이 제한적이고 서로 다른 시스템에 저장되어 있어 AI 전략에 통합하는 데 방해가 되는 경우가 많습니다.
인체의 복잡성과 실행 가능한 치료법이 없는 질병과 관련된 도전 과제는 기존 약물의 새로운 용도를 식별하는 데 AI의 계산 능력이 필수적임을 의미합니다.
미세 구조 분석을 위한 컴퓨터 비전으로 안전성과 품질 향상

재료 과학 연구에서 컴퓨터 비전은 현미경 또는 분광 이미지와 같은 대량의 시각 데이터를 처리하여 재료의 특성, 구조 및 결함을 식별하는 데 AI를 사용합니다. 이러한 유형의 분석은 오랫동안 재료의 기계적 성질을 이해하는 데 중요한 단계였으며 안전, 재료 선택, 품질 관리에 중요한 역할을 합니다. 예를 들어 입자 크기와 분포는 재료 강도와 연성에 중요한 요소입니다. 항공우주 및 전자 산업에서는 재료와 부품에 대한 매우 구체적이고 정확한 미세 구조 분석이 필요합니다.
AI 기반 컴퓨터 비전은 이 과정을 혁신하고 있습니다. 이제 상 식별 및 미세 구조 분류와 같은 작업을 자동화하여 기존에는 시간이 많이 걸리던 수작업 절차를 더 빠르고 정확하게 완료할 수 있습니다. 컴퓨터 비전 알고리즘은 균열, 공극, 이물질을 포함한 결함을 찾아내고 식별할 수 있습니다. 또한 미세 구조 내의 개별 입자들을 세분화하고, 존재하는 다양한 재료 단계를 감지하며, 머신러닝 기능을 활용하여 다양한 정량적 기능을 구현할 수 있습니다.
제조업체를 위해 컴퓨터 비전 기반의 미세 구조 분석은 재료가 특정 사양을 충족하는지 확인함으로써 품질 관리를 향상시킵니다. 이러한 시스템은 사람이 직접 분석하는 것보다 더 빠르게 잠재적 결함을 식별함으로써 원자로와 같은 극한 조건에서 재료의 무결성을 보장하거나 용접 재료의 안정성을 확인하는 데 도움을 줄 수 있습니다.
과학용 AI의 미래: 혁신적이고 놀라운 변화
기술 발전과 과학적 혁신은 항상 함께 진행되어 왔으며, AI 기반 기술이 계속 발전함에 따라 과학적 탐구의 많은 영역을 더욱 변화시킬 것으로 예상됩니다.
위의 예에서 볼 수 있듯이, 과학 분야에 AI를 사용하는 데 있어 '모든 것에 맞는' 접근 방식은 없습니다. 데이터 마이닝, 통합, 분석, 최적화부터 시뮬레이션, 시각화, 예측 분석, 모델링에 이르기까지 과학적 및 컴퓨팅 분야의 모든 영역에서 다양한 방식으로 그 영향력을 발휘할 수 있습니다.
CAS에서는 사람이 직접 큐레이션한 최대 규모의 과학 정보 저장소인 CAS 컨텐츠 컬렉션TM을 지속적으로 분석하여 연구 환경과 AI가 의료부터 재료 과학 등 다양한 분야에서 어떻게 의미 있는 변화를 만들어내고 있는지 파악하고 있습니다. 최첨단 혁신을 직접 체험할 수 있는 기회를 통해 2025년 이후 AI가 과학적 발견을 어디까지 이끌어갈지 기대가 됩니다.