CAS Registry Services℠

AI가 신약 개발을 위한 합성 생물학을 지원할 수 있습니까?

캘리포니아 대학교 버클리, 키슬링 연구소 및 공동 바이오에너지 연구소(JBEI)의 그레이엄 허드슨 박사와 네이선 랜클로스와의 대화

__wf_예약_상속
__wf_예약_상속

합성 화학의 발전이 한계에 다다르면서, 연구자들은 해결책을 찾기 위해 생물학에 시선을 돌리고 있습니다. 합성 생물학과 인공지능(AI)의 발전으로 과학자들은 희귀하고 자연에 존재하지 않는 분자를 설계하고 생산하는 등 약물 발견에 새로운 가능성을 열어가고 있습니다. 이러한 도구들을 활용하여 연구자들은 복잡한 분자의 합성, 생산 경로의 최적화, 그리고 제약 혁신을 위한 생물학적 시스템의 엔지니어링에 대한 새로운 접근법을 개발하고 있습니다. 빠르게 진화하는 이 분야에 대한 통찰력을 얻기 위해 합성 생물학 및 미생물학 전문가인 그레이엄 허드슨 박사와 AI 기반 단백질 설계 전문가인 네이선 랜클로스 박사와 대화를 나누었습니다. CAS가 이러한 과제를 어떻게 해결하고 있는지 자세히 알아보시기 바랍니다.

CAS: 합성 생물학이 합성 화학을 넘어 신약 개발 혁신을 위해 꼭 필요한 다음 단계입니까?

Graham Hudson
UC 버클리 박사 후 과정 연구원

이론적으로 구조가 화학적으로 안정하기만 하면 합성 화학으로도 접근할 수 있습니다. 하지만 문제는 단순히 가능성 여부가 아니라, 효율성, 비용, 그리고 확장성에 있습니다. 이론적으로 합성할 수 있는 화합물이 있지만, 경로를 개발하는 데 필요한 노력과 선택성을 제어하는 데 따르는 어려움으로 인해 실용적이지 않습니다. 합성 생물학이 약물 합성을 위한 새로운 길을 열어줄 수 있습니다.

자연은 수백만 년에 걸쳐 놀라운 정밀도로 이러한 복잡한 분자를 구축할 수 있는 효소 기구를 정교하게 발전시켜 왔으며, 이는 합성 화학으로는 달성하기 매우 어려운 위치 및 입체 선택성을 탁월하게 구현합니다. 파클리탁셀과 같이 입체 중심이 많고 기능적으로 유사한 그룹들이 조밀한 분자는 원하는 생성물이 정확히 만들어지도록 화학적으로 정밀하게 조작하는 것이 매우 어렵습니다. 그러나 자연의 생합성 도구를 활용하여 이러한 분자를 효율적으로 조립하는 효소를 이용할 수 있습니다.

Nathan Lanclos
UC 버클리 대학원생

또한 컴퓨터 생물학과 머신 러닝의 부상으로 이를 더욱 발전시킬 수 있습니다. AI 도구를 사용하면 진화가 만들어낸 것 이상으로 효소를 엔지니어링할 수 있으며, 효소의 구조를 수정하여 새로운 반응을 촉매하거나 기질 범위를 확장할 수 있습니다. 이는 단순히 자연산물을 재현하는 것에 그치지 않고, 완전히 새로운 생물학적 특성을 가질 수 있는 자연계에 없는 분자들을 만들 수 있는 길을 열고 있다는 뜻입니다.

CAS: 과학자들이 미생물을 '살아있는 약물 공장'으로 만드는 데 기여하고 있는 최신 돌파구는 무엇입니까?

Nathan Lanclos
UC 버클리 대학원생

미생물인 사카로마이세스(효모)와 스트렙토마이세스(세균)는 이미 항생제부터 항암제까지 가치 있는 화합물을 생산하는 데 널리 사용되고 있습니다. 주요 과제는 이러한 시스템을 최적화하여 높은 수율을 효율적으로 달성하는 것입니다. AI, 고처리량 스크리닝, 컴퓨터 모델링의 발전으로 전례 없는 규모로 생합성 경로를 설계하고 최적화할 수 있게 되었습니다.

이제 머신 러닝을 사용하여 대사 경로의 작동 방식을 예측할 수 있으며, 이를 통해 효소 발현 수준을 세밀하게 조정하고 전구체의 가용성을 최적화하며 숙주 대사를 수정하여 산출량을 극대화할 수 있습니다. 예를 들어, 대규모 이종 단백질 복합체에 대해 실험을 설계하여 장거리 단백질-단백질 상호 작용을 깊이 이해하는 것은 오래도록 해결하기 어려운 문제였지만, 이제 점점 더 세밀한 단계로 이를 수행하는 방법을 찾아가고 있습니다.

Graham Hudson
UC 버클리 박사 후 과정 연구원

합성 생물학이 약물 생산 방식을 변혁시키는 완벽한 예가 바로 QS-21(아래 Stimulon)으로, 이는 백신에 사용되는 면역자극 보조제입니다. 역사적으로 QS-21은 비누껍질 나무(Quillaja saponaria)에서 추출되었지만, 이 과정에는 몇 가지 주요 과제가 있습니다. 이 나무의 수확량은 매우 낮아 대규모 생산이 환경적으로 지속 가능하지 않으며 경제적으로도 실현 불가능합니다. 또한 식물 추출에 의존하는 것은 공급망이 기후 변동성, 삼림 벌채, 지정학적 요인에 취약하다는 것을 의미합니다.

CAS BioFinder™의 QS-21, Stimulon 상세 정보 페이지
CAS BioFinder™의 QS-21, Stimulon 상세 정보 페이지

효모가 QS-21을 생산하도록 엔지니어링하기 전에 먼저 효모의 전체 생합성 경로를 파악하고 그 합성을 담당하는 유전자를 확인해야 했습니다. 이 과정은 John Innes Centre의 앤 오스본의 실험실이 주도한 엄청난 노력의 산물로, 식물의 성장 주기 다양한 단계에서 정밀한 전사체 분석을 수행했습니다.

미생물 생합성 유전자 클러스터는 게놈에 국한되는 경향이 있는 반면, 식물 경로는 여러 염색체에 걸쳐 분산되어 있으며, 많은 경우 유전자 사이에 비코딩 염기서열이 존재합니다. 이러한 분산은 경로 발견을 훨씬 더 복잡하게 만들었으며, QS-21 생합성에 기능적으로 관여하는 유전자를 정확히 파악하기 위해 세심한 전사체 상관 연구가 필요했습니다.

CAS: 식물 유래 생합성 경로를 미생물 생산에 적용하면서 가장 어려웠던 점은 무엇이었습니까?

Graham Hudson
UC 버클리 박사 후 과정 연구원

가장 큰 도전 과제 중 하나는 당 생합성이었습니다. QS-21은 복합 당화된 트리테르페노이드인 사포닌이라는 자연산물 계열에 속합니다. 핵심 구조에는 일곱 가지의 서로 다른 당이 붙어 있지만, 효모는 그 중 하나만 자연적으로 생산합니다. 이는 QS-21의 생합성 경로를 삽입하는 것 외에도, 비천연 당을 합성하도록 효모를 엔지니어링해야 한다는 것을 의미했습니다.

또 다른 주요 문제는 독성이었습니다. QS-21과 같은 사포닌은 지질 이중층을 파괴하고 중요한 천연 스테롤을 포획할 수 있는 막 활성 화합물로, 이러한 특성 때문에 부분적으로 효과적인 면역 보조제가 될 수 있습니다. 그러나 이로 인해 효모에 상당한 문제가 발생했는데, QS-21 분자가 효모 세포막의 완전성을 손상시켜 세포 사멸과 생산 실패로 이어졌습니다. 이러한 문제를 해결하기 위해, 막 파괴를 방지하고 생산 조건을 최적화하기 위해 효모의 스테롤 조성을 수정해야 했습니다.

이 모든 노력은 합성 생물학의 놀라운 힘을 보여 줍니다. 이러한 발전이 없었다면 QS-21 생산에 식물 추출로 인한 병목 현상이 계속되었을 것입니다. 엔지니어링된 생물 생산 균주 덕분에, 이제 QS-21을 통제 가능하며 지속 가능한 방식으로 대규모로 생산할 수 있게 되었습니다. 대규모 생산이 가능해지기 전까지 더 많은 최적화가 필요하지만, 이 연구는 보다 효율적인 백신 제조의 길을 열어 줍니다.

CAS: 발견을 가속화하기 위해 AI를 활용하는 다른 분야는 무엇입니까?

Nathan Lanclos
UC 버클리 대학원생

AI를 사용하면 기존 방법으로는 불가능한 방식으로 생합성 경로를 설계하고 최적화할 수 있습니다. 시행착오를 겪는 대신, 예측 모델을 사용하여 어떤 효소 변형이 활성을 향상할지, 어떤 숙주 균주가 가장 호환성이 좋은지, 그리고 서로 다른 경로 구성 요소들이 어떻게 상호 작용할지 결정할 수 있습니다.

예를 들어, 키슬링의 실험실에서는 AI를 사용하여 폴리케타이드 신테타제(PKS)를 엔지니어링합니다. 이 효소는 항생제에서 항암제에 이르기까지 다양한 생리 활성 화합물을 생산합니다. PKS 효소는 거대하며, 개별 모듈은 수천 개의 아미노산을 포함하고 있습니다. PKS 효소의 방대한 크기와 복잡성 때문에 전통적인 단백질 공학 접근법은 적용하기 매우 어렵습니다. AI를 통해 이러한 거대한 단백질을 모델링하고 변형이 기능에 미치는 영향을 예측하며 활성이 향상된 새로운 효소 변종을 설계할 수 있습니다.

CAS BioFinder™의 폴리케타이드 합성 효소에 대한 약리학 표
CAS BioFinder™의 폴리케타이드 합성 효소에 대한 약리학 표
Graham Hudson
UC 버클리 박사 후 과정 연구원

AI가 접근 방식에 혁신을 일으키고 있는 또 다른 분야는 효소의 다기능성과 특이성입니다. 효소는 원래 기질에 따라 선택적으로 작용하지만, 새로운 유도체를 생산하기 위해서는 종종 비천연 기질에 작용해야 합니다. AI 모델은 효율성을 떨어뜨리지 않으면서 효소 활동을 확대할 수 있는 돌연변이를 예측하는 데 도움을 줄 수 있습니다.

CAS: 업무에서 경험한 가장 큰 데이터 관련 병목 현상은 무엇입니까?

Nathan Lanclos
UC 버클리 대학원생

가장 큰 과제는 데이터 품질과 표준화입니다. AI 모델의 성능은 공급하는 데이터의 질에 달려 있으며, 역사적으로 생물학 연구는 대규모 머신 러닝에 적합한 구조로 되어 있지 않습니다. 실험 데이터는 종종 다양한 형식으로 저장되며, 메타데이터가 부족하거나 주석이 잘 달리지 않아 대규모로 통합하고 분석하기가 어렵습니다.

현재 저는 데이터 정리와 정제에 너무 많은 시간을 할애하고 있습니다. 생물학, 화학정보학, AI 생성 데이터를 위한 통합 데이터 구조는 연구의 발견 속도를 획기적으로 가속화할 것입니다.

Graham Hudson
UC 버클리 박사 후 과정 연구원

또 다른 문제는 계측 및 데이터 추출입니다. LC-MS, HPLC, GC-MS 등 많은 분석 기법에는 여전히 수동 데이터 처리가 필요합니다. 기기 제조 업체는 종종 독자적인 포맷을 사용하기 때문에 결과를 자동으로 추출하고 분석하기가 어렵습니다. 기계가 읽을 수 있는 표준화된 데이터 형식이 있다면 워크플로우의 상당 부분을 자동화하여 AI 모델이 실험 결과에서 직접 학습할 수 있도록 할 수 있습니다.

CAS: 다양한 배경을 가진 연구자들 간의 협업이 필수가 되어가고 있습니까?

Nathan Lanclos
UC 버클리 대학원생

버클리에서는 다학제 협업이 혼란을 불러오더라도 그만큼 매우 가치 있다는 것을 체감할 수 있습니다. 생명공학 부서에는 합성생물학, 컴퓨터 과학, 하드웨어 공학, 미세유체공학 분야의 전문가들이 모여 있습니다. 이러한 다양성을 바탕으로 단일 학문 분야만으로는 해결할 수 없는 복잡한 문제를 해결할 수 있습니다.

이 협업이 특히 중요한 한 분야는 AI 기반 엔지니어링의 확장입니다. 예를 들어, JBEI의 미세유체학 실험실에서는 고처리량 균주 엔지니어링을 최적화하기 위한 혁신적인 장치를 개발하고 있습니다. 이러한 노력 덕분에, 몇 주 정도의 짧은 엔지니어링 주기 내에서 수천 가지의 다양한 단백질 설계를 테스트할 수 있습니다.

Graham Hudson
UC 버클리 박사 후 과정 연구원

문제는 연구가 그동안 각 분야별로 분리되어 왔다는 것입니다. 화학자, 생물학자, 그리고 컴퓨터 과학자들은 서로 다른 용어와 프레임워크를 사용하여 각기 다른 영역에서 활동하는 경우가 많습니다. 이 분야들을 진정으로 통합하기 위해서는 더 나은 소통과 지식 공유 플랫폼이 필요합니다. 이것만으로도 발전 속도가 매우 빨라질 것입니다.

CAS: 만약 신약 개발 과정에서 무엇이든 바꿀 수 있는 마법의 지팡이가 있다면, 무엇을 바꾸고 싶은가?

Graham Hudson
UC 버클리 박사 후 과정 연구원

제 대답은 다소 철학적이지만, 저는 특히 생명공학 분야에서 과학 연구의 가치와 자금 지원 방식을 바꾸고 싶습니다. 현재 스타트업과 학술 실험실은 고위험 고보상 모델로 운영되고 있으며, 많은 유망한 아이디어가 기존의 자금 조달 구조에 맞지 않아 제대로 개발되지 못하는 경우가 많습니다. 최첨단 과학의 잠재력을 실현하려면, 단기적인 수익 중심의 벤처가 아닌 기초 연구에 장기적으로 투자해야 합니다.

Nathan Lanclos
UC 버클리 대학원생

저라면 모든 이전 연구에 즉시 접근 가능하고 기계가 읽을 수 있는 구조화된 데이터베이스로 만들어진 시스템을 만들고 싶습니다. 우리가 직면한 가장 큰 장애물은 수많은 귀중한 데이터가 PDF에 갇혀 있고 다양한 저장소에 흩어져 있다는 것입니다. 특정 경로에 게시된 모든 내용을 즉시 추출하고 분석할 수 있다면 발견의 속도가 기하급수적으로 빨라질 것입니다.

그레이엄 허드슨(Graham Hudson) 박사는 세인트 루이스 대학교에서 생화학 학사 학위를 취득하고, 치료제 설계를 지원하기 위해 RNA 염기쌍 열역학을 연구했습니다. 일리노이 대학교 어배너-섐페인에서 더글라스 A. 미첼(Douglas A. Mitchell)과 한께 RiPP 자연산물에 중점을 두고 박사 학위를 취득하였으며 이 과정에서 티오펩티드 생합성을 재구성하고, 두 개의 새로운 종류인 란티펩티드와 피리티드를 발견했으며, 티오아미드화의 효소학적 기초를 규명했습니다. 현재 UC 버클리의 제이 D. 키슬링(Jay D. Keasling) 연구실에서 박사 후 과정 연구원으로 재직 중이며, 사포닌 자연산물의 효소학과 생합성을 연구하고 있습니다. 또한 자연산물 연구에 관해 업계에 자문을 제공하고 있습니다.

네이선 랭클로스(Nathan Lanclos)는 사우스 플로리다 대학교에서 분자생물학 학사와 경제학 학사 학위를 취득했습니다. 또한 그곳에서 블라디미르 우버스키(Vladimir Uversky)와 함께 암에서의 단백질 기능을 연구했고, 라몬 곤잘레스의 지도하에서 박테리아 내 C1 대사 공학을 수행했습니다. 현재는 UCSF와 UC 버클리가 공동 운영하는 생명공학 박사 과정에 재학 중입니다. 2022년에는 생명 공학 스타트업을 대상으로 마케팅 전략과 데이터 모델링을 지원하는 컨설팅 회사를 설립했습니다. 랭클로스의 연구는 단백질 공학 및 고처리량 단백질 공학을 위한 머신 러닝에 초점을 맞추고 있으며, 특히 폴리케타이드 신테타제(PKSs) 등의 다중 도메인 복합체를 활용한 화학 및 치료제 생산에 중점을 두고 있습니다.