药物研究和开发效率的持续下降是所有制药行业创新人员熟悉的话题。 Jack Scannell 等人曾指出“自 1950 年以来,每十亿美元研发经费批准的新药数量每 9 年就会减少约一半(调整通货膨胀率后下降了约 80 倍)”,引发行业对于这一根本性挑战的关注,如今距离当时已经过去了六年。不幸的是,时至今日,批准率已得到持续改善的证明仍然不甚明确。 生物制药学行业的业务、科学和技术主管仍在努力寻找能够降低研发成本和加快向依赖这些药物的病人提供救命新药的新方法。
在科学大数据中是否能找到答案?
最近几年,商务策划师已经开始强调,不 充分利用信息资产是妨碍药物开发生产率提高的强大阻力。 而科学出版物数量的惊人增长又进一步证实了他们的假设。 根据可用的最新数据,CAS 估计全球科技期刊和专利文献包含超过 1.5 亿个独立出版物,并且正在以接近指数级的速度增长。
研究者面临的挑战是,在海量的多样化信息中找到所需的答案。 事实上,2017 年 CAS 进行的科学研究人员调查显示,他们每周平均花费 7 小时查找信息,其中约 60% 的时间专门用于整理检索结果,以查找相关信息。 从大量检索结果中提炼信息所耗费的时间直接影响了他们用于开发和试验其治疗假设的时间。 鉴于这种情况,有人想到:
通过改善信息资产利用,能够节省多少时间和金钱? 如果机器学习 (ML) 和自然语言处理 (NLP) 领域的进步能够在制药业中高效应用,对于疾病相关药物假说的发展和试验步伐会产生什么影响?
除了强有力的行业投资外,团队组建问题也是成功的必要前提
为了找到这些问题的答案,(生物)制药行业已经在研发信息技术固定资产和专业知识方面进行了大量投资——包括大量招聘数据科学家 —— 估计从 2016 年至 2026 年,此职位人数将增长 19%(包括计算机和信息科学家)。领导能力也已被纳入考量,董事会正在尝试组建“大数据”精英管理团队。 尽管已经做出了这些努力和投资,迄今为止的成功故事仍不算多。
鉴于每个领域的焦点问题,挑战似乎可能并不单单在于人才、技术或科技,而是在于在它们之间建立有意义的联系,以可扩展的方式提供见解的能力 。
探索科学家与信息技术专家之间更好的合作和协作是否能达到所需的效率提高目标?
CAS,科学-技术信息的牵线人
生物制药行业面临的挑战是,寻找更好的方式管理和联系可用的信息,而这已经不是什么新鲜事了。 事实上,111 年前 CAS 的创立就是因为化学家们意识到需要寻求管理其研究领域中不断增长的文献量,并使其对于从业者而言更易于查找和有用的新方法。 随着时间流逝,文献的体量已不断增长和多样化,科技获得了长足的进步,CAS 也在不断发展,并针对新的信息挑战制定了新的解决方案,例如数字化存储和访问化学结构信息、在专利内检索马库什图像、以及快速分析大型科学数据存储库。 我们的解决方案会举例说明科学家与技术专家协同工作会带来哪些益处。
在当今的大数据时代,预测分析和人工智能为推进科学信息解决方案提供了一波新的机遇和挑战。 随着基础信息技术的迅猛发展,若要兑现这些技术对于生物制药领域使用案例的承诺,就需要特别注意科学和化学信息的独特方面。 在帮助建立科学信息与新兴技术之间的联系,并以此对研发过程产生显著影响方面,CAS 具有独一无二的优势。
加速合成
预测合成是 CAS 通过解决药物研发领域的效率挑战,独家应用了这些技术的一个领域。合成路线选择和工艺开发是药物发现和开发中的几个复杂、昂贵的方面。 例如,在每个通向靶分子的合成时间点,药物和合成化学家要在预计 100 种可能性中进行选择。 在逆合成分析阶段,他们必须还要解决一系列会影响先导化合物的商业可行性的因素。 这些因素包括高反应产率的实现;尽量减少反应器停留(周期)时间;尽量减少所需的合成步骤;避免/尽量减少保护基的使用;以及尽量降低整体过程能量消耗。
预测技术可通过分析大量替代选项、根据在 CAS 内容合集中找到的超过 1 亿种反应和相关数据建议最直接的合成路径和其他可能性来提供帮助。 将来,随着 ChemPlanner® 被整合入 SciFindern,这种愿景即将成为现实。 此外,这些最先进的化学信息学技术将有助于帮助化学家们找到适用于其合成的多样和可行路线的最佳选择——无论是构建新的候选分子以供筛选,还是对关键转化进行故障排除以准备将规模扩大至试产设施或工业制造设施。 这只是 CAS 目前正在开发的科学大数据技术的众多使用案例之一。
在 CAS,我们很高兴能够与制药公司的研究和业务主管合作,共同提升科学信息在研发过程中的价值,更好地将数据与技术联系起来,为行业提供深刻见解。 我们期盼找到新的途径,以利用我们独一无二的内容、技术和专业知识,为我们的客户创造价值,帮助他们开发出改善生活品质的创新产品。
是否遇到了科学信息方面的挑战? 了解 CAS 如何助您一臂之力。