CAS COVID-19 抗病毒候选化合物 SAR 数据集

COVID-19 抗病毒候选化合物 SAR 数据集

此开源数据集包含文献、专利和其他公共资源(为 CAS COVID-19 抗病毒候选化合物数据集提供了超过 9,000 种物质)中报道的关于 COVID-19 蛋白质、病毒和疾病的 290,000 多种构效关系 (SAR) 数据。 

作为科学信息解决方案专业机构,美国化学文摘社(CAS)正与全球研究机构合作,应对COVID-19带来的复杂而又快速变化的挑战。作为美国化学会出版社(ACS)的分支机构,CAS致力于践行ACS的使命,持续开发、开放提供一系列资源(包括数据、工具、专业咨询等),以共同抗击COVID-19。

为此,CAS 建立了一个开源数据集,专门收录文献、专利和其他公共资源中报道的关于 COVID-19 蛋白质、病毒和疾病的构效关系 (SAR) 数据。该数据集与 CAS COVID-19 抗病毒候选化合物数据集目标相同。该数据集的许可条款支持研究人员无需支付费用即可利用这些数据进行研究、数据挖掘、机器学习和数据分析。

填写下表即可下载该数据集(和自述文件) 


关于该数据集

本数据集采用.CSV格式,包含超过29万条构效关系数据,包括IC50、EC50和其他数值。能够便捷地将CSV文件导入到电子表格工具(如Microsoft Excel)。数据按列排列:cas_rn、蛋白质、治疗用途、活性类型、活性值、活性单位、来源等。对于数据科学工具而言,例如可考虑使用Python编程语言的免费软件SciKit-Learn、pandas library dataframes等,将数据集部署到机器学习中。


如果您有任何疑问,或需要其他数据或服务来支持与 COVID-19 相关的研究或分析,请联系 CAS 客户中心


其他 CAS COVID-19 资源


 

下载数据集

Your privacy is important to CAS. More detail about how we use your information is in our privacy policy.