Conjunto de dados SAR CAS COVID-19 de compostos candidatos com atividade antiviral

Banner do conjunto de dados SAR de compostos com atividade antiviral para COVID-19

Este conjunto de dados de código aberto contém mais de 290 mil dados de relação estrutura-atividade (SAR) direcionados a proteínas, vírus e doenças com foco na COVID-19, disponíveis na literatura científica, patentes e outras fontes públicas das mais de 9 mil substâncias incluídas no conjunto de dados CAS COVID-19 de compostos candidatos com atividade antiviral. 

Como especialista em soluções de informação científica, o CAS está em parceria com organizações de pesquisa do mundo todo para enfrentar o desafio complexo e em rápida evolução da COVID-19. Alinhado à nossa missão, como uma divisão da American Chemical Society, o CAS está disponibilizando uma ampla variedade de ativos, conhecimentos e recursos para apoiar essa luta.

Como parte deste esforço, o CAS criou um conjunto de dados de código aberto que contém dados de relação estrutura-atividade (SAR) direcionados a proteínas, vírus e doenças com foco na COVID-19, disponíveis na literatura, patentes e outras fontes públicas. Este conjunto de dados está associado ao conjunto de dados CAS COVID-19 de compostos candidatos com atividade antiviral. Os termos de licença do conjunto de dados dão suporte ao uso de aplicativos, incluindo pesquisa, mineração de dados, aprendizado de máquina e análises sem nenhum custo.

Preencha o formulário abaixo para baixar o conjunto de dados (e o arquivo leia-me) 


Sobre o conjunto de dados

O conjunto de dados está no formato de arquivo de valor separado por vírgula (.csv) e contém mais de 290.000 pontos de dados de bioatividade de estruturas, incluindo IC50, EC50 e métricas de potência adicionais. Os arquivos no formato CSV podem ser facilmente importados como dados para ferramentas de planilha, como o Microsoft Excel. Os dados são organizados por títulos de coluna: cas_rn; proteína; uso terapêutico; tipo de atividade; valor da atividade; unidade de atividade; fonte. Para ferramentas de ciência de dados, como o software livre SciKit-Learn, com linguagem de programação Python, os dataframes da biblioteca do Pandas podem ser utilizados para implantar o conjunto de dados para aprendizado de máquina.


Entre em contato com a Central do cliente CAS caso tenha dúvidas ou se deseja solicitar outros dados ou serviços para apoiar pesquisas ou análises relacionadas ao COVID-19.


Recursos adicionais do CAS COVID-19


 

Baixe o conjunto de dados

Your privacy is important to CAS. More detail about how we use your information is in our privacy policy.

Contact CAS

Let us know how we can best serve you.