Conjunto de dados SAR CAS COVID-19 de compostos candidatos com atividade antiviral

Banner do conjunto de dados SAR de compostos com atividade antiviral para COVID-19

Este conjunto de dados de código aberto contém mais de 290 mil dados de relação estrutura-atividade (SAR) direcionados a proteínas, vírus e doenças com foco na COVID-19, disponíveis na literatura científica, patentes e outras fontes públicas das mais de 9 mil substâncias incluídas no conjunto de dados CAS COVID-19 de compostos candidatos com atividade antiviral. 

Como especialista em soluções de informação científica, o CAS está em parceria com organizações de pesquisa do mundo todo para enfrentar o desafio complexo e em rápida evolução da COVID-19. Alinhado à nossa missão, como uma divisão da American Chemical Society, o CAS está disponibilizando uma ampla variedade de ativos, conhecimentos e recursos para apoiar essa luta.

Como parte deste esforço, o CAS criou um conjunto de dados de código aberto que contém dados de relação estrutura-atividade (SAR) direcionados a proteínas, vírus e doenças com foco na COVID-19, disponíveis na literatura, patentes e outras fontes públicas. Este conjunto de dados está associado ao conjunto de dados CAS COVID-19 de compostos candidatos com atividade antiviral. Os termos de licença do conjunto de dados dão suporte ao uso de aplicativos, incluindo pesquisa, mineração de dados, aprendizado de máquina e análises sem nenhum custo.

Preencha o formulário abaixo para baixar o conjunto de dados (e o arquivo leia-me) 


Sobre o conjunto de dados

O conjunto de dados está no formato de arquivo de valor separado por vírgula (.csv) e contém mais de 290.000 pontos de dados de bioatividade de estruturas, incluindo IC50, EC50 e métricas de potência adicionais. Os arquivos no formato CSV podem ser facilmente importados como dados para ferramentas de planilha, como o Microsoft Excel. Os dados são organizados por títulos de coluna: cas_rn; proteína; uso terapêutico; tipo de atividade; valor da atividade; unidade de atividade; fonte. Para ferramentas de ciência de dados, como o software livre SciKit-Learn, com linguagem de programação Python, os dataframes da biblioteca do Pandas podem ser utilizados para implantar o conjunto de dados para aprendizado de máquina.


Entre em contato com a Central do cliente CAS caso tenha dúvidas ou se deseja solicitar outros dados ou serviços para apoiar pesquisas ou análises relacionadas ao COVID-19.


Recursos adicionais do CAS COVID-19


 

Baixe o conjunto de dados

Your privacy is important to CAS. More detail about how we use your information is in our privacy policy.