Jeu de données SAR de CAS sur les candidats antiviraux pour lutter contre la COVID-19

Bannière du jeu de données SAR sur les composés antiviraux pour lutter contre la COVID-19

Ce jeu de données en source ouverte contient plus de 290 000 données sur les relations structure-activité (SAR) dirigées vers des cibles de protéines, de virus et de maladies liés à la COVID-19, rapportées dans la littérature, les brevets et d'autres sources publiques pour plus de 9 000 des substances incluses dans le jeu de données de CAS sur les composés candidats antiviraux pour lutter contre la COVID-19.

En tant que spécialiste des solutions d'informations scientifiques, CAS noue des partenariats avec des organismes de recherche du monde entier afin de relever le défi complexe et en évolution rapide posé par la COVID-19. Conformément à sa mission en tant que division de l'American Chemical Society, CAS met à disposition un large éventail d'actifs, d'expertise et de ressources pour soutenir cette lutte.

Dans le cadre de cet effort, CAS a élaboré un jeu de données en source ouverte sur les relations structure-activité (SAR) dirigées vers des cibles de protéines, de virus et de maladies liés à la COVID-19, rapportées dans la littérature, les brevets et d'autres sources publiques. Ce jeu de données est un complément au jeu de données SAR de CAS sur les candidats composés antiviraux pour lutter contre la COVID-19. Les conditions de licence du jeu de données permettent une utilisation gratuite pour des applications telles que la recherche, l'exploration de données, l'apprentissage machine et l'analyse.

Ce jeu de données (et le fichier readme) peut être téléchargé en remplissant le formulaire ci-dessous 


À propos du jeu de données

L'ensemble de données est au format de fichier à valeurs séparées par des virgules (.csv) et contient plus de 290 000 points de données sur la structure et la bioactivité, y compris la CI50, la CE50 et d'autres paramètres de puissance. Les formats de fichier CSV sont facilement importables en tant que données dans les outils de tableur, tels que Microsoft Excel. Les données sont organisées par rubriques de colonnes : cas_nr ; protéine ; usage thérapeutique ; type d'activité ; valeur de l'activité ; unité d'activité ; source. Pour les outils de science des données, tels que le logiciel gratuit SciKit-Learn, avec le langage de programmation Python, les fiches de données de la bibliothèque peuvent être envisagées pour déployer le jeu de données vers l'apprentissage machine.


Contactez l'espace clients de CAS pour toute question ou si vous souhaitez demander des données ou des services supplémentaires pour soutenir la recherche ou l'analyse liées à la COVID-19.


Ressources supplémentaires de CAS relatives à la COVID-19


 

Télécharger le jeu de données

Your privacy is important to CAS. More detail about how we use your information is in our privacy policy.