Pink on purple header graphic

Jeu de données SAR de CAS sur les candidats antiviraux pour lutter contre la COVID-19

Bannière du jeu de données SAR sur les composés antiviraux pour lutter contre la COVID-19

Ce jeu de données à source ouverte contient plus de 290 000 données sur les relations structure-activité (SAR) dirigées vers des cibles de protéines, de virus et de maladies liés à la COVID-19, rapportées dans la littérature, les brevets et d'autres sources publiques pour plus de 9 000 des substances incluses dans le jeu de données de CAS sur les composés candidats antiviraux pour lutter contre la COVID-19.

Spécialiste des solutions d'information scientifique, CAS noue des partenariats avec des organismes de recherche du monde entier afin de relever les défis complexes et en évolution rapide de la COVID-19. Conformément à sa mission en tant que division de l'American Chemical Society, CAS met à disposition un large éventail d'actifs, d'expertise et de ressources pour soutenir cette lutte.

Dans le cadre de cet effort, CAS a élaboré un jeu de données à source ouverte sur les relations structure-activité (SAR) dirigées vers des cibles de protéines, de virus et de maladies liés à la COVID-19, rapportées dans la littérature, les brevets et d'autres sources publiques. Ce jeu de données complète le jeu de données SAR de CAS sur les candidats composés antiviraux pour lutter contre la COVID-19. Les conditions de licence de ce jeu de données permettent une utilisation gratuite pour des applications telles que la recherche, l'exploration de données, l'apprentissage machine et l'analyse.

Ce jeu de données (et le fichier readme) peut être téléchargé en remplissant le formulaire ci-dessous 


À propos du jeu de données

Au format de fichier à valeurs séparées par des virgules (.csv), ce jeu de données contient plus de 290 000 points de données sur la structure et la bioactivité, y compris la CI50, la CE50 et d'autres paramètres de puissance. Les formats de fichier CSV sont facilement importables sous forme de données dans les tableurs, tels que Microsoft Excel. Les données sont organisées par en-têtes de colonnes : cas_nr ; protéine ; usage thérapeutique ; type d'activité ; valeur de l'activité ; unité d'activité ; source. Pour les outils de science des données, tels que le logiciel gratuit SciKit-Learn, avec le langage de programmation Python, les cadres de données de la bibliothèque Pandas peuvent être envisagées pour déployer le jeu de données vers l'apprentissage machine.


Contactez l'espace clients de CAS pour toute question ou si vous souhaitez demander des données ou des services supplémentaires pour soutenir la recherche ou l'analyse liées à la COVID-19.


Ressources supplémentaires de CAS relatives à la COVID-19


 

Télécharger le jeu de données



Your privacy is important to CAS. More detail about how we use your information is in our privacy policy.