Base de datos de CAS de SAR de compuestos antivirales candidatos contra la COVID-19

Banner de la base de datos de SAR de compuestos antivirales contra la COVID-19

Esta base de datos de código abierto contiene más de 290,000 datos de relación estructura-actividad (SAR) orientados a los objetivos de la enfermedad, el virus o la proteína de la COVID-19 registrados en la bibliografía, patentes y otras fuentes públicas sobre más de 9,000 sustancias que se incluyen en la Base de datos de CAS sobre compuestos antivirales candidatos contra la COVID-19. 

Como especialista en soluciones de información científica, CAS se ha aliado con organizaciones de investigación en todo el mundo para afrontar el desafío complejo y de rápida evolución que plantea la COVID-19. Alineados con nuestra misión como división de la Sociedad Química de los Estados Unidos, CAS pone a disposición un amplio conjunto de activos, experiencia y recursos para apoyar en esta lucha.

Como parte de este esfuerzo, CAS ha desarrollado una base de datos de código abierto que contiene datos de relación estructura-actividad (SAR) orientados a la enfermedad, el virus o la proteína de la COVID-19 registrados en la bibliografía, patentes y otras fuentes públicas. Esta base de datos complementa la Base de datos de compuestos antivirales candidatos contra la COVID-19 de CAS. Los términos de la licencia de la Base de datos admiten su uso sin cargo en aplicaciones que incluyen la investigación, minería de datos, aprendizaje automático y análisis.

Esta base de datos (y el archivo Léame) puede descargarse completando el formulario que figura abajo 


Acerca de la Base de datos

La base de datos está en formato de archivo de valores separados por comas (.csv) y contiene más de 290,000 puntos de datos de estructura-bioactividad, incluidos IC50, EC50 y otras métricas de potencia. Los archivos de formato CSV se importan fácilmente como datos a herramientas de hojas de cálculo, como Microsoft Excel. Los datos se organizan por encabezados de columnas: cas_rn; protein; therapeutic use; activity type; activity value; activity unit; source (cas_rn; proteína; uso terapéutico; tipo de actividad; valor de actividad; unidad de actividad; fuente). En el caso de las herramientas de ciencia de datos, como el software gratuito SciKit-Learn con lenguaje de programación Python, se pueden considerar las bibliotecas panda dataframe para la implementación de la base de datos para el aprendizaje automático.


Comuníquese con el Centro de Atención al Cliente de CAS si tiene alguna pregunta o si desea solicitar servicios o datos adicionales para respaldar la investigación o el análisis relacionados con la COVID-19.


Recursos adicionales de CAS sobre la COVID-19


 

Descargar la base de datos

Your privacy is important to CAS. More detail about how we use your information is in our privacy policy.



Contact CAS

Let us know how we can best serve you.