Organisation des données vitales pour libérer l'innovation offerte par la biodiversité du Brésil

Steven P. Watkins , Scientific Data Engineer

Brazil Biodiversity

Imaginez une collection de photos de famille débutée il y a longtemps dans laquelle les photos se sont amassées au fil des années. Rassembler toutes ces images dans un même lieu, par exemple une boîte à chaussures, comme le font beaucoup de gens, n'ajoute pas vraiment de valeur ni ne rend cette collection plus utile. Il vous faut beaucoup de temps pour retrouver l'image que vous cherchez et il est ensuite difficile de la partager. Dans ces conditions, votre collection rangée dans une boîte à chaussures reste inutilisée et oubliée dans un placard.

Grâce aux outils numériques d'aujourd'hui, la recherche, le partage et l'organisation de vos photos n'ont jamais été aussi simples. Vous pouvez désormais charger rapidement des images pour constituer des collections organisées qui pourront être consultées dans le monde entier. Compte tenu de la disponibilité de telles ressources, les gens s'éloignent des boîtes à chaussures dispersées remplies de photos et choisissent plutôt d'organiser des collections efficaces avec des outils numériques.

Les scientifiques sont confrontés à des défis similaires en ce qui concerne les précieuses données de leurs recherches. Il ne suffit pas de collecter et de rassembler des contenus ; sans une structure et une organisation appropriées, les innovateurs ne peuvent pas pleinement exploiter ces informations. Il est indispensable de disposer d'un robuste socle de données pour pratiquement toutes les activités de R&D, de la recherche au quotidien à la mise en œuvre de technologies numériques comme l'intelligence artificielle, l'analyse prédictive et l'apprentissage machine.

Préserver la biodiversité du Brésil

Même si le Brésil abrite 15 à 20 % de la diversité biologique mondiale, une partie substantielle de l'abondante biodiversité du pays reste inexplorée. En raison d'un manque d'informations organisées, il était extrêmement difficile pour les chercheurs d'identifier, de sélectionner ou même de comparer des substances chimiques pertinentes. Cela nuisait à leur aptitude à identifier de nouvelles cibles, à s'appuyer sur des découvertes antérieures et à dynamiser l'innovation.

Les chercheurs de l'Université d'État de São Paulo (IQ-UNESP) ont donc essayé de trouver un meilleur moyen de mettre à disposition des informations pertinentes sur la biodiversité unique du Brésil. L'urbanisation croissante et la déforestation qui mettent en danger des espèces rares intensifiaient la nécessité d'organiser systématiquement les données. Si les échantillons ne sont pas traités et classés rapidement, les informations concernant les substances pourraient être perdues à jamais.

La nécessité de préserver les informations de valeur s'est renforcée en 2018 lorsqu'un incendie a dévasté le Musée national de Rio de Janeiro, entravant la recherche en raison de la perte définitive d'échantillons rares. En réponse, les experts de CAS ont étendu leur soutien à la communauté scientifique du Brésil en nouant un partenariat avec IQ-UNESP pour gérer et organiser l'information concernant les composés bioactifs naturels en vue de la rendre disponible pour les recherches futures.

La collaboration entre les spécialistes de l'information scientifique de CAS et les chercheurs de produits naturels du Brésil a donné naissance à une collection organisée et affinée de produits naturels. Les données sont organisées de façon systématique dans la base de données Nucleus for Bioassays, Biosynthesis and Ecophysiology of Natural Products (NuBBE) accessible publiquement, un projet créé à l'initiative du Dr Vanderlan Bolzani (Institut de chimie de l'Université d'État de São Paulo – IQ-UNESP) et le Dr Adriano Andricopulo (Institut de physique de São Carlos de l'Université de São Paulo – IFSC-USP).

L'équipe de CAS a utilisé ses connaissances et son expertise scientifiques approfondies de la gestion des données pour extraire et traiter les informations provenant de plus de 30 000 publications scientifiques pertinentes. La collection de contenus ainsi obtenue optimise l'accès et augmente l'utilité des composés naturels bioactifs du Brésil pour soutenir l'innovation.

logo nubbedbTéléchargez l'étude de cas pour en savoir comment la collaboration entre CAS et l'IQ-UNESP a abouti à une collection de données réunissant plus de 54 000 substances issues de la riche biodiversité du Brésil.

Les données organisées et accessibles facilitent la compréhension

L'efficacité est essentielle pour une innovation rapide. Lorsque les informations scientifiques ne sont pas accessibles, exploitables ou fiables, les découvertes sont entravées. En fait, les problèmes d'intégrité et d'accessibilité des données provoquent 10 % à 20 % de répétition de l'ensemble du travail de développement. Les équipes de chercheurs ont donc besoin d'un accès transparent à un large éventail d'informations scientifiques et commerciales cohérentes et précises, faute de quoi elles risquent de s'exposer à des retards et erreurs coûteux.

Le volume et la complexité des informations scientifiques ont explosé au cours des dernières décennies, créant un paysage chaotique composé de données déconnectées et désorganisées. Même les systèmes internes possèdent un certain nombre de sources qui produisent des données dans différents formats et niveaux de qualité. À ce titre, la création et la gestion d'un référentiel de données exploitable et bien organisé constitue une gageure, mais elles sont plus importantes que jamais.

Selon les FAIR Guiding Principles for scientific data management and stewardship (Principes directeurs FAIR de la gestion et de l'organisation des données scientifiques), les données doivent impérativement être faciles à trouver, accessibles, interopérables et réutilisables. Le travail de nettoyage et de normalisation de données présentant une signification et des connexions sémantiques correctes est difficile et requiert des compétences spécialisées et un investissement significatif dans les ressources. C'est pourquoi de nombreuses entreprises font appel à des experts externes, comme CAS, pour libérer le potentiel de leurs données de façon rapide et économique.

L'expertise scientifique optimise la valeur des données

Un solide socle de données cohérentes et validées permet à vos équipes et à la technologie de progresser avec efficacité. Dans un exemple, une entreprise qui rencontrait des difficultés avec l'accessibilité et l'exactitude de ses données internes a noué un partenariat avec CAS pour harmoniser et normaliser son système de gestion des connaissances, ce qui a permis à ses chercheurs d'économiser plus de 3 300 heures par an.

La création et la gestion d'un jeu de données de haute qualité requiert une expertise. CAS emploie des centaines de scientifiques dans un large éventail de disciplines, qui parlent en tout plus de 50 langues. Même si les algorithmes peuvent faciliter le traitement des données, aucun algorithme ne peut se substituer à l'aptitude de scientifiques expérimentés à interpréter les résultats et établir des liens entre des éléments d'information apparemment disparates.

Les experts de CAS organisent des collections de contenus adaptés au périmètre de votre projet particulier. En construisant votre jeu de données en fonction de vos besoins précis, les flux de travail sont rationalisés, la recherche est facilitée et l'impact des investissements dans des ressources internes et externes est renforcé, ce qui accélère un grand nombre d'initiatives.

Les services personnalisés de CAS aident déjà les entreprises à résoudre leurs principaux problèmes d'organisation et d'intégration des données. Contactez-nous pour libérer la puissance de vos données grâce à notre expertise.