化学の研究開発でダークデータの価値を引き出す - 成功のための戦略

GettyImages-507492447_CAS-Insights-Hero-Image

ダークデータとは何か

革新的な化学企業にとって、研究開発に革命を起こす原動力はすぐ手の届くところにあります。 「ダークデータ」と呼ばれる未使用のデータが大量に存在しています。企業はこれを活用することでかつてないインサイトを引き出し、イノベーションを加速させることができるでしょう。 効果的なナレッジマネジメント戦略を導入することで、画期的な発見や進歩の可能性は無限に広がります。

典型的なダークデータは、非構造化または半構造化されたデータで、簡単には検索またアクセスできなくなっています。 推定によると、組織に保管されているデータの55%がダークデータとされています。 それにもかかわらず、世界中のビジネスおよびITのエグゼクティブとマネージャーの約90%が、今後成功するには、どの組織もこの非構造化されたデータから価値を抽出することが必要だと言っているのです。

これが何を指しているのかというと、多角的な化学研究開発という範疇では、検索可能なデータベースに組み込まれていないようなものすべて、例えば実験ノートやLIMS、実験報告書、参考文献などのデータも含まれます。 こういったデータは、新規材料の同定や、既存の配合の改良、または研究開発サイクルタイムの短縮に役立つ可能性があります。

ダークデータのこの価値を最大限に活用するためには、多角的な化学企業は、最も価値のあるデータがどこに潜んでいるかを特定し、そして必要に応じてこのデータにアクセスし、それを収集、整理そして分析できるようにする効果的なナレッジマネジメント戦略を導入する必要があります。

隠れた宝石の発掘 - 最も価値ある化学研究開発データを特定する

ダークデータは、化学研究開発のワークフロー全体に隠れている可能性があります。 貴重なデータは、初期段階の研究から、製造、処方、特性評価、市販後の観察に至るまで、ずっと生成そして収集されています。しかし、その可能性を十分に活用できていない場合があります。 ダークデータの価値を解き放ち、イノベーションを加速させるためには、研究開発組織はこのデータがどこに隠れているのかを特定し、そしてそれにアクセスして効果的に活用する戦略を開発することが極めて重要です。

研究にとって価値の高いダークデータには、いくつかの種類があります。 例えば、過去の実験データは多くの場合散在していたり、不完全だったり、また構造化されていなかったりしています。しかしこれを整理して分析することで、現在や将来のプロジェクトに貴重な洞察が得られます。 これは、組織内での研究開発の取り組みだけにとどまりません。学術論文や特許、そして業界報告書など外部のデータソースも、貴重な洞察を提供し、イノベーションと研究のための新たな機会を特定するのに役立つのです。 最後に、科学論文や実験ノートのテキストデータのような非構造化データにも隠れた洞察があります。ただし、効果的に分析するには適切なツールと技術が必要です。

この隠れたデータは、ワークフローに応じて、以下の手順で特定そしてアクセスできるようになります。

  • 利用可能なデータソースを徹底的に目録にする。この場合、内部と外部、そして構造化および非構造化データを含めることが鍵となります。
  • 現在および将来の研究開発の取り組みに対する潜在的価値に基づいてデータソースに優先順位をつける。そうすることで、リソースを最大限に活用できるようになります。 例えば、新たに検証された機能性素材をスケールアップしようと計画している場合、その理想的な条件を予測するためには、過去の処方データや製造データへのアクセスを優先させるようにします。
  • データドリブンの意思決定と継続的改善の文化を醸成する。そうすることで、革新的な化学組織はダークデータの潜在的能力を最大限に活用できるようになります。

ダークデータの価値を引き出すために重要な5つのナレッジマネジメント戦略

ダークデータの価値を引き出し、イノベーションを推進する上で重要なナレッジマネジメント戦略には、カスタムキュレーションされたデータセット、セマンティック フレームワーク、自動化されたデータマイニング、そしてコラボレーションワークフローが含まれます。 以下に、各戦略とその有用性を細かく見ていきます。

  1. カスタムキュレーション 
    カスタムキュレーションでは、ある組織のニーズに特化した高品質のデータセットを作成するために、該当分野の専門家が化学データを手作業でキュレーションします。 カスタムキュレーションを使うことで、機能性材料や化粧品、農業、またはその他の化学分野の科学者は、使用しているデータが正確かつ最新であること、そして自分の研究目標に関連していることの確証が得られます。 専門のデータキュレーターとの協力を通じ、組織内の情報を世界の科学に連携させることができ、その内部データをより強固なものにできます。 これをさらに推し進めて、機械学習モデル向けに特別に設計されたカスタムキュレーションデータセットを使えば、AIベースのデジタルトランスフォーメーションの取り組みの更なる強化にもつながります。

    キュレーションされたトレーニングセットがいかにAIのモデル予測精度と移植性を向上させたか、詳しく知るにはこのケーススタディをダウンロードしてください。 
     
  2. セマンティック フレームワーク
    セマンティック フレームワークとは、機能性素材などの特定領域におけるコンセプトや関係を整理そして分類するための標準化されたアプローチです。 このフレームワークは、専門的な用語集、オントロジー、そして分類法の要素を含む場合があり、また化学データに対する組織全体での共通した言語と理解を提供するためのものです。 このアプローチにより研究開発が加速し、科学者は豊富な情報に基づいて決定できるようになります。

    例えば、ある研究者が新しい電子機器に使用する新規材料を同定しようとしているとします。 そのため、まず専門的な用語集、オントロジー、そして分類法を使って、既知の素材の特性や特徴を分類そして整理することから始めました。 そして電気伝導性、光学特性、または熱安定性などで材料を分類する、特殊な分類法を使いました。 このようにして整理することで、化学者は知識のギャップや新しい材料が必要となる領域を、より簡単に特定できるようになるのです。 また、オントロジーを用いることで、ある材料の構造と電子特性との関係など、材料のさまざまな特性間の関係を定義することもできます。 すると化学者は、どの物質が更なる研究が必要なのか、詳細な情報に基づいて決定を下せるようになります。

    蓄積されたユニークな知識が、いかにインサイトを導きそしてデータドリブンな意思決定を可能にするのか、その詳細については、ケーススタディをダウンロードしてお読みください。
     
  3. 自動化されたデータマイニング 
    自動化されたデータマイニング技術を使えば、研究開発組織は大量の非構造化の化学データの中に隠れたパターンやインサイトを発見できるようになります。 機械学習と高度なアナリティクスは、過去の実験や製造条件、科学論文、特許などの化学データを分析することで、化学物質と反応、そして処方との関係を特定できます。 これが研究開発の新たな機会の発見につながり、また既存の製品やプロセスに対する洞察をもたらします。

    例えば、研究者は自分の研究分野に関連している何千もの論文に目を通し、材料特性、合成方法、性能測定基準など重要な情報を抽出します。 この情報が抽出されたら、今度は機械学習アルゴリズムを使ってデータを解析し、新規材料の発見につながるパターンや相関関係を特定できます。 ここで研究者は、特定の合成方法またはスケールアップ条件次第では、望ましい特性を持つ材料が一貫して生産できることや、あるいは特定の構造特性を持つ材料は、特定の用途では優れた性能を発揮する傾向がある、などどいったことを発見できるかもしれないわけです。
     
  4. コラボレーションのツール
    共同作業のためのツールと技術、例えば一元化されたデータベースや統合されたLIMSシステムなどは、研究開発チームが知識や洞察を共有し、データのサイロ化を解消するための効率的で確実な方法です。 一元化されたデータリポジトリへのアクセスを提供することで、研究開発組織はコミュニケーションを改善し、イノベーションを加速できます。 また、一元化されたクラウドベースのデータベースは、地理的に分散している遠隔地のチームや研究者間での知識共有も向上させます。

    現代のデジタルエコシステムでは、2つの組織間の知識の移転も促進します。 これは、産学協同プロジェクトやM&A(合併や買収)の際、研究者が先行研究に基づいて材料の特性や性能データに関する知識を共有する必要がある特に役立ちます。 コラボレーションを促進するデジタルR&Dエコシステムがあると、潜在的なイノベーションの機会をより的確に掴むことができるようになります。

    ダークデータを活用し、効果的なナレッジマネジメント戦略を実施することで、化学企業はイノベーションを加速させ、研究開発の成果を改善できるようになります。 そしてサイクルタイムを短縮し、新たな研究機会を見つけ、製品配合を改善し、さらにどの研究プロジェクトを進めるべきかについて、より多くの情報に基づいた判断ができるようになります。

    東レが、いかにして社内のデータをサイロ化させずにワークフローにうまく組み込んだか、詳細はこのケーススタディをダウンロードしてお読みください。 
     
  5. ナレッジマネジメント戦略を実行に移すための専門家との連携
    化学研究開発における科学情報の複雑さは、ワークフロー全体にわたっています。このことは、組織のインハウスITチームによる対処を困難にしています。 そんな時、外部のパートナーなら、構造化された形式で既存データを保存そして接続するソリューションの開発を支援できます。そうすることで、すべての従業員が価値ある研究開発データに直接的、そして効率的にアクセスできるようになります。 外部パートナーがもたらす経験も、極めて有益なものになります。 そのナレッジマネジメントのベストプラクティスや専門知識に関する洞察力は、貴組織の取り組みを成功に導く上で必ず役立つことでしょう。

curate-connect--analyze