デジタル技術は急速に発展しており、それに追いついて行くのは困難です。癌の成長の予測から人間の脳の模倣まで、人工知能(AI)に関わる話題が大きく公表されており、ほぼ毎日発展があるようです。医療、金融、輸送などの業界で、新たな応用が絶え間なく発見されています。これほど急成長の可能性があるのですから、R&D組織がこの分野に飛び込むことに熱心で、大きな投資をしているのも驚くべきことではありません。しかし問題があります。これらのプロジェクトの成功率は15%と低く推定されています。最近の例では、IBMのワトソン技術を健康管理に適用した際に広く公表された失敗があります。
正解はなんでしょうか。ただ待っていれば、デジタル技術で優位に立つ競合他社に劣る危険性があります。ディープラーニングや次の突破口など、今日の技術を活用して貴組織を成功に導く賢い投資を可能にするにはどうしたらいいのでしょうか。このブログ記事では、デジタル技術の導入における長期的な成功には、堅実なデータ基盤の構築がいかに重要であるか、将来的に長きにわたって配当を得ることができる賢い投資を開始するにはどうすればよいのかを紹介します。
データの整理。混乱したデータによる犠牲とは。
企業のデジタル技術プロジェクトの失敗率が高い理由のひとつは、組織がAIなどの新技術によってもたらされる可能性を取り巻く誇大宣伝に魅了され、これらの技術を成功させるために必要な、それほど心躍らない基本要素にある既存のギャップを見落とすことにあります。この見逃しは、AIの能力に対する過度の野心的な期待と相まって、しばしば失望する結果に繋がります。
組織が見落とす最も一般的なギャップひとつは、基礎となるデータ資産の強さです。これらのデジタル技術を構築、訓練するための高品質で強固なデータ基盤の所有を確実にすることが重要です。この「データのブラインドスポット」の流行は、83%の回答者がきちんと収集されたデータコレクションを持つことが最大の関心事ではないと答えた、Forresterによる最近の調査で明らかになりました。
では、なぜ高品質のデータはデジタル技術の分野で成功するためにそれほど重要なのでしょうか。重要なのは、これらの技術は新しい知識を生み出すことができないということです。これらの技術は提供された情報に基づいて学び、発達します。すべての出力は入力の品質、すなわち貴組織のデータにリンクされています。その為、不完全な、構造化されていない、または無関係なデータを入力すると、返されるデータの品質が大きく損なわれ、これに大きく依存すると、成功と更には安全に対して組織的なリスクが発生する可能性があります。実際、品質の低いデータは 間違った決定、非効率、収益の損失などにより、米国経済に年間3.1兆ドルの費用がかかると推定されています。
これらの状況を踏まえて、貴組織に成功するデジタル変換戦略を構築するにはどうすればいいでしょうか。弊社の最新のホワイトペーパーをダウンロードしてください。
高品質なデータ基盤の構築ブロック
組織のための高品質のデータ基盤を構築することは、デジタル変換を開始する際に行う最も重要な投資です。しかし、何があれば十分なのでしょうか。データの高品質化の定義は広範ですが、データの準備状況を測定する3つの主な属性を特定しました。
- 十分なデータが必要。 デジタル技術は、できるだけ多くのデータを必要としています。大きいデータセットでのみ、正確な結論に達することができます。例えば、Facebook上での顔認識は97.35%の精度を持ち、人間のパフォーマンスにとても近づいています。これは、400万人のFacebookユーザーのデータセットへのアクセスによってのみ可能になりました。科学技術のR&D会社が必要とするデータの量は、貴組織が取り組もうとしている問題の性質と複雑さによって決まります。データ要件を定義する際に、目標とする将来のアプリケーションのニーズを考慮しましょう。
- 多様なデータが必要。 組織の中核となる技量や市場に関する広く深いデータ収集が重要です。しかし、成長とイノベーションの機会を模索するためにデジタル技術を使用する場合、データの多様性も非常に重要です。データが既知の領域にのみ関連している場合、ネットワーク解析やAIなどの技術が多くの新しい機会を明らかにする可能性は低く、単にあなたの現在の知識を検証します。従って、中核となるものに合わせたデータコレクションを特定し、含めることが重要です。
- よく管理されたデータは必須。 使える洞察を引き出すためには、データ収集がよく構造化されていることが重要です。重要なデータモデル、キュレーションおよびクリーンアップを構築することは、テキストコンテンツ、化学構造、薬剤/標的関係、分類学的動物名(界、門、属など)、財務値、回路図、グラフ、チャートなどを含む可能性があるユニークで複雑な科学データにとって特に重要です。統計分析と計算アルゴリズムは、大規模なデータセットを整理して豊富にするのに役立ちますが、データガバナンスプロセスで人間による精選を許可することも重要です。経験豊富な化学者、生化学者、データ科学者は、データを分析し、AIシステムができない洞察を提供することができます。
データ基盤の迅速な立ち上げ
データの開発は進歩を遅らせるように感じるかも知れませんが、それはあらゆるデジタル技術プロジェクトの成功に不可欠な投資です。技術が急速に進化するのに伴い、堅実に構築されたデータ基盤は、新しいAIや機械学習アプリケーションをより効率的に実装する自由を提供し、今後長年に渡ってリターンを提供し続ける利点を提供します。
プロジェクトを妨げているタイトなタイムラインや才能のギャップがあるのなら、データ基盤を迅速に構築するための、高品質のよく構造化されたデータコレクションと、必要な構造とプロセスを効率的に構築する手助けになる技量を提供できる外部の専門家と提携することを検討してください。CASでは、100年以上にわたって科学データから洞察を管理、収集、抽出してきました。開始する準備は整いましたか。CASがお手伝いいたします。
「R&Dにおける有益なデジタル変換」にある弊社のホワイトペーパーをダウンロードして詳細を参照するか、特定のニーズについて検討する為に弊社に直接お問い合わせください。