
数据建模:未来人工智能技术的基本支柱
若想在数字技术领域取得成功,高质量的数据基础和连接您组织数据资产的底层结构同样重要。对于可以推动研发组织转型的人工智能、机器学习和其他数字业务应用而言,先具备高质量的数据和高效的数据模型是必要的。
数据模型可以定义您数据的整理和存储方式以及内部的数据关系。有效的模型可以让贵组织上下的用户轻松理解业务的运营方式。它是几乎每一个高价值业务解决方案的关键,如果跨越组织内个人业务范围 (LOB) 或运营的界限予以运用,其发挥的价值最大。该数据模型是信息管理的战略支柱,将决定未来业务关键项目可否取得成功。
但是,现代数据已变得复杂化和多样化,使得现在鲜有简便的数据模型创建任务。对于研发公司而言,这种情况尤为棘手,因为科学数据拥有独特的复杂性,且往往不连贯。此外,随着产生的数据数量成倍增加,打造有效数据模型以将其作为成功实施新数字技术的基础从未像现在这样重要。
在我们最新的白皮书中,我们探讨了瞬息万变的数字布局相关问题并剖析了如何相应地准备您的数据基础。本篇博文说明了数据建模的益处,列出了常见的陷阱并给出了何谓有效数据建模的研发示例。
数据建模可让您的研发组织如何获益
数据模型可为您提供定义和分析贵组织内部数据的标准机制。但远不止于此。实际上,一个优质的数据模型,结合精心设计的数据架构后,可让贵组织任何职员高效访问和使用信息(可能员工并未意识到正在予以采集的信息),从而形成战略优势。
通过有效的企业数据模型,您甚至还可整合贵组织现有信息系统,因为许多大型研发公司各类彼此互不沟通的系统中都存在数据孤岛。通过在每个系统中进行数据建模,您可以看到数据之间的关系和冗余,解决分歧并整合异构系统,以便这类系统可以协调运行。这种整合的企业数据模型可针对数据查询和报告提供一致的情境信息、数据沿袭和唯一真实版本。
最终,经过深思熟虑构建的模型可让您更深入地了解您的业务领域,因为建模过程要求您的团队定义推动建模的数据。数据模型中表示的数据和关系为了解业务流程提供了基础。数据模型可以实现外部数据打通并与贵组织内部副本融合,从而提高分析和预测的价值,帮助您的企业游刃应对挑战并把握机会。
避免数据建模常见陷阱的提示
首先,确保目标明确。如果开发模型的业务用例定义不明确,则数据模型无法提供最大价值。因此,应仔细考虑您希望数据建模程序实现何种目的,并关注围绕特定业务需求或流程改进展开。
在达成一致的基础上,确定采取自上而下法、自下而上法还是混合法哪种方法最佳。将合适的因子与正确的建模方法匹配后,将极大提高模型成功的几率。根据业务用例和底层技术来选择数据建模方法,因为每一类数据模型都有其独特的一些优势和用途。
设计模型时,应尽可能使其简单并接近现实生活。避免出现推测性内容 - 数据模型必须完全满足要求,但不是极力追求过度设计。所有团队及利益相关者之间进行开诚布公的无缝沟通对数据建模取得成功极其重要,可确保所有数据元素均可以融入并在组织内拥有相同的意义和解释。
您的数据模型在设计上不应只解决单一问题,而是以更全面的视角对待生态系统中的所有数据元素,从而解决各类问题。通过这种方法,有效的数据模型可以解决各类定义明确的问题以及暂未予以说明的问题。
最后,应意识到您的数据模型是一个活跃的人工制品,需要更新和维护,比如,应确保对数据模型任一级别进行的更改也在其他级别上予以体现。尽管大多数数据模型只需极少的维护,但拥有保持模型更新的正式流程至关重要。
数据建模的研发实际应用
那么,数据模型设计如何在实际中发挥作用?举例来说,想一想一家全球动物保健公司近期推出了一系列家畜和宠物食品。要想创建其数据模型,所有相关数据元素均必须考虑在内,比如,文本内容、化学结构、药物/靶点关系、动物分类名称(界、门、属等)、财务价值以及原理图、图形、图表和其他许多元素。通过这些多层面的数据集,可以轻松了解数据建模的复杂性。
在像这类复杂的研发案例中,数据模型应足够详细以供使用,但同时也应简便以易于理解,在这二者之间取得平衡非常重要。还应进一步考虑确保数据模型的灵活性,因为从长远来看变化过程可能要求模型加以改造。
鉴于这些需求,该动物营养示例的理论数据模型可以大致如下:
该模型通过标准化的方式定义了数据元素和关系,以便组织的数据可以互相关联。您的模型应包括业务和主数据,以支持企业总体流程和报告。如果您想要深入分析该数据模型示例,请阅读我们的白皮书以了解更多详情和考虑事项。
做好准备,迎接未来数字发展
数字革命正在如火如荼地进行中,数据建模也比以往更具影响力。研发组织也应通过将数据建模放在第一要位,从而力求全面发挥自身数据资产的价值。设置数据模型所付出的艰苦努力最终将让您获得回报,届时您将拥有牢固的数据基础,可以打造让贵组织获得竞争优势的解决方案。
如果您正在期待建立可将数据准确分类的企业数据中心并想要拥有更多信息,可下载我们的未来数字机会白皮书。在白皮书中,我们更深入地讨论了数据建模的重要性以及当前研发领域的数字化状态。
精选内容
About CAS
CAS, a division of the American Chemical Society, partners with R&D organizations globally to provide actionable scientific insights that help them plan, innovate, protect their innovations, and predict how new markets and opportunities will evolve. Leverage our unparalleled content, specialized technology, and unmatched human expertise to customize solutions that will give your organization an information advantage.