这是一个系列的第二篇博客,深入研究组织如何成为数据驱动的,来自Perficient的高级数据战略家和解决方案架构师Chuck Brooks博士的见解和策略。点击阅读第一篇博客在这里.
使用过时技术的公司,如内部数据仓库,Excel电子表格作为数据源,电子邮件作为社区的主要来源,往往会产生保护和储存数据的文化。虽然拥有合适的技术并不一定是创造数据文化的捷径,但技术和文化是同一枚硬币的两面,因为两者都依赖于公司对创新的开放态度。
数据仓库
在第一篇博客中允许员工和客户访问数据,我们讨论了数据竖井。
在许多组织中,数据被孤立在数据存储库中,这些存储库由一个部门或业务单元控制,并与组织的其他部分隔离。竖井使得组织其他部分的知识工作者很难访问和使用数据。数据竖井阻碍了业务运营和支持它们的数据分析计划。竖井限制了知识工作者使用数据管理业务流程和做出明智的业务决策的能力。那么,如果竖井这么糟糕,为什么那么多组织都有呢?
旧技术和旧范式
竖井的发展有几个原因,但其中两个最大的原因是许多组织继续使用旧的技术和过时的范式。
存储成本
在数据管理的早期,存储是极其昂贵的。成本阻止了组织收集和存储整个公司产生的大量和各种各样的数据。在没有清楚地了解数据将如何使用的情况下,收集和存储数据是不划算的。组织中的不同部门对于应该收集哪些数据以及可以有效使用哪些数据有不同的想法。这导致不同的部门和组织单位资助和收集他们认为有用的数据,并将其存储在自己的独立数据存储库中。
性能
早期的关系数据库无法在处理大量数据进行分析的同时保持可接受的性能水平。不断提高的性能意味着限制数据量。为了减少数据库管理系统需要管理的数据量,引入了数据集市。数据集市是面向主题的数据库,通常是组织数据的一个片段(竖井)。数据集市中保存的数据子集通常与特定的业务单元(如销售、财务或营销)保持一致。因为数据集市只包含适用于某个业务领域的数据,所以人们通常认为数据集市是快速获得可操作见解的经济有效的方法。
新技术和新范式
快进到2022年,数据存储技术现在又快又便宜,以至于我现在认为收集和存储大部分或所有可用数据,然后决定以后如何使用它们是很重要的。此外,我们还了解到,解决业务问题所需的数据通常不仅仅包含在一个业务单元的数据中,甚至不包含在一个组织内。
这一事实意味着数据集市已经死了。仍在使用数据集市的组织没有接受新的数据管理技术和/或没有认识到许多业务问题和业务决策需要来自整个组织的数据,以及来自外部流程和外部组织的数据。在2022年,现有的数据管理系统可以收集和集成做出数据驱动的业务决策所需的大量和各种数据,并且它们的性能水平令人印象深刻。
拥抱新技术
我相信谷歌云平台(GCP)是“地球上最好的数据管理平台”。组成GCP数据平台的新技术提供了几种数据管理系统。Cloud SQL和Cloud Spanner提供在线事务处理(OLTP)功能,Bigtable和Cloud Firestone提供NoSQL功能,BigQuery提供OLAP功能。所有的GCP数据管理系统都提供了存储和计算的分离。通过解耦这些组件,GCP数据管理平台提供:
- 廉价的,几乎无限的,无缝扩展的存储
- 无状态、弹性计算
- 数据共享
- 兼容acid的存储操作
- 逻辑存储模型,而不是物理存储模型
- 无分且可伸缩的性能
GCP平台提供最佳的性能和低廉的存储成本。该平台为数据团队提供了新的技术和工具,以消除竖井,收集、集成数据,并将数据交付给企业知识工作者。
Perficient的云数据专业知识
世界领先的品牌选择与我们合作,是因为我们足够大,可以扩展大型云项目,同时足够灵活,可以在您的业务特定领域提供专注的专业知识。
我们的云计算、数据和分析团队可以帮助您完成从数据策略到实施的整个数据和分析生命周期。我们将帮助您理解您的数据,并向您展示如何使用它来解决复杂的业务问题。我们将评估您当前的数据和分析问题,并制定一个策略来指导您实现长期目标。
下载指南,通过谷歌云平台成为数据驱动的组织,了解更多Chuck博士的GCP数据策略。