分析

现代数据平台的雪花

Istock 881542122 (1)

随着时代的发展,我们面临的数据挑战也在不断增加——但我们多年来一直在努力解决这个问题。尽管提供了专门的资源、健壮的硬件等,但在传统的内部部署和云托管世界中,我们最终还是会失去sla。此外,管理数据加载、数据操作、数据库大小等等都需要不断地依赖人员。当你看到一个现代的数据平台时,你基本上看到的是一个可以扩展到你的管道需求的东西,在工作中是敏捷的,完全管理的,不需要数据形状的限制,提供可靠的性能,并且很容易通过SQL和api进行查询!进入Snowflake DB,它就像创始人围坐在圆桌旁,把所有的传统问题都写在纸上,然后真正地解决了它。他们的座右铭是一次移动数据,然后以不同的方式、不同的规模和容量多次访问数据。

这将他们引入许多角色,他们自己围绕云上的数据进行显式计算。

  • 数据分析师
  • 传统的数据管道
  • 数据科学团队
  • 应用程序团队
  • BI和分析团队

它们真正地分离了计算和存储,并实现了服务管理的自动化。这就减少了你必须手动编写的代码/脚本,以使这些不同的计算(Snowflake称之为虚拟仓库)满足越来越多的数据需求。

它们的存储在中心,周围环绕着各种大小的计算,以满足上面列出的每个角色的需求。此外,当计算虚拟仓库没有查询任何内容时,服务实际上会关闭,而且不会花费您一分钱。您将根据与计算机大小一致的信用矩阵进行计费。存储成本持平——这让所有企业都猜谜了。Snowflake有一个支持许多第三方产品和ETL工具的生态系统。

雪花

携带任何形状的数据并将其存储到Snowflake中——基本上你可以在同一服务上使用Lake和Mart,并为各种各样的终端用户提供多种分析沙箱的访问。

您可以预先设定所需虚拟仓库的数量和基线,并设置一个选项以在需要时增加规模。当查询开始排队时,新的Virtual Warehouse开始工作,而不会中断现有的查询并完成数据加载。这是Snowflake最好的部分,它可以在没有任何性能问题的情况下接收数十亿行的数据。

为开发和测试实例添加时间旅行(保留数据状态)和免费克隆数据的能力。当涉及到服务不同规模和需求的组织时,它确实改变了游戏规则。

总而言之,这是一个共享的数据体系结构,可以根据需要伸缩并管理自身,而无需太多开销。

大规模处理通过连接器和虚拟仓库分析工作负载- - - - - -

Snowflake有一个到Domo的联邦连接器,可以查询实时数据,并支持应用程序中的移动分析需求。使用Snowflake,你可以使用Tableau和Power BI触发实时查询,如果需要实时仪表板,你可能不用将数据加载到Tableau提取或Power BI数据集。帮助您在BI工具中减少分析模型的大小。可以在Azure、AWS和谷歌上为HIPPA和PII监管需求提供Snowflake。添加元数据管理,您就得到了现代的全面管理数据服务。

我们在Perficient正与多个垂直领域的许多现有和潜在客户合作,雪花作为合作伙伴,讲述数据的故事,减少由来已久的日常开支——请随时联系我们。我们与Informatica、Talend密切合作,帮助企业实现对Snowflake的全面利用。在现代,雪花是这个行业真正的颠覆者。

关于作者

Abhi Majumdar是一位拥有超过14年技术和商业咨询经验的项目和软件实施经理。Abhi为不同的客户提供数据和分析服务。

更多作者介绍

留下一个回复

这个网站使用Akismet来减少垃圾邮件。了解如何处理您的评论数据