数据与智能

在Tableau中优化数据源

Istock 1125544401

在2021年,如果你的tableau仪表板需要超过10秒的时间来加载,那么你的tableau工作簿可能会有一些性能问题。如果您正在处理小型数据集,则不必担心性能问题。但是,如果您正在处理数百万甚至数十亿条记录,那么性能就会成为一个大问题。这将导致你在打开tableau工作簿时遇到严重的麻烦。

将了解如何提高数据源级别的性能。

技巧1:数据源中的连接类型

在tableau中连接数据源时,我们有两个选项活和提取.因此,在tableau中使用提取选项是可靠和快速的。因为摘要以一种非常优化的方式存储,并将所有结果和计算作为一个值存储在数据源中。它将计算一次并存储结果,因此每次运行查询时,它都会从数据源获取计算结果。

提示2:添加数据源筛选器

数据源上的数据越多,tableau就可以使用更多的资源来进行筛选、计算和聚合等。所以,如果你在数据源中有你不需要的数据,那么你就是在浪费tableau的资源。此外,性能也会受到影响。为了避免这种情况,总是删除不必要的东西。删除不必要记录的最佳方法是在提取级别使用过滤器

提取

单击“编辑”并添加要限制的字段名。

数据智能——大数据的未来
大数据的未来

通过一些指导,您可以创建适合组织需求的数据平台,并从数据资本中获得最大回报。

获取指南

提示3:聚合您的摘要

我们可以通过减小数据源的大小来提高数据源的性能,这就是在数据源中使用聚合函数。在这里,我们有两个选项聚合和滚动。

Aaaaaaaaaaaaaaaaaaaaaaa

聚合如果我们使用Tableau extract中的汇总,它会将这两个记录汇总为1月份的一个记录,并将销售额相加。

向上:如果我们在年度级别使用汇总功能,tableau将在提取时将所有这三个记录汇总为一个记录,并汇总2020年的销售额。

技巧4:使用关系组合数据

假设你有多个表,你想把它们组合起来
有三种选择:

  1. 的关系
  2. 连接
  3. 数据融合

捕获

关系:你会得到最好的结果,因为tableau会将表分开,而不会将它们合并到一个大表中。这将减少数据源的大小。通过这种关系,tableau将仅为与分析相关的数据生成查询。

join: join的性能相对较低,因为tableau会执行并将两个表中的所有列合并到一个大表中,这可能会降低性能。

数据混合:如果您正在混合两个大型数据源。例如,SQL和oracle在最低级别。例如,您正在使用ID进行数据混合,如果您希望组合数据,则始终使用关系,因为它使您可以控制以您想要的方式进行优化。

提示5:实体店更快

逻辑Vs物理

如果我们知道tableau如何存储摘录,就可以提高性能。
我们有两个选择逻辑表和物理表。
如果在数据源级别上不使用任何过滤器和聚合,则始终使用物理表。因为它为数据源中的每个物理表使用一个提取表来存储数据。此外,在查询时执行连接,从而获得更好的性能。

留下回复

你的电邮地址将不会公布。

这个网站使用Akismet来减少垃圾邮件。了解如何处理您的评论数据

阿卡什Chindaliya

具有5年经验的高度驱动的商业智能开发人员。对SQL和关系数据库有较强的理解。有使用Tableau和PowerBi创建复杂仪表盘的经验,在多个领域有特殊经验。我负责理解业务需求和规划解决方案,以满足数据需求,并开发、设计和维护仪表板。

更多来自作者

订阅每周博客文摘:

报名
关注我们
推特 Linkedin 脸谱网 Youtube Instagram