AiToolGo的标志

精通 Tableau Prep:数据准备综合指南

深入讨论
易于理解
 0
 0
 1
本文提供了 Tableau Prep 的综合指南,涵盖了其新功能、数据连接、清理、合并和输出生成过程。它包括分步说明和实用技巧,以有效管理 Tableau Prep Builder 中的数据工作流。
  • 主要观点
  • 独特见解
  • 实际应用
  • 关键主题
  • 核心洞察
  • 学习成果
  • 主要观点

    • 1
      Tableau Prep Builder 的详细分步指南
    • 2
      深入涵盖数据清理和合并技术
    • 3
      实际应用中的实用示例和技巧
  • 独特见解

    • 1
      使用通配符处理多个数据文件的创新方法
    • 2
      高效清理和转换数据类型的策略
  • 实际应用

    • 本文为希望简化 Tableau 数据准备流程的用户提供了实用的资源,适合初学者和经验丰富的用户。
  • 关键主题

    • 1
      Tableau Prep 中的数据连接方法
    • 2
      数据清理技术
    • 3
      合并和转换数据
  • 核心洞察

    • 1
      全面涵盖 Tableau Prep 功能
    • 2
      针对实际数据场景的实用示例
    • 3
      侧重于基本和高级数据准备技术
  • 学习成果

    • 1
      了解如何使用 Tableau Prep 连接和清理数据
    • 2
      学习合并多个数据源的高级技术
    • 3
      掌握为 Tableau 中的分析准备数据的实用技能
示例
教程
代码示例
可视化内容
基础知识
高级内容
实用技巧
最佳实践

Tableau Prep 简介

Tableau Prep 是一款强大的数据准备工具,旨在帮助您清理、整理和转换数据以进行分析。本指南全面概述了 Tableau Prep,涵盖了从连接数据源到构建复杂工作流的方方面面。无论您是初学者还是经验丰富的数据分析师,本指南都将帮助您精通 Tableau Prep,并简化您的数据准备流程。Tableau Prep Builder 可让您以可视化且直观的方式转换数据,从而更轻松地识别和纠正错误、处理缺失值,并为 Tableau Desktop 或其他分析工具中的分析准备数据。借助 Tableau Prep,您可以创建可重复的工作流来自动化数据准备任务,从而节省时间并确保数据分析的一致性。

连接数据源

Tableau Prep 支持多种数据源,包括 Excel 文件、CSV 文件、数据库(如 SQL Server、MySQL 和 PostgreSQL)以及基于云的数据源(如 Google BigQuery 和 Amazon Redshift)。在 Tableau Prep 中连接数据非常简单。您可以使用“连接”窗格选择数据源并指定连接详细信息。Tableau Prep 还支持自定义 SQL 查询,允许您从数据库中提取特定数据。当连接具有相似结构但包含多个文件时,Tableau Prep 的通配符联合功能可以自动将它们合并为单个数据源。这对于处理分散在多个文件中的数据(例如月度销售报告)特别有用。对于基于 Web 的 Tableau Prep,文件可以单独上传。请确保您拥有访问数据源所需的凭据和权限。Tableau Prep 还允许您连接到 Tableau Server 或 Tableau Cloud 上已发布的数据源,从而使您能够重用现有的数据连接并维护数据治理。

清理和转换数据

清理和转换数据是数据准备过程中的关键步骤。Tableau Prep 提供各种工具和技术来帮助您清理和整理数据。您可以使用清理步骤来执行过滤、重命名字段、更改数据类型和删除重复项等操作。“配置文件”窗格提供数据的可视化摘要,让您快速识别异常值、缺失值和其他数据质量问题。您可以使用计算字段根据现有数据创建新字段、执行计算和转换数据值。Tableau Prep 还支持模糊匹配,允许您将相似的值分组在一起,即使它们不完全相同。这对于纠正数据中的拼写错误和不一致之处非常有用。可以为字段分配数据角色以验证数据并确保一致性。清理操作的顺序很重要,因为 Tableau Prep 按顺序应用这些操作。“更改”窗格会跟踪您对数据所做的所有更改,让您可以根据需要查看和修改您的步骤。

构建和组织您的工作流

Tableau Prep 使用可视化工作流界面,允许您构建和组织数据准备步骤。您可以向工作流添加步骤来执行各种操作,例如清理、聚合、联接和联合数据。Tableau Prep 会自动连接步骤,创建一个代表操作顺序的流程。您可以重新排列步骤、添加分支和创建组来组织您的工作流。向步骤和更改添加注释有助于记录您的工作流并使其更易于理解。流程导航工具允许您快速浏览复杂的工作流。您还可以复制和粘贴步骤、操作和字段,以便在工作流的其他部分重用它们。可以创建可重用的步骤来封装常见的数据准备任务,从而更轻松地维护和更新您的工作流。Tableau Prep 的工作流界面提供了一种清晰直观的方式来可视化和管理您的数据准备过程。

分析和验证数据

Tableau Prep 提供多种工具来分析和验证您的数据。您可以查看分配给每个字段的数据类型,检查值的分布,并搜索特定的字段和值。“配置文件”窗格显示数据的摘要,包括唯一值的数量、值的范围以及是否存在空值。您可以对字段进行排序和重新排序,以便更好地理解您的数据。突出显示工作流中的字段和值有助于跟踪数据流并识别潜在问题。通过过滤数据,您可以专注于数据的特定子集并排除不相关的信息。Tableau Prep 支持各种过滤器类型,包括计算过滤器、范围过滤器和通配符过滤器。删除重复行可确保您的数据准确一致。数据角色可用于根据预定义标准验证数据并识别潜在错误。通过在 Tableau Prep 中分析和验证数据,您可以确保数据干净、准确并准备好进行分析。

高级数据操作技术

Tableau Prep 提供了一些高级数据操作技术来处理复杂的数据准备任务。您可以使用详细级别 (LOD) 计算在不同粒度级别执行聚合。排名和行号计算允许您为数据分配排名和行号。数据透视可将数据从宽格式转换为长格式,反之亦然。这对于重塑数据以满足分析要求非常有用。Tableau Prep 还支持 R 和 Python 等脚本语言,允许您执行自定义数据转换并与其他分析工具集成。Einstein Discovery 集成允许您在数据准备过程中添加预测性见解。这些高级技术使您能够应对各种数据准备挑战并创建复杂的数据工作流。

保存、共享和自动化您的工作

Tableau Prep 允许您保存工作流并与他人共享。您可以将工作流保存为 .tfl 文件,这些文件可以在 Tableau Prep Builder 中打开和编辑。Tableau Prep 还支持自动保存,这有助于防止意外中断时的数据丢失。您可以在 Tableau Desktop 中查看工作流的输出,从而可视化和分析准备好的数据。Tableau Prep 可以创建数据提取文件 (.hyper) 和已发布的数据源,这些文件可以在 Tableau Desktop 中使用或与其他人共享。您还可以将工作流输出保存到外部数据库,例如 SQL Server、MySQL 和 PostgreSQL。Tableau Prep 支持增量刷新,允许您使用新数据更新数据工作流,而无需重新处理整个数据集。工作流可以手动运行或安排自动运行,确保您的数据始终是最新的。通过保存、共享和自动化您的工作,您可以简化数据准备流程并确保数据始终准备好进行分析。

故障排除常见问题

本节提供了在使用 Tableau Prep 时遇到的常见问题的故障排除技巧。它涵盖了兼容性问题、运行工作流时出错以及连接数据源时的问题。本指南提供了这些问题的解决方案和变通方法,帮助您快速有效地解决它们。它还提供了有关如何使用 LogShark 分析 Tableau Prep 日志并确定问题根本原因的信息。通过遵循这些故障排除技巧,您可以最大限度地减少停机时间并确保数据准备工作流顺利运行。

Tableau Prep 函数参考

本节提供了 Tableau Prep 中可用函数的全面参考。它涵盖了各种函数类别,包括数字函数、字符串函数、聚合函数、类型转换函数、日期函数和逻辑函数。每个函数都进行了详细描述,并附有在数据准备工作流中使用它们的示例。此参考资料是理解和使用 Tableau Prep 中可用函数的完整范围的宝贵资源。

Tableau Prep 新功能

本节重点介绍了 Tableau Prep 最新版本中的新功能和增强功能。它提供了新功能的摘要、指向详细文档的链接以及有关兼容性要求的信息。通过及时了解最新功能,您可以利用最新的改进并简化数据准备流程。

 原始链接:https://help.tableau.com/current/offline/zh-cn/tableau_prep.pdf

评论(0)

user's avatar

      相关工具