Tableau 学习 (3)合适的数据融合方式
Tableau 学习 (3)合适的数据融合方式
Tableau 数据融合的方法3种,且每一种都有自己身适应的一些条件。
一 连接
连接是用于合并通用字段(通用列)关联表的一种方式,使用连接合并数据后通常会产生一个通过添加数据列横向扩展的虚拟表。
这里说一下表连接的类型以及连接后的结果
内部:使用内连接来合并数据时,生成表将包含两个表均匹配的值 (数据库的等值连接、inner join)
左侧:生成的表将包含左侧表中所有值以及右侧表中对应匹配项。当左侧表中在右侧表中没有对应的匹配项时,将在数据网格中显示null值。(数据库的left join)
右侧:生成的表将包含右侧表中的所有值以及左侧表中对应匹配项。当右侧表中的值在左侧表中没有与之对应的匹配项时默认显示null值。(数据库的right join)
完全外部:生成的表将包含两个表中的所有值当任一表没有找到与之匹配项时,将在数据网格中显示null值
当然就算是连接合并的表的情况也会分为同一数据库的表,和不同一数据库的表的连接区别
连接统一数据库的表
这里指的同一数据库包括数据库、excel或文本是同一个但其包含多个数据表。此时只需要一个连接,具体的步骤如下:
步骤1:在开始界面的左侧连接菜单里找到需要连接的数据库(excel 文本),连接数据库(打开excel)此时可以在tableau看到刚刚打开的数据库以及库中的表
图 3-1
步骤2:将所需要关联的表拖入右侧的容器中,图3-2所示
图3-2
步骤3:选择表的关联关系,确保能够反映我们要展示的数据
图3-3
步骤4:关联关系以后查看数据,确保连接生成想要的结果
连接不同数据库的表
步骤1:在开始界面里找到目标数据库,如图3-1
步骤2:同样是将这个数据源的表拖入右侧容器里 如图3-2
步骤3:在左侧连接框中选择添加来新增目的数据库的连接,如图3-4
图3-5
步骤4:则是如选择关联的表依旧拖入右侧容器中选择数据的关联关系,如图3-3
步骤5:关于使用多连接数据源的要注意一下问题:
- 需要确保数据提取文件是第一个连接。
- 如果对数据做透视,必须在同一连接的文本列或者同一excel列,不能再透视中包含不同数据库的列。
- 对于每个连接,Tableau 都会向数据库发送独立的查询连接,并采用数据提取的文件格式将结果存储在一个临时的表中。当执行跨数据库连接时,Tableau会将这些临时表连接在一起,这些临时表是数据库连接所必需的。
连接常见的问题及处理方法
(1)无数据或缺失数据
此时可能需要更改连接类型或连接条件中使用的连接字段。如果是连接中字段不匹配,通常可能是格式不一致,亦或者本身字段的值不一致如大小写、空格等等,可以做新增计算列做一定换之后予以关联。
(2)重复数据
可以改用数据混合的方式合并数据,或使用自定义的sql将表改为适合分析的结构
二 混合
数据混合也叫数据融合,指在单个工作表上融合来自各个数据源的数据。其工作方式:使用辅助数据源中的数据补充主数据源中的数据,数据在公用维度上进行连接,不会创建行级别的连接,并且不向数据中添加新的维度或行。
混合数据适用的场景
- 连接数据导致数据重复
- 连接性能很慢
- 数据需要在tableau做一些清洗
- 想合的数据来自跨数据库连接不支持的不同数据库
数据混合必备的条件及步骤
数据混合至少需要一个主数据源和至少一个辅助数据源。指定主数据源后任何后续数据源会被视为辅助数据源,并且视图中只会显示主数据局源中具有对应的匹配项的辅助数据源列,指定主、副数据源之后必须要有一个公用维度(连接字段)。混合数据的具体步骤如下:
步骤1:连接到数据并设置数据源,第一个数据源用图3-1的方式,后续的数据源则是通过“新建数据源”或CTL+D快捷键设置,如图3-6
图3-6
步骤2:将左侧边条的数据创各种设置成主数据源,以及编辑主副数据源之间的关联字段 如图3-7
混合常见的问题及处理方法
(1)辅助数据源不存在与主数据源的关系,或者没有启用主、副数据源之间的关系字段
当有时候将辅助数据源的数据拖入视图时弹出“无法从【辅助数据源名称】使用字段”,此时是可能是没有增加主、副数据源的关系或者没有启用他们的关联字段,如图3-8操作
图 3-8
三 并集
并集就是一种将值也就是行附加到表的方法通常此方法合并具有相同的列的表,合并后的数据会产生一个虚拟表于此表具有相同的列,但会通过添加数据进行纵向扩展。(注意前面的数据连接,数据融合皆为横向扩展)
并用的应用场景
在很多企业中实际采集录入业务数据的过程,会将数据结构相同但时间段不同的表按时间分开存储。在实际分析师往往需要综合所有时间进行分析,此时就可以通过并集的方式将数据合并在一起展开分析,并集如图3-9操作
图3-9
并集在使用中的注意问题
(1)无法使用并集合并数据库存储过程
(2)并集合并相同连接的表,不能合并不同数据库中的表
(3)处理数据库的并集时,可以转化为sql的union 操作
Tableau 学习 (3)合适的数据融合方式相关推荐
- 赛事推荐| 建筑物实例分割和高度估计的多任务学习——2023 IEEE GRSS 数据融合赛道2
1. 赛题名称 联合建筑物提取和高度估计的多任务学习 2. 赛题背景 该轨道定义了建筑物提取和高度估计的联合任务.两者都是建筑改造的两个非常基础和必不可少的任务.与轨道 1 相同,输入数据是多模态光学 ...
- 在SAR-Opt数据融合领域针对深度学习的SEN1-2数据集
The SEN1-2 Dataset for Deep Learning in SAR-Optical Data Fusion Jul 2018 by M. Schmitt & L. H. H ...
- 区块链学习(6)-EVM有6种方式可以存储数据
一.在Ethereum虚拟机(EVM)中,有6种主要方式可以存储数据.这些数据存储方式具有不同的用途.特性和Gas成本. 存储(Storage):存储是EVM中永久保存数据的地方.合约的状态变量会存储 ...
- 基于联邦学习的多源异构数据融合算法 Multi-Source Heterogeneous Data Fusion Based on Federated Learning
5.基于联邦学习的多源异构数据融合算法 Multi-Source Heterogeneous Data Fusion Based on Federated Learning 摘要:随着科技的迅猛发展, ...
- IEEE ICIP 2019 | 更快更好的联邦学习:一种特征融合方法
目录 前言 Abstract 1.Introduction 2.Related Work 3.Methods 3.1 Feature Fusion Modules 3.1.1 Conv operato ...
- 面向制造领域人机物三元数据融合的本体自动化构建方法
面向制造领域人机物三元数据融合的本体自动化构建方法 人工智能技术与咨询 点击蓝字 · 关注我们 摘要 当前,智能制造面临的许多问题都具有不确定性和复杂性,单纯地利用专家经验和机理模型难以有效解决.鉴于 ...
- 总结 62 种在深度学习中的数据增强方式
数据增强 数据增强通常是依赖从现有数据生成新的数据样本来人为地增加数据量的过程 这包括对数据进行不同方向的扰动处理 或使用深度学习模型在原始数据的潜在空间(latent space)中生成新数据点从而 ...
- 多传感器数据融合学习笔记
一.概念 多传感器信息融合技术就是利用计算机技术将来自多传感器或多源的信息和数据,在一定的准则下加以自动分析和综合,以完成所需要的决策和估计而进行的信息处理过程. 多传感器信息融合技术的基本原理就像人 ...
- 基于联邦学习的多源异构数据融合算法
摘 要 随着科技的迅猛发展,具有计算和存储能力的边缘设备数量不断增加,产生的数据流量更是呈指数式增长,这使得以云计算为核心的集中式处理模式难以高效处理边缘设备产生的数据.另外,由于边缘网络设备的多样性 ...
最新文章
- 【C++】clipp 一个命令行参数解析器
- 实现图片打乱_基于混沌Logistic加密算法的图片加密与还原
- kubectl 重启pod_记一次kyverno重启解决
- SpringBoot 项目使用 SLF4J+logback 进行日志记录,来增强可维护性
- 怎么给网站加js_网站站内SEO优化实操细节详解,权重上升嗖嗖的
- C++ 版本ORM访问数据库之ODB访问oracle的Demo(三)
- 常用MIME类型,解决IIS布署后字体文件、mp4视频文件等not found 的错误
- Youtube Links
- HeadFirstJava——9_构造器与垃圾收集器
- python 模型 欺诈概率_手把手教你使用Python实战反欺诈模型|原理+代码
- 百万级别数据库优化方案
- hadoop-uber作业模式
- c语言网络套接字讲解,C语言学习笔记-网络与套接字
- 【基于Android的连连看游戏的设计与实现】
- 写论文时,画黑白电路图的技巧
- ssh连接工具----xmanager5
- 由开发者的人品问题领略测试人员的人品问题
- 论文精读:Joint Multi-modal Aspect-Sentiment Analysis with Auxiliary Cross-modal Relation Detection
- 4年工作:从量变到质变(公开版)
- 亚马逊ec2 实例删除_在Amazon EC2实例中的Red Hat上安装SQL Server Linux
热门文章
- 最全的Web开发工具汇总!
- Python这么火,能干什么?这四大主要用途是你必须得知道的!
- mysql 的命名管道_笔记27-徐 SQLSERVER命名管道工作原理
- VCard SaaS v7.3.1 - 数字名片生成器 SaaS - Laravel VCard SaaS
- linux gid 含义,Linux系统UID和GID详解
- execution 表达式用法汇总
- C# ManagementClass 文件夹共享
- 什么是协方差,怎么计算?为什么需要协方差?
- 腾讯: 可视化, 低代码生成器,正式开源!
- linux lxc端口修改,Linux LXC基本配置选项