启蒙之路--BI
好久没有写东西, 一直想着继续坚持,能像以前一样,偶尔去写一点东西,不管是工作学习还是生活上,之前在ITeye写了几篇,由于这段时间一直感觉心很累,就没有坚持,久而久之也就淡忘了,没有那么回事了。最近,偶尔和一位客户聊天中,提到这件事,觉得还是坚持写一点东西比较好,所以就开始写了,希望自己能够一直坚持下去。今天我就谈谈我差不多2年工作事情吧,也算是一个开头,大部分可能都是废话,但起码是一个回忆。
时间如白驹过隙般,转眼间到BI这个行业已经2个年头了,说实话,刚开始自己还真不知道BI(business intelligence )到底是什么,如何应用,在什么地方会用到。慢慢的发现,传说中BI 无处不在,就看怎么去理解他了。
刚毕业那会还是一个一无所知,处处碰壁的毛头小子,不知道去做什么,大学主修的方向是java。到了上海之后,虽然找了一份java方向的工作但是公司本身是主要是做BI的,这才误打误撞地接触了这个行业。慢慢的开始去了解什么是BI,他能去做什么,怎么做。
刚开始做了一段时间java,后来就转作BI了,主要是BI的应用层,前端展示,借助一些可视化报表工具去开发相关的报表,如:Cognos、BO、Qlikview、tableau等。我最拿手的算是Tableau吧,是我接触最多的一款工具,它不同于一些传统的报表工具,比较轻量级,容易上手,用户体验也很不错,如果能坚持下去,我打算定期的去分享我对这个工具的一下经验,虽然谈不上有多么的厉害,可以让自己在熟悉一遍。
说说自己工作之后的感想吧,还是学生的时候想着外面的世界多么的精彩,我不用每天都去上课,也不用担心因为不上课而被老师点名抓住,更不用担心考试挂科,但是当出到社会之后才发现,这个世界和想的完全不一样,虽然不用担心上不上课的问题,但是你不在那么自由,不在像学校一样我想上课就上课,不想上就不去。因为你要生活,所以你必须努力,每天早晨挤地铁,晚上回来还要看书学习,不这样做,就会被这个时代淘汰,你要时刻的提醒自己,不能放松,否则你就落后了。好了,也就说到这了吧,希望以后更加努力!
循序渐进学习Tableau Desktop(一)
Tableau作为一款BI报表工具,他与传统的BI工具有什么不同呢。今天我们先来认识一下Tableau。
每一款软件,不管怎么样,先来用用看,至于Tableau有什么优缺点,他相关的产品介绍,在此暂且不说,以后有空再分享,今天就直奔主题,先学习学习desktop。和其他软件一样,需要下载安装,Tableau desktop安装很简单,不需要去配置什么,就直接点击下一步,直到完成为止。安装完成后进入启动界面,先来看看(目前我以8.3版本为例):
1.
如图,我们可以到这是tableau启动之后进入的界面,主要有如下:
1)数据:此处是你将要连接的数据,点击可以连接相关的数据源,Tableau可以连接多种
数据源:excel,Oracle,db2等
2)工作薄:右边部分主要显示最近打开的相关工作薄,如果你是第一次打开,这块是自带的示例工作薄或者空白;
3)入门:这里可以找到Tableau相关入门的教程及视频;
4)示例工作薄:
2.操作界面:
在接下来的示例中,都以Tableau默认自带的excel(Sample - Superstore Subset (Excel).xlsx)作为数据源:
1)连接数据源
点击连接中的Microsoft excel,跳转到相关连接界面,选择Superstore Subset (Excel).xlsx文件,确定之后进入下面界面:
我们看到工作表下面有三个表,这是excel文件中包含了三个sheet,我们将需要的表(Orders)用鼠标拖放到右面的空白区域(或者鼠标单击相应的表),看到右面这个区域相应的变化。
再看右边连接有实时和提取两种方式,这是Tableau连接数据源的两种主要的方式,当然他们有一些区别。
a)实时连接:实时的连接数据源,只要在报表上做任何操作,都会实时的和数据源交互,这种方式,适用于数据量较小的,数据实时更新的情况,如果数据量比较大,并且不是实时更新的,那么最好采用另一种方式(提取)。
b)提取:Tableau中,提取方式类似其他BI工具将数据抽到内存中,Tableau提取方式,会生成一个.tde文件,采用提取方式,报表的相关操作数据都在这个.tde文件中,如果要更新数据,当报表publish到server上可以设置数据源的刷新Schedule,这部分放到server中在说。
筛选器:右上角有一个筛选器,点击添加,可以对数据进行筛选,类似于自定义SQL中的where条件,当然在Tableau中是可以自定义SQL的(后边会有)。
可以对筛选器进行添加、编辑和移除操作。
最下边一块我们可以看到好多数据,这个是数据源中的所有列。
以上是单表数据源,如果有多张表,需要join怎么办,当然 tableau中 是可以将
多张表join起来的,一种是在自定义SQL中,另一种就是鼠标拖动进行关联。
我们将Return表也拖到右边的数据框中,就可以看到Tableau会自动的根据
OrderID将两张表关联起来,默认是内连接,如果要改变连接方式,点击连接就会有图上的几种连接方式,也可以编辑连接字段。
以上就是Tableau连接数据源的相关知识,下边我们认识一下,Tableau的开发界面。数据源连接完成,点击“转到工作薄”就会到正真的Tableau界面:
ok,数据源连接就到这,下次分享Tableau的基础开发。本文只是本人为了回顾学习,做一下记录,如果描述不准确,欢迎指正,谢谢!
Tableau Desktop(二)
前边分享了Tableau数据连接,今天 主要认识一下tableau的工作区
1.Tableau开发环境
1.1 工作区概述:
Desktop工作区包含菜单、工具栏、数据窗口、含有功能区和图例的卡以及一个或多个表。表可以是工作表或仪表板。
工作表包含功能区,您可向其中拖入数据字段以生成视图。您可根据自己的需要来更改功能区和卡的默认布局,包括对它们调整大小、移动和隐藏。
仪表板包含视图、图例和快速筛选器。第一次创建仪表板时,仪表板是空的,工作簿中的所有工作表都显示在“仪表板”窗口中。
1)数据窗口
数据字段显示在工作区左侧的数据窗口中。您可以通过单击数据窗口右上角的最小化按钮 来隐藏和显示数据窗口。数据窗口会折叠到工作簿底部。再次单击最小化按钮可显示数据窗口。
通过单击放大镜图标然后在文本框中键入内容,可在数据窗口中搜索字段。右键单击数据窗口中的字段可以访问重要的命令。单击数据窗口顶部的“查看数据”图标可查看基础数据。
2)卡和功能区
每个工作表都包含可显示或隐藏的各种不同卡。卡是功能区、图例和其他控件的容器。例如,“标记”卡是您控制标记属性的位置。它包含标记类型选择器以及“颜色”、“大小”、“标签”、“详细信息”、“工具提示”、“形状”和“角度”的控件。可用控件取决于标记类型。
工作区中的所有部分几乎都可以开启和关闭,使您避免工作表因不必要的卡、工作区等而变得杂乱。
若要显示和隐藏工具栏或状态栏,请选择“窗口”,然后选择需要隐藏的内容。
若要显示和隐藏数据窗口或仪表板窗口,请单击窗口右上角的最小化按钮 。窗口会最小化到工作簿的左下角。再次单击相同按钮可还原窗口。
若要显示或隐藏卡,请单击工具栏上的“显示/隐藏卡” ,然后选择要显示或隐藏的卡。
通过选择“显示/隐藏卡”工具栏控件上的“重置卡”,可以将工作表窗口恢复到其默认状态。
3)设置
在运行应用程序时,可通过选择“帮助”>“选择语言”来更改工作簿语言。在更改此设置后,需要重新启动应用程序才能使更改生效。无需针对每个工作簿来更改此设置。
更改工作簿语言时,工作簿将针对数字格式、地图、日期等自动使用相应的区域设置。默认情况下,区域设置已设置为“自动”,这意味着区域设置将与打开工作簿时的区域设置一致。如果您制作将以多种不同语言显示的工作簿,并希望日期和数字相应进行更新,通过选择“文件”>“工作簿区域设置”,可以覆盖工作簿的区域设置。在选择一种特定区域设置时,无论是谁打开工作簿,该工作簿都不会发生改变。
4)工作薄
Tableau 工作簿文件与 Microsoft Excel 工作簿十分类似。它们包含一个或多个工作表,后者可以是工作表或仪表板。通过这些工作簿文件,您可对结果进行组织、保存和共享。工作簿是您在 Tableau 中的所有工作的容器。
在打开 Tableau 时,将自动创建一个空白工作簿。还可以创建新工作簿,方法是选择“文件”>“新建”或按键盘上的 Ctrl + N。
通过执行以下操作之一,可以打开现有工作簿:
单击开始页面上的工作簿缩略图图像。开始页面将显示最近打开过的工作簿。
选择“文件”>“打开”并使用“打开”对话框导航到该工作簿的位置。Tableau 工作簿具有 .twb 或 .twbx 文件扩展名。双击 Windows 资源管理器中的任意工作簿文件。将任意工作簿文件拖到 desktop 图标上或拖到运行中的应用程序上。工作簿名称显示在 Tableau 的标题栏中。可同时打开多个工作簿。每个工作簿显示在自己的应用程序窗口中。
1.2工作薄和工作表
在工作表中通过将字段拖放到功能区上来生成数据视图。
仪表板是多个视图的组合,可对这些工作表进行安排以便演示或进行监视。
每个工作簿中含有一个或多个工作表和仪表板。 Tableau 工作簿文件具有 .twb 文件扩展名。打包工作簿包含一个工作簿以及任何提供支持的本地文件数据源和背景图像。这种格式最适合对工作进行打包以便与不能访问该数据的其他人共享。 Tableau 打包工作簿具有 .twbx 文件扩展名。
tableau desktop(三)--构建数据视图(一)
本节介绍使用 Tableau 构建数据视图的基本知识。
您将了解如何手动和使用内置工具自动构建视图。
此外,还将了解如何排序、筛选、分组以及分层。
最后,介绍有关日期和时间的使用、参考线和分级以及数据查看。
1.视图的部件:
在每个工作表上,数据视图显示在表中。一个表就是行和列的集合,由以下组件组成:标题、轴、区、单元格和标记。除这些内容外,您还可以选择显示标题、说明、字段标签和图例。
在将维度或离散字段放在“行”功能区或“列”功能区上时,将会创建标题。标题显示了功能区上每个字段的成员名称。可以随时显示和隐藏行和列标题。
隐藏标题: 在视图中右键单击标题,然后选择“显示标题”。
显示标题: 在视图中选择要显示其标题的字段,然后在字段菜单中选择“显示标题”。
在将度量或连续字段放在“行”或“列”功能区上时,将会创建轴。默认情况下,度量字段的值将沿一个连续轴显示。
可以随时显示和隐藏轴。
隐藏轴: 右键单击视图中的轴,然后选择“显示标题”。
显示轴: 在视图中选择要显示其轴的度量,然后在字段菜单中选择“显示标题”。
单元格是可在 Tableau 中创建的任何表的基本组件。对于文本表,单元格就是行和列的交叉点,将在其中显示文本。
表中行和列的交叉形成区。根据表类型,区可能由轴与标题、轴与轴或标题与标题的交叉而形成。
字段拖到视图时,将使用标记来显示数据。每个标记都表示视图中所有维度的交叉点。例如,在具有“Region”和“Year”维度的视图中,有一个表示这两个字段的每种组合(“East 2011”、“East 2012”、“West 2011”、“West 2012”)的标记。
可通过多种方式来显示标记,包括线、形状、条、地图等。您可以使用标记属性(如颜色、大小、形状、标签等)显示有关数据的其他信息。所使用的标记类型以及标记属性由“标记”卡来控制。将字段拖到“标记”卡可显示更多数据。
标记类型
“标记”卡顶部的“标记”菜单中提供了标记类型。
标记属性
可以使用“标记”卡控制标记属性。例如,您可以控制视图中标记的颜色、大小、形状等。将字段拖动到每个属性上以使用数据对标记进行编码。单击标记卡上的每个属性以打开下拉控件,在下拉控件中可以进一步调节标记属性。
标记的堆叠
如果要在任何给定视图中控制标记是堆叠还是重叠,可选择“分析”>“堆叠标记”菜单项。您既可以让 Tableau 自动选择是否堆叠标记,也可以指定“打开”或“关闭”。默认模式为自动。
示例 — 堆叠条
请看下面显示的堆叠条视图。该视图在创建时将一个维度置于“列”功能区,将一个度量置于“行”功能区,并按维度对数据进行颜色编码。
因为标记类型是条,所以 Tableau 自动堆叠标记。这意味着标记合并绘制,每个条中每个堆叠区段的高度表示该区段的值。
示例 — 堆叠条
如果解除标记堆叠,这些标记将全部从水平轴开始。如下所示,您仍可查看单个条区段。但是请注意,由于解除堆叠的标记会重叠,因而所建视图中的条区段可能隐藏在其他区段的后面。
可以为任何工作表或仪表板添加标题。
显示和隐藏标题
在工作表上,选择“工作表”>“显示标题”,或者单击工具栏上的“查看卡”,然后选择“标题”卡。
在仪表板上,选择“仪表板”>“显示标题”。
默认情况下,标题是工作表的名称,您可以编辑标题以更改文本并包括动态值(例如,页码和工作表名称)。
编辑标题
右键单击标题并选择“编辑标题”,或者双击标题。
在“编辑标题”对话框中,键入新标题。使用“插入”菜单以添加自动文本,如页码、工作表名称、参数值等。使用对话框顶部的格式设置选项,可更改字体、颜色、样式和对齐方式。
通过单击“编辑标题”对话框中的“重置”,可将标题重置为默认设置。
所有视图都可以有自动生成或手动创建的说明。说明显示在“说明”卡上。若要显示说明,请在“查看卡”工具栏菜单上选择该说明,或选择“工作表” >“显示说明”。
默认情况下,说明是自动生成的;不过,您可通过双击“说明”卡对说明进行编辑。在“编辑说明”对话框中,可以使用和更改字体、大小、颜色以及对齐方式和样式。
使用“插入”菜单可添加自动文本,如页码、工作表名称以及字段和参数值。
在打印、打印到 PDF 以及发布到 Tableau Server 时,可以包含说明。可以在将视图作为图像导出到其他应用程序(例如,Microsoft PowerPoint)时包含说明。
将离散字段置于行和列功能区上会在视图中创建用于显示该字段成员的标题。例如,如果将一个包含产品的字段置于行功能区上,则每个产品名称都将显示为行标 题。除显示这些标题外,您还可以显示作为标题标签的字段标签。
字段标签只适用于离散字段。(将连续字段添加到视图中时,将会创建轴。轴上标有一个标题。)
默认情况下,将显示字段标签。您可以随时隐藏或显示字段标签。
可通过选择“分析”>“表布局”>“显示行字段标签”或“显示列字段标签”来显示和隐藏字段标签。
可以设置字体、对齐方式、阴影和字段标签分隔符的格式。右击字段标签,左边窗体中设置格式。
向“标记”卡上的“颜色”、“大小”和“形状”添加字段时,会显示一个图例,用于指示针对您的数据对视图进行编码的方式。
图例不仅可帮助您了解编码方式,您还可使用图例对特定数据集进行排序、筛选和突出显示。
2.手动创建视图:
拖动字段
当您开始在空白工作表上创建新数据视图时,可将字段从数据窗口拖放到视图中。
可直接将字段添加到功能区上,而不是添加到视图中的当前区域。也可以将字段从一个功能区拖到另一个功能区。若要从功能区移除字段,请将该字段从工作表拖出,或在字段菜单中选择“移除”。若要从某一功能区中快速移除多个字段,请右键单击该功能区,然后选择“清除功能区”。
Tableau 包含一套工具,专门用于帮助您快速创建有用的视图。在两种情况下您将希望自动创建视图:
提高洞察力 — 用户在将数据映射到满足其分析或演示需求的视图时常常会遇到困难。Tableau 包含用于检查数据和建议数据查看方式的内置规则。这样,该软件可充当生成有用数据视图的一个向导。
节省时间 — 手动构建数据视图有时可能十分耗费时间。Tableau 的自动功能提供一个起始视图,您以此为基础进行深入细化,从而可帮助您提高工作速度。
使用“智能显示”或“双击”自动生成视图。
3.自动创建视图:
智能显示
“智能显示”会基于视图中已经使用的字段以及在数据窗口中选择的任何字段来创建视图。单击工具栏上的“智能显示” 打开“智能显示”。使用“智能显示”时,只需在数据窗口中选择要分析的字段,然后选择要创建的视图类型即可。Tableau 会自动评估选定字段,然后提供适合这些字段的几种视图类型供您选择。
1.在数据窗口中选择要分析的字段。按住 Ctrl 键可进行多项选择。
2.单击工具栏上的“智能显示”,然后选择要创建的视图类型。
未显示为灰色任何视图类型都可生成数据视图。将鼠标悬停在各视图类型上,底部的说明就会显示最低要求。
3. 查看结果。Tableau 会自动创建数据视图。
双击
Tableau 支持另一种方法来自动生成数据视图,该方法称为“自动双击”。要使用此方法,请在数据窗口中双击所需字段。Tableau 会自动将各字段添加到视图中。也就是说,每次双击都会以智能方式将一个附加字段添加到功能区。与“智能显示”一样,此功能也利用 Tableau 对数据显示方式进行智能化“最佳猜测”的能力。
下图说明了通过在数据窗口中双击字段来创建自动视图时所用的一些规则:
4. 使用多个维度:
可通过许多不同方式在单个视图中比较多个度量。例如,可以为每个度量创建单个轴;或者,可以融合两个度量以共用一个轴;最后,可以添加双轴,其中有两个在同一个区中分层的独立轴。
在任何情况下,您都可以自定义每个轴的标记以使用多个标记类型,并添加不同详细级别。具有自定义标记的视图称为组合图。
单个轴
可通过将度量拖到“行”和“列”功能区来为每个度量添加单个轴。
“行”功能区上的每个度量会向表的行添加一个附加轴。“列”功能区上的每个度量会向表的列添加一个附加轴。例如,下面的视图显示每个季度的销售额和利润。“Sales”和“Profit”轴是表中的单个行,具有独立标度。
融合轴
度量可以共享一个轴,这样,所有标记都将显示在一个区中。在您融合度量时,将会有一行或一列(而不是向视图中添加行或列),其中每个度量的所有值会沿一个连续轴显示。例如,下面的视图在一个共享轴上显示每个季度的销售额和利润。
若要融合多个度量,只需拖动一个度量或轴并将其放置在现有轴上。
融合度量将使用“度量名称”和“度量值”字段,这些字段是生成的字段,其中包含数据源中的所有度量名称和所有度量值。共享轴是使用“度量值”字段创建的。 “度量名称”字段将添加到“颜色”功能区,以便为每个度量绘制一条线。最后,将对“度量名称”字段进行筛选,以便仅包括要融合的度量。
双轴
可以使用双轴来比较多个度量,而双轴是两个相互层叠的独立轴。当您有两个具有不同标度的维度时,双轴十分有用。若要添加度量以作为双轴,请将字段拖到视图右侧并在看到黑色虚线时放置。也可以在该度量的字段菜单中选择“双轴”。
使用双轴时,可通过右键单击双轴并选择“同步轴”来使两个轴对齐。
组合图
在视图中使用多个度量时,可以为每个不同度量自定义标记类型、大小、形状和颜色。
对于每个度量,“行”和“列”功能区上都有相应的“标记”卡。
5.筛选:
可使用筛选器来缩小显示在视图中的数据范围。
进行筛选的所有字段将显示在“筛选器”功能区上,这样您就可以快速确定已从视图中删除的数据。筛选器将按显示在“筛选器”功能区上的顺序应用于视图。
不过,在默认情况下,筛选器的计算是相互独立的,这意味着将根据整个基础数据源来计算每个筛选器,而不考虑其他筛选器。
在使用独立筛选器时,这些筛选器在“筛选器”功能区上的顺序不会使结果改变。
添加筛选器
所有进行筛选的字段都显示在“筛选器”功能区中。您可通过在视图中选择数据、将字段拖到“筛选器”功能区上或启用快速筛选器来添加筛选器。
1.在视图中选择数据
在视图中选择标题或标记,然后在右键单击上下文菜单或工具提示中选择“只保留”或“排除”。将从视图中删除维度成员并将经过筛选的字段添加到“筛选器”功能区上。
2.将字段拖到“筛选器”功能区上
在向“筛选器”功能区添加字段时,将会打开“筛选器”对话框,您可在此对话框中定义筛选器。
3.启用快速筛选器
Tableau 允许您使用快速筛选器来添加和修改筛选器。在打开快速筛选器时,“筛选器”对话框的较小表示形式会以新卡的形式打开。在这里,您可以快速决定要包含在视图中的内容。
共享筛选器
在向工作表添加筛选器时,默认情况下,该筛选器仅应用于当前工作表。有时,您可能要将筛选器应用于工作簿中的其他工作表。您可以选择要应用筛选器的特定工 作表,或对使用相同数据源的所有工作表全局应用筛选器。无法跨多个数据源应用筛选器。例如,您可能有一个仅包含特定地区或相关产品的筛选器。您只需创建筛 选器一次,然后将其应用于使用相同数据源的所有工作表,而无需每次创建新工作表时都添加此筛选器。
在“筛选器”菜单中选择一个选项,以设置如何“应用于工作表”。
选择以下选项之一:
使用此数据源的所有工作表 — 将筛选器应用于使用当前连接的所有工作表。使用此选项的筛选器将在整个工作簿中全局应用。应用于所有工作表的筛选器将由一个数据源图标 来标记。将对您将字段拖动到视图后创建的所有新工作表自动创建该筛选器。对该筛选器所做的任何更改都会影响所有这些工作表。
所选工作表 — 打开一个对话框,您可在其中从使用相同连接的工作表列表中进行选择。选择要应用该筛选器的工作表。如果任何工作表已包含针对相同字段的筛选器,则“将筛选 器应用于工作表”对话框将提供有关该筛选器的详细信息。如果您选择该工作表,则当前筛选器将覆盖任何现有的筛选器选择。应用于所选工作表的筛选器将由工作表图标 来标记。对该筛选器所做的任何更改都会影响所有选定工作表。
仅限此工作表 — 只应用于当前工作表。在创建新筛选器时,将会默认选中此选项。将会显示当前工作表本地的筛选器,但不显示任何附加图标。
注意:如果您将筛选器应用于所有工作表或选定工作表,然后更改设置以将该筛选器仅应用于当前工作表,则筛选器不会从所有其他工作表移除。筛选器将断开连接,且全部成为其相应工作表的本地筛选器。您可以转到每个工作表并移除筛选器或修改选择。
上下文筛选器
默认情况下,每个筛选器都会访问数据源中的所有行,而与其他筛选器无关。
您可以将一个或多个分类筛选器设置为视图的上下文筛选器。它们仅处理通过上下文筛选器的数据。
可以创建上下文筛选器以实现以下目的:
1. 提高性能 — 如果您设置了大量筛选器或具有一个大型数据源,则查询速度可能会很慢。可以设置一个或多个上下文筛选器来提高性能。
2. 创建相关数字筛选器或“前 N 个”筛选器 — 可以设置一个上下文筛选器,以便仅包含相关数据,然后设置数字筛选器或“前 N 个”筛选器。
例如,假设您负责一家大型食品杂货连锁店的早餐产品。您的任务是按所有商店的利润找出前 10 种早餐产品。如果数据源非常大,则可以设置一个上下文筛选器,以便仅包含早餐产品。然后,可以按利润创建一个“前 10 个”筛选器作为相关筛选器,该筛选器仅处理通过上下文筛选器的数据。
上下文筛选器对关系数据源尤为有用,因为它将会创建一个临时表。在设置上下文时,Tableau 会自动生成此表;在构建数据视图时,该表将作为可提高性能的单独(较小)数据源。
注意: 对于 Excel、Access 和文本数据源,将以 Access 表的形式创建临时表。对于 SQL Server、MySQL 和 Oracle 数据源,您必须具有在服务器上创建临时表的权限。
上下文筛选器
若要创建上下文筛选器,请在现有分类筛选器的上下文菜单中选择“添加到上下文”。将对上下文执行一次计算以生成视图。然后,相对于该上下文对所有其他筛选器执行计算。上下文筛选器:
显示在“筛选器”功能区顶部。
由“筛选器”功能区上的灰色来标识。
无法在功能区上重新排列。
如下所示,“Department”维度已设置为视图的上下文。仅会使用通过“Department”的数据来计算“Container”筛选器。
可通过以下方式来修改上下文筛选器:
从“筛选器”功能区删除字段 — 如果功能区上保留有其他上下文筛选器,则计算新的上下文。
编辑筛选器 — 每次编辑上下文筛选器时,都会计算新的上下文。
选择“从上下文移除”— 此筛选器作为标准筛选器保留在功能区上。如果功能区上保留有其他上下文筛选器,则计算新的上下文。
6.排序:
在 Tableau 中,对数据视图排序是指按指定顺序排列维度成员。Tableau 支持计算排序和手动排序。
计算排序
您可能希望按字母顺序对客户进行排序,或者按从低到高的销售额顺序对产品线进行排序。这两种排序都是“计算排序”,因为它们都使用定义的程序规则对字段进行排序。
以计算方式对维度进行排序是按以下规则进行的:
1. 您可在将任何离散字段置于功能区上之后(“筛选器”功能区除外)对该字段进行排序。
2. 出现在工作表上的每个维度都可独立于任何其他维度进行排序。
3. 维度的功能区位置决定了所排序的数据视图的组件。例如,如果维度位于“列”功能区上,则将针对该字段对数据视图的列进行排序。如果维度位于“颜色”功能区上,则将对颜色编码进行排序。
4. 排序字段通过粗体名称来标识。
连续字段是从最低编号到最高编号(根据轴的指示)自动来排序的,您无法手动更改这种排序。不过,您可使用字段特定格式使轴倒序。
如何对数据排序(计算排序)
可以直接对视图中的轴应用计算排序,或使用排序对话框将计算排序应用于视图中的特定字段。
对轴进行排序
创建计算排序的快速方式是使用轴上的排序按钮。轴上的排序按钮会自动创建适合所建视图的排序。会计算该排序,这表示它在基础数据更改时会正确更新。
将光标悬停在轴上时,会显示排序图标。单击该图标一次可按升序排序,再次单击可按降序排序,第三次单击可清除排序。
对特定字段进行排序
可以使用“排序”对话框对特定字段进行排序。
1. 打开“排序”对话框。
右键单击要排序的字段,然后在其上下文菜单中选择“排序”。
2.指定排序选项。
手动排序
通过手动排序,可以重新安排表中维度成员的顺序,方法是临时拖动这些维度成员,并精确控制各项在表中和图例中的排列顺序。您还可通过手动排序来控制数据在屏幕上的绘制顺序。在比较特定数据或解释重叠数据时,这种控制十分有用。手动排序只能应用于包含离散度量的离散字段。
可通过两种方式对视图中的数据进行手动排序。您可先选择视图中的项,然后使用“排序”工具栏按钮;或者,您可拖放视图中的标题。
使用工具栏和工具提示进行排序
通过工具栏和工具提示中的两个排序按钮,可基于视图中的其他字段以升序或降序对选定内容进行手动排序。
通过拖放进行排序
选择需要移动的维度成员。可选择出现在表的行或列标题中或图例(如颜色图例)中的任何维度成员。
将该成员拖到行、列或图例中的所需位置。
前段时间忙于工作的事情,好久没有来记录一点东西了,今天利用周末做点记录吧,最近由于工作的原因,也有两三周没有用tableau了。今天继续上一篇构建数据试图(二)。
3.7 参考线和参考区间
参考线通常用来标记轴上的某个特定值或区域。例如,当您在分析多种产品的月销售额时,可能需要在平均销售额标记处包含一条参考线,这样可以将每一种产品的业绩与平均值进行比较。。或者您可能需要用阴影沿轴标出某一特定区域。最后,您可能需要使用参考线指定某种分布。
ableau 不限制添加的参考线条数。使用“添加参考线”对话框可以添加参考线。
参考线和参考区间的类型
有三种参考线和参考区间:
线 - 在轴上的常量或计算值位置添加一条线。计算值可基于指定的字段。
区间 - 将视图中标记之后、轴上两个常量或计算值之间的区域显示为阴影。
分布 - 通过添加阴影梯度指示值沿轴的分布。分布通过置信区间、百分比、百分位、分位数或标准差定义。除了阴影外,还可添加线标记轴上的常量或计算值。此类参考线用来创建标靶图。
注意:如果视图是使用联机或脱机地图的地图时,参考线不可用。
1)添加参考线
可以向任何连续轴添加参考线。
1. 右键单击定量轴,选择“添加参考线”。
2. 在“添加参考线”对话框中,选择“线”。
3. 在“添加参考线”对话框中,选择以下范围之一:
4. 选择在轴上要标记的值。从第一个下拉菜单选择度量或参数,然后选择以下聚合之一:
平均值 - 沿轴在平均值位置放置一条线。
常量 - 在轴上指定值位置放置一条线。
最大值 - 在最大值位置放置一条线。
中位数 - 在中位数值位置放置一条线。
最小值 - 在最小值位置放置一条线。
总计 - 在单元格、区或整个视图的所有值的总计位置放置一条线。
合计 - 在单元格、区或整个视图的所有值的聚合值位置放置一条线。在计算平均值的加权平均值而不是平均值时,此选项特别有用。当使用的计算采用自定义聚合时,它也非常有用。合计使用基础数据计算,其结果与在“分析”菜单中选择一个合计选项相同。
5.选择线的标记方式。可选的选项如下:
无 — 如果选择此选项,则参考线不包含标签。
值 - 如果选择此选项,则在轴上包含对应值的标签。
计算 - 如果选择此选项,则显示自动标签。该标签基于所选的计算和度量。
自定义 - 如果选择此选项,则在文本框中键入自定义标签。可使用文本框右侧的菜单插入值(如计算或值)。
6.指定线的格式设置选项。可以更改线的样式、粗细和颜色。
7.可以选择在线的上方和下方添加填充色。
2)编辑参考线、参考区间和参考箱
添加参考线或参考区间后,右键单击连续轴并选择编辑参考线可以编辑定义。如果视图中有多个参考线或参考区间,请使用菜单选择要编辑的参考线或参考区间。
如果有多条参考线,可能需要更改其在视图中的绘制顺序。右键单击参考线并选择移至顶层或移至底层,可以对参考线进行重新排序。
3)移除参考线、参考区间和参考箱
可以移除单条参考线或单个参考区间,或者将其一次全部移除。
若要移除单个参考线,请在视图中右键单击参考线,然后选择“移除”。如果要移除的参考区间或分布中不包含线,请右键单击阴影区域的开始或结束位置。在分布中,还可右键单击不同梯度阴影之间的位置。
若要同时移除所有参考线,请右键单击连续轴,然后选择“移除所有参考线”。
3.8 检查数据
创建视图后,Tableau 会提供一些动态数据检查工具,这些工具可帮助您将感兴趣的数据分离出来,然后继续探究和分析。例如,如果您有包含大量数据的视图,则可以重点关注一个特定 区域,选择一组离群点,查看每个标记的基础数据源行,然后查看所选标记的摘要,包括平均值、最小值和最大值。
选择
在需要以可视形式标识数据视图的子集或需要运行某一动作时,选择标记十分有用。
您可通过单击来选择任何单个标记。可通过按住 Ctrl 键来选择多个标记。还可以拖动光标以在要选择的标记周围绘制一个框。最后,可以组合使用这些方法以快速选择感兴趣的所有标记。
平移
可以使用平移工具将表的视图上下和左右移动。平移有两种用途。第一种用途是在放大视图(特别是地图)后将地图四处移动以查看感兴趣的其他标记。第二种用途是当数据视图中包含许多区时在各个区之间快速移动。
可通过按住 Shift 键然后将光标拖过视图来使用平移工具。
撤消和重做
您可以对动作执行无限次撤消和重做。可通过按工具栏上的“撤消”按钮来撤消 Tableau 中的几乎所有动作。同样,可通过按工具栏上的“重做”按钮来重做几乎所有动作。
在这方面,每个工作簿的行为都类似于 Web 浏览器。您可以快速返回到前一个视图。或者,可以浏览已创建的数据源的所有视图。Tableau 会在所有工作表间保存撤消/重做历史记录,直至您退出。在各个会话之间,不会保存历史记录。
标记线
标记线对于区分标记并标出其在视图中的位置非常有用。例如,在含有密集分散标记的视图中,您可以打开标记线以显示特定数据点的位置。在添加标记线时,一条线会从标记延伸到一个轴。您可以选择始终显示标记线或仅在选择标记后才显示标记线。
若要向视图添加标记线,请右键单击并选择“标记线”>“显示标记线”。
默认情况下,标记线已设置为仅当选择标记后才显示。可以在“标记线”对话框中更改此设置并指定其他选项。
在该区上右键单击,然后选择“标记线”>“编辑标记线”打开“标记线”对话框。
在“标记线”对话框中,选择要将线绘制到的轴、是否始终显示标记线以及是否显示标签。
摘要卡
摘要卡是一种用于查看关于某一选择或整个数据源的信息的快速方法。您可通过在“查看卡” 工具栏菜单 中选择摘要卡来隐藏或显示摘要卡。也可以选择“工作表”>“显示摘要”。
在选择视图中的摘要数据时,摘要卡会更新以仅显示与选定范围的数据有关的信息:
默认情况下,摘要卡显示数据的总计值、平均值、最小值、最大值和中间值。(平均值是通过对所有相关值进行求和,然后除以值的总个数得出的。中值是通过将值从最低到最高进行排序然后选择中间值得出的。)
可使用摘要卡的下拉菜单来显示其他统计数据。
查看数据
通过“查看数据”命令,可以显示数据源中构成标记的每行的值。该命令还可基于视图中的聚合来显示摘要数据。您可能需要查看数据以验证与某一标记关联的聚合值,或隔离并导出与感兴趣的数据(如离群点)关联的各个行。
tableau desktop(四) 导出和发布
4.1 导出
创建一些数据视图之后,可能需要将结果导出到其他应用程序。Tableau 提供了几种导出工作内容的方法:
导出数据 - 将视图的数据复制到 Excel 工作表或导出为 Access 数据库。
导出为图像 — 将视图的图像复制到其他应用程序,例如,Microsoft Office 或 PowerPoint。导出结果还可包括网页中的图像。
通过导出结果,可以方便地与不能访问 Tableau 的合作者共享自己的工作,或者将自己的工作包含在演示文稿或文档中。您也可使用 Tableau 演示自己的数据。
4.2 发布
通过发布工作簿,可将数据视图发布到 Tableau Server。发布工作簿时,您可以将其添加到服务器项目,隐藏某些工作表,添加标记以增强可搜索性,指定权限以控制对服务器上工作簿的访问,以及选择嵌入数据库密码以便在 Web 上进行自动身份验证。
如果工作簿所连接的数据源需要用户名和密码,则在默认情况下,在服务器上查看该工作簿的人员也会看到要求提供用户名和密码的提示。不过,作为工作簿作者, 您可以选择提供在服务器上打开视图时始终使用的数据库用户名和密码。登录信息不对服务器用户公开;服务器用户仅仅是自动登录以便能查看视图。
选择要嵌入密码的连接,然后选择身份验证类型。根据数据源,将会提供以下一个或多个选项:
提示用户 — 提示访问 Tableau Server 的用户输入其数据库用户名和密码。
嵌入式密码 — 当 Tableau Server 用户加载视图时,您的当前用户名和密码将用于自动对用户进行身份验证。
服务器运行身份帐户 — 当 Tableau Server 用户加载视图时,服务器运行身份帐户将用于自动对用户进行身份验证。服务器运行身份帐户是由您的 Tableau Server 系统管理员配置的。
通过服务器运行身份帐户进行模拟 — 代表访问视图的 Tableau Server 用户来使用 Tableau Server 运行身份帐户。此选项仅可用于已针对模拟进行配置的 Microsoft SQL Server 数据源。请参见 Tableau Server 联机帮助的“参考”部分。
通过嵌入式密码进行模拟 — 当 Tableau Server 用户加载视图时,您的用户名和密码将用于对其进行身份验证。Tableau Server 可在任何类型的帐户下运行,但它使用发布者提供的凭据连接到数据库。此选项仅可用于已针对模拟进行配置的 Microsoft SQL Server 数据源。请参见 Tableau Server 联机帮助的“参考”部分。
您是否可以嵌入密码或进行模拟将由 Tableau Server 管理员来控制。管理员可以使用服务器“维护”页面上的“设置”来允许作者嵌入密码。
ok,截止目前tableau desktop基础介绍基本上是已经结束了,接下来的时间我会分享一些实例,还有最新9.0的新特点,tableau如何整合到portal中以及自己之前的一些开发示例及经验。
由浅入深--继续Tableau
很久没有写点东西了,趁今天有空,继续记录一下tableau,一路走来 从懵懂到现在的不懂,感觉自己越来越不懂tableau了,第一次接触tableau是2年前,从8.0认识了tableau直到现在的9.1版本,感觉变化很大,改进很多,尤其是在移动端。最近两三个月没有使用tableau了,感觉自己陌生了,从以前的想办法跳出去上tableau的官网到现在中文版的官网已形成,感觉只是瞬间的事情。
最近一位业内的老板想把不同的所谓可视化工具整合到企业微信公众号平台,我个人认为这个想法很不错,现在互联网突飞猛进,移动端已经冲进了每个人的生活。很有幸自己接触了几款不同的BI可视化工具,但都只是略懂皮毛,我就简单的记录一下我个人暂时的观点,如果偏差希望批评指正。
初出茅庐,经验不足,前前后后接触的BI 工具主要有Tableau, Qilkview(Qlik Sense),Cognos,BO.
1.Tableau: 新型可视化工具,用户体验很不错,主要以图形化将相关数据呈现给用户,有着很不错的用户体验。不同于传统的BI工具,没有IT背景的人员完全可以使用,用户可以自己拖拉产生报表,做相关分析。原则上要求结构化的数据,tableau不会像其他工具,有强大的数据建模,让没有专业背景的人员产生后怕,只要有相关的数据,tableau的基础操作和容易上手,但是想要做深入的研究,是有一定的难度,并不是说起来那么简单。tableau的移动端越来越强大,9.1新功能大部分是移动端,这也是tableau的一个趋势。
2.Qilkview: Qilkview的市场也蛮不错的,他的用户体验相对传统的工具算是一个转折点,也比较轻量,同时也比较灵活,他有自己的建模,展现等,Qilksense是Qilk推出的移动端,整体也蛮不错,本人接触的少,没有什么经验,只是个人感觉。
Cognos,BO: 可以说是传统意义上的报表工具,大部分用户喜欢以list,交叉表的方式展现,可以说这两款工具很重,一般的企业或者小型公司很难承受,但他们有着很强大的功能,同时水很深,要玩透很不容易。
以上只是我个人的感觉,没敢谈技术方面的,害怕误导,也不敢谈好坏。
这就是我总结出来的Tableau远远强于Excel的四点:
- 可视化 (Visualization):化数据于图像,大幅提高人眼采集信息的速度
- 聚焦/深挖 (Filter/Drill down): 不断深挖原因
- 灵活分析 (Flexible Analysis):做一个Dashboard,一劳永逸,每次数据更新改个日期就行
- 交互化图表 (Interactive Charts): 由三张图表组成的简单的Dashboard,千变万化,有着近乎无数种排列组合,令用户可以从各个角度观察公司的表现
有了这么一个Dashboard,用户在开会的时候又何须数不尽的PPT和蝌蚪文似的表格呢?当然,这还只是一个很简单的Tableau Dashboard,真正的商业分析要比这个复杂很多,不过万变不离其宗,牢记以上四个心法口诀,让你的想象飞吧!
作者:赵彦博
链接:https://www.zhihu.com/question/29478254/answer/104793334
来源:知乎
著作权归作者所有,转载请联系作者获得授权。
本文介绍了Tableau的基础知识,包括安装、界面概览、构建数据视图等,并对比了Tableau与其他BI工具的特点。
1万+

被折叠的 条评论
为什么被折叠?



