一、数据可视化
——————————————————————————————————
——————————————————
数据可视化分类有哪些?
——艺术流:旨在探索更多的数据表达方法,相当于用数据作画,简直就是艺术品
——分析流:针对某一专项的主体,用可视化充分说明和分析数据,做到高效的信息传达
——实战流:为实际的业务场景服务,追求数据的全面性和逻辑,属于能用就行
——————————————————————————————————
——————————————————
数据赋能指的是什么?
——分析师可以直接将数据看板发布到线上
——自动更新看板
——自由下载数据
——线上修改图表
——邮箱发送数据
——设置数据预警
——————————————————————————————————
——————————————————
数据探索可以实现怎样的操作?
——支持亿级数据的连接和处理
——自由地对字段进行各种计算
——拖拽就可以轻松制作图表
——数据可以随意聚合下钻
——图表类型可以灵活转换
——内置算法智能建模
二、数据类型
数据类型:对于可视化来说,数据有【维度】和【度量】两种类型
——————————————————————————————————
——————————————————
什么是数值型变量【度量】Measures?
——一般是由数字组成的变量 例如:成交金额、用户数、点击量
——数值变量可以进行计算,并基于计算结果的大小表示图表的面积大小、条形长短、颜色深浅等可以量化的视觉元素
——————————————————————————————————
——————————————————
什么是类别型变量【维度】Dimensions?
——类别变量包含有限的类别数或可区分组数(数值变量过多时需要分组) 例如:用户ID、性别、来源渠道
——类别变量主要用来对数值变量的计算结果进行区分,表现为图表的颜色种类、图形位置、分类方式等难以量化的视觉元素
——只能进行计数和分布等简单计算
三、数据可映射的图形类型
【度量】映射图形,【维度】负责区分
——————————————————————————————————
——————————————————
——位置
——位置是通过将两个【度量】分别作为x坐标和y坐标确认某一【维度】变量的位置,从而形成空间关系来表现该【维度】变量的分布和趋势
——基于位置表达的散点图中主要有以下四种数据规律
——————————————————————————————————
——————————————————
——长度
——长度是直接以图形的长度来衡量【度量】的大小,并以【维度】做区分,以此实现各【维度】下对【度量】的对比分析
——————————————————————————————————
——————————————————
——角度
——角度和弧长都是用【度量】的大小直接衡量,表现细分【维度】和整体间的关系
——注意:弧长相比于角度可以更加直接地看出部分之间的大小比较关系,从功能性看上圆环图要优于饼图
——————————————————————————————————
——————————————————
——方向
——方向是对趋势的描述,以折线图最为典型,以时间【维度】作为横轴,表现各时间【维度】下某一【度量】的高低变化,高低之间的连线就形成了方向
——————————————————————————————————
——————————————————
——形状
——形状主要用于在多组数据分析时区别组别【维度】,我们在日常使用时又称之为标记,比如散点图和折线图中的形状:
——在散点图里使用三种形状来表现三个各自离散的数据群
——形状也可以表示数值的类型、系列和组别,比如折线图中各系列用多种不同的形状标记
——————————————————————————————————
——————————————————
——面积和体积
——面积体积越大则表示【度量】越大。长度、面积、体积都可以表示数值的大小。二维平面通常用圆形和矩形,三维空间一般用立方体或球体
——但是在确定面积和体积要注意和边长或半径的数值换算问题,避免出现错误的暗示,比如:
——————————————————————————————————
——————————————————
——颜色和深浅(热力图)
——饱和度和色调是两个颜色的关键要素,既可以用来区分【维度】也可以用来表示【度量】的数值的高低
四、基础图表制作
——————————————————————————————————
——————————————————
① 对比分析:比大小
——柱状图/条形图
——图表逻辑:在一个或多个【维度】下对【度量】进行统计,从而得到该【维度】下不同变量之间的【度量】差异
——注意:条形图在多变量的情况下比柱状图更易浏览
——————————————————————————————————
——————————————————
——热力图(突出显示表)
——图表逻辑: 在文本表上根据度量值大小加上颜色深浅标记
——快速表计算:编辑表计算设置计算区域和顺序;总额百分比可以直接计算百分比占比
差异百分比可以计算环比
——————————————————————————————————
——————————————————
——气泡图/词云
——图表逻辑:用度量代表气泡大小,维度代表气泡颜色/用度量代表文本大小,维度代表文本颜色
② 变化分析:看趋势
——折线图
——图表逻辑:基于时间维度的柱状图,但是将展现形式从条形图变为了折线
——————————————————————————————————
——————————————————
——面积图
——图表逻辑:在折线图的基础上选择面积作为视觉影射
——————————————————————————————————
——————————————————
——饼图
——图表逻辑:【维度】代表各扇区的颜色,【度量】代表饼图中各扇区角度的大小
——————————————————————————————————
——————————————————
——树地图
——图表逻辑
- 每个方格代表一个该【维度】下的变量,方格的大小代表此变量的在该【维度】下的【度量】占比大小
- 方格会按顺序排列,占比最大的在最左上
——————————————————————————————————
——————————————————
——堆积图
——图表逻辑
- 绝对堆积:在柱状图/条形图的基础上,用颜色区分一个维度在另一个维度下的占比大小
- 相对堆积:不展示绝对值,使用合集快表计算:合计百分比,只展示百分比
③ 关系分布:看位置
——散点图
——图表逻辑:横纵轴各代表一个【度量】,【维度】中的变量则作为一个点,根据横纵轴上的度量值大小确认位置
——————————————————————————————————
——————————————————
——聚类分析
——图表逻辑:分析-群集即可对变量进行聚类分析,具有相同分布特征的变量会被分为一类,右键群集胶囊即可修改聚类数量
——K-means聚类算法,基于欧式距离计算
——————————————————————————————————
——————————————————
——直方图
——图表逻辑:将度量下数据分组计数
——注意:直方图X轴代表的是定量数据(度量),柱状图X轴代表的是分类数据(维度),因此直方图的形状不可以随意改变
——————————————————————————————————
——————————————————
——地图
——以地理位置为点,用点大小、颜色展示度量值大小等特征
更多炫酷的可视化案例,可以到tableau社区学习
https://public.tableau.com/zh-cn/gallery/?tab=viz-of-the-day&type=viz-of-the-day
以上就是本篇文章【戴戴戴师兄《系统认识数据分析》——笔记整理2】的全部内容了,欢迎阅览 ! 文章地址:http://nhjcxspj.xhstdz.com/quote/3092.html 行业 资讯 企业新闻 行情 企业黄页 同类资讯 网站地图 返回首页 物流园资讯移动站 http://yishengsujiao.xhstdz.com/ , 查看更多