最新动态
戴戴戴师兄《系统认识数据分析》——笔记整理2
2024-11-07 23:50

一、数据可视化

戴戴戴师兄《系统认识数据分析》——笔记整理2

——————————————————————————————————

——————————————————

数据可视化分类有哪些

——艺术流:旨在探索更多的数据表达方法,相当于用数据作画,简直就是艺术品

——分析流:针对某一专项的主体,用可视化充分说明和分析数据,做到高效的信息传达

——实战流:为实际的业务场景服务,追求数据的全面性和逻辑,属于能用就行

——————————————————————————————————

——————————————————

数据赋能指的是什么

——分析师可以直接将数据看板发布到线上

——自动更新看板

——自由下载数据

——线上修改图表

——邮箱发送数据

——设置数据预警

——————————————————————————————————

——————————————————

数据探索可以实现怎样的操作

——支持亿级数据的连接和处理

——自由地对字段进行各种计算

——拖拽就可以轻松制作图表

——数据可以随意聚合下钻

——图表类型可以灵活转换

——内置算法智能建模

二、数据类型

数据类型:对于可视化来说,数据有【维度】和【度量】两种类型

——————————————————————————————————

——————————————————

什么是数值型变量【度量】Measures

——一般是由数字组成的变量  例如:成交金额、用户数、点击量

——数值变量可以进行计算,并基于计算结果的大小表示图表的面积大小、条形长短、颜色深浅等可以量化的视觉元素

——————————————————————————————————

——————————————————

什么是类别型变量【维度】Dimensions

——类别变量包含有限的类别数或可区分组数(数值变量过多时需要分组) 例如:用户ID、性别、来源渠道

——类别变量主要用来对数值变量的计算结果进行区分,表现为图表的颜色种类、图形位置、分类方式等难以量化的视觉元素

——只能进行计数和分布等简单计算

三、数据可映射的图形类型

【度量】映射图形,【维度】负责区分

——————————————————————————————————

——————————————————

——位置

——位置是通过将两个【度量】分别作为x坐标和y坐标确认某一【维度】变量的位置,从而形成空间关系来表现该【维度】变量的分布和趋势

——基于位置表达的散点图中主要有以下四种数据规律

 ——————————————————————————————————

——————————————————

——长度

——长度是直接以图形的长度来衡量【度量】的大小,并以【维度】做区分,以此实现各【维度】下对【度量】的对比分析

 ——————————————————————————————————

——————————————————

 ——角度

——角度和弧长都是用【度量】的大小直接衡量,表现细分【维度】和整体间的关系

——注意:弧长相比于角度可以更加直接地看出部分之间的大小比较关系,从功能性看上圆环图要优于饼图

 ——————————————————————————————————

——————————————————

——方向

——方向是对趋势的描述,以折线图最为典型,以时间【维度】作为横轴,表现各时间【维度】下某一【度量】的高低变化,高低之间的连线就形成了方向

——————————————————————————————————

——————————————————

——形状

——形状主要用于在多组数据分析时区别组别【维度】,我们在日常使用时又称之为标记,比如散点图和折线图中的形状

——在散点图里使用三种形状来表现三个各自离散的数据群

——形状也可以表示数值的类型、系列和组别,比如折线图中各系列用多种不同的形状标记

 ——————————————————————————————————

——————————————————

——面积和体积

——面积体积越大则表示【度量】越大。长度、面积、体积都可以表示数值的大小。二维平面通常用圆形和矩形,三维空间一般用立方体或球体

——但是在确定面积和体积要注意和边长或半径的数值换算问题,避免出现错误的暗示,比如

 ——————————————————————————————————

——————————————————

——颜色和深浅(热力图

——饱和度和色调是两个颜色的关键要素,既可以用来区分【维度】也可以用来表示【度量】的数值的高低

四、基础图表制作 

 ——————————————————————————————————

——————————————————

① 对比分析:比大小

——柱状图/条形图

——图表逻辑:在一个或多个【维度】下对【度量】进行统计,从而得到该【维度】下不同变量之间的【度量】差异

——注意:条形图在多变量的情况下比柱状图更易浏览

 ——————————————————————————————————

——————————————————

——热力图(突出显示表

——图表逻辑: 在文本表上根据度量值大小加上颜色深浅标记

——快速表计算:编辑表计算设置计算区域和顺序;总额百分比可以直接计算百分比占比

差异百分比可以计算环比

 ——————————————————————————————————

——————————————————

——气泡图/词云

 ——图表逻辑:用度量代表气泡大小,维度代表气泡颜色/用度量代表文本大小,维度代表文本颜色

② 变化分析:看趋势

——折线图

——图表逻辑:基于时间维度的柱状图,但是将展现形式从条形图变为了折线

——————————————————————————————————

——————————————————

——面积图

——图表逻辑:在折线图的基础上选择面积作为视觉影射

——————————————————————————————————

——————————————————

——饼图

——图表逻辑:【维度】代表各扇区的颜色,【度量】代表饼图中各扇区角度的大小

——————————————————————————————————

——————————————————

——树地图

——图表逻辑

  • 每个方格代表一个该【维度】下的变量,方格的大小代表此变量的在该【维度】下的【度量】占比大小
  • 方格会按顺序排列,占比最大的在最左上

 ——————————————————————————————————

——————————————————

——堆积图

——图表逻辑

  • 绝对堆积:在柱状图/条形图的基础上,用颜色区分一个维度在另一个维度下的占比大小
  • 相对堆积:不展示绝对值,使用合集快表计算:合计百分比,只展示百分比

③ 关系分布:看位置

——散点图

——图表逻辑:横纵轴各代表一个【度量】,【维度】中的变量则作为一个点,根据横纵轴上的度量值大小确认位置

 ——————————————————————————————————

——————————————————

——聚类分析

——图表逻辑:分析-群集即可对变量进行聚类分析,具有相同分布特征的变量会被分为一类,右键群集胶囊即可修改聚类数量

——K-means聚类算法,基于欧式距离计算

——————————————————————————————————

——————————————————

——直方图

——图表逻辑:将度量下数据分组计数

——注意:直方图X轴代表的是定量数据(度量,柱状图X轴代表的是分类数据(维度,因此直方图的形状不可以随意改变

——————————————————————————————————

——————————————————

——地图

——以地理位置为点,用点大小、颜色展示度量值大小等特征

 

更多炫酷的可视化案例,可以到tableau社区学习

https://public.tableau.com/zh-cn/gallery/?tab=viz-of-the-day&type=viz-of-the-day

 

 

    以上就是本篇文章【戴戴戴师兄《系统认识数据分析》——笔记整理2】的全部内容了,欢迎阅览 ! 文章地址:http://nhjcxspj.xhstdz.com/quote/3092.html 
     行业      资讯      企业新闻      行情      企业黄页      同类资讯      网站地图      返回首页 物流园资讯移动站 http://yishengsujiao.xhstdz.com/ , 查看更多   
发表评论
0评