最新动态
【数据分析】淘宝用户行为分析——基于R语言和Tableau
2024-11-07 23:44

本项目主要内容为分析淘宝用户的行为,结合AARRR模型帮助我们理解用户行为,挖掘出用户这些行为背后的信息,为电商平台的用户运营提供合理化建议。

【数据分析】淘宝用户行为分析——基于R语言和Tableau

本项目数据集为user_action.xlsx,各字段含义如下

字段名称

字段解释

user_id

用户名称

item_id

商品名称

behavior_type

行为类型

item_category

商品类别

time

时间

其中行为类型分为1,2,3,4,4种类型,在淘宝用户行为中分别指代浏览、收藏、加购、购买四种行为。值得注意的是“time”列是日期和小时的组合,因此在对数据进行处理时要将“time”拆分成“date”与“hour”。

1.首先将user_action.xlsx导入到R中。

 

该数据集中共有5组变量,1048575条数据。

2.检查数据中是否有重复数据,删除重复数据。

 

根据运行结果,一共有77388条重复数据 。将这些重复数据删除后得到的新的数据集有971187条数据。

3.检查数据中是否有缺失值。

 

根据运行结果,没有缺失值,这说明数据的准确性和可靠性很高。

4.提取数据

因为数据数量太大,为了方便分析,我们选择该数据集中的前10万条数据进行分析。

 

在之前的数据说明中我们提到,要将数据中“time”列拆分成“date”和“hour”两列,代表日期和小时。

 

 运行结果

在分析用户行为部分,主要基于AARRR模型和漏斗模型。AARRR模型是做用户行为分析的经典模型,是一个典型的漏斗结构。模型的名字是五个名词的首字母,分别为获取(Acquisition)、激活(Activation)、留存(Retention)、收入(Revenue)和传播(Referral)。

3.1.1常见电商指标

常见的电商指标有访问用户总数(UV)、页面总访问量(PV)以及统计区间平均每人页面访问量(UV/PV)。

 

计算得出的各项结果为

UVPVFavCartBuyPV_UV9679406920292872103097.28

 日均情况

 

运行结果

 

数据可视化

观察图像可以直观看到,每日访问用户总数和页面总访问量波动不大,只有在2014-12-12突然增长,合理考虑是双十二购物节的原因,导致访问数增多。这反映淘宝平台的用户黏性和用户忠诚度较稳定。

3.1.2复购率

复购率指在某个时间段内,购买者再次购买相同商品或服务的概率。通常以百分比来表示,计算公式为:复购率 = (复购的用户数 / 总用户数) * 100%。

首先创建一个以user_id分组的用户行为数据视图,再计算每位用户的复购率。

 

运行结果 

 

 计算得到的复购率为25.03%,反映出淘宝用户的忠诚度不高。

3.1.3跳失率

跳失率是指访问网站或应用后只查看了一个页面便离开的用户所占的比例。在网站分析中,跳失率是一项重要指标,可以帮助分析人员了解用户的停留时间以及页面的吸引力。通过跳失率,可以评估用户对网站内容的兴趣程度,进而优化页面设计和内容,提升用户体验,降低跳失率,增加页面的留存率。

 

运行结果为18,说明在967名用户中浏览页面一次的人数只有18人,跳失率为1.86%。从侧面可以说明商品或者商品详情页的内容对于用户具有较强的吸引力,能够让用户停下浏览。

3.1.4用户行为转化漏斗模型分析

漏斗分析模型是一种用于分析用户行为流程的方法,通常用于评估用户在完成特定目标(如注册、购买、订阅等)时经历的步骤和转化率。该模型将用户行为流程比作一个漏斗,用户在每个阶段都可能出现流失,最终只有少部分用户能够完成整个流程。漏斗分析模型可以帮助企业发现用户流失的瓶颈,优化用户体验和提升转化率,从而提高业务效率和盈利能力。

用户所有行为有以下几种

观察流程图更能清晰地看到,实际上用户完成购买的路径只有4条。

 

计算得到

浏览人数浏览收藏人数浏览收藏加购人数浏览收藏加购购买人数967357226146

综合以上的分析可以知道 大部分人会略去“收藏”这一步骤,完成浏览-加购-购买的流程。而在“收藏”到“加购”之间流失的用户应该针对性地分析这些用户行为,简化他们的购物流程,增加实现购买的转化率。除此之外,实现浏览-购买的人数只有146人,说明对于很多用户来说,浏览的商品并不是感兴趣的,或者推荐的商品不符合其购买预期,所以针对这一情况,淘宝应该优化推荐算法,更加精准地投放商品信息,增加浏览-购买的转化率。

3.2.1用户商品类别偏好分析

使用Tableau绘制浏览、收藏、加购、购买的前10名商品类别的条形图,分析用户对商品类别的偏好程度,这有助于优化用户推荐方案,提高商品的曝光量。

观察这四个统计图,1863这一类商品从浏览到收藏到加购再到购买一直都是第一名,这说明用户对这类商品有非常大的需求量和忠诚度。在购买量前10名的商品里,有5种商品在浏览量前10中,有4种商品在收藏量前10中,有5种商品在加购量前10中。对比之下,浏览量与加购量与购买量有较高的相关性。在浏览、收藏和加购的前10名商品中,有8种公共的商品类型,这说明商品推送的类型很符合用户的心理需求,但是在购买量上有一些差距,可能要考虑一些外部因素,比如配送距离和价格预期等因素。

3.2.2用户行为偏好分析

针对用户行为偏好,可以考虑从时间的维度分析,统计用户在24小时内的在线时间,统计不同行为的时间数据,找出用户活跃的日期以及每天的活跃时间,可以进行符合用户在平台购物习惯的商品推荐。使用Tableau绘制出的图像如下,可以直观地看到每种行为类型数以及总行为数随时间的变化趋势。

根据图像可以知道,每天的21时是用户行为总数最多的时间,从18时开始用户行为总数就开始上升,一直持续到21时,22时用户行为总数开始回落,23时开始明显下降,但仍然保持很高的总数。在10时至18时,用户的浏览、收藏、加购和购买行为数目平稳,没有较大波动,18时往后到22时,用户的浏览、收藏、加购和购买行为均有稳定提升。因此,淘宝平台可以在18时至23时加大商品的推送力度,增加商品的曝光量,提升商品的购买率。除此之外可以观察到相比于其他三种用户行为,“收藏”这一用户行为一直都没有很大幅度的增长,说明用户对“收藏”这一行为并没有很重视。

RFM模型是一种常用的客户分析模型,通过客户的最近一次购买时间(Recency)、购买频率(Frequency)、购买金额(Monetary)三个维度来评估客户的价值。这些维度可以帮助企业更好地了解客户群体,优化营销策略和提高客户满意度。因为本项目的数据集并没有提供购买金额这一数据,所以我们只考虑最近一次购买时间R和购买频率F。

首先对数据以user_id分类,计算每位用户最近一次的购买时间、R值(用户最近一次消费时间间隔)和F值(用户购买频率)。

 

运行结果

 

R值的最小值为0,最大值为30,所以设置如下的评分标准

R值评分[0,5]5[6,11]4[12,17]3[18,23]2[24,30]1

因此,对每位用户进行评分

 

运行结果

 

使用Tableau绘制出R_score占比图,可以看到5分的用户占比最高,5分和4分的用户已经达到60%,这说明淘宝有还不错的用户粘性。 

 

计算得到F的最小值为1,最大值为14。F值越大说明用户的购买频率越高。所以设置如下的评分标准: 

F值评分[1,5]1[6,10]2[10,14]3
 

运行结果: 

使用Tableau绘制出F_score占比图,可以看到1分的用户占比最高,2分的用户止占4.54%,3分的用户少之又少,只有0.22%。

综合以上R值和F值的结果,可以得到R值高但F值很低的人较多,可能表明大部分用户虽然很久没回访淘宝平台,但每次访问淘宝时购买的商品很多,也许会有很高的消费金额。这也可能意味着这部分顾客的忠诚度较高,虽然访问的频率很低,但每次的消费价值很大。

最后,我们对用户进行分层,来评判用户的忠诚度。计算出R值和F值的平均值,用来用户分层的依据,将用户分为:忠诚用户、保持用户、发展用户和挽留用户。

 

 计算结果为R值的平均值为10.53(越小越好,F值的平均值为2.22(越大越好)。那么可以根据如下的标准进行用户分层

判断条件用户分层R<=10.53,F>=2.22忠诚用户R>=10.53,F>=2.22保持用户R<=10.53,F<=2.22发展用户R>=10.53,F<=2.22挽留用户
 

运行结果

从图像可以看出,忠诚用户的占比还算非常客观,这说明淘宝有一定的用户基础,因此要开设专属优惠来服务这些用户,类比vip用户一样。其次,挽留用户的占比最高,说明这部分用户有很大的挖掘空间。可以针对这些用户定期发放优惠券,优惠提醒等方法,提高用户的留存。发展用户也占据了很大一部分比例,针对这些用户,发放优惠券,增加促销活动可以作为提高留存率的方法,但是更主要的方法应该是推送更加符合用户预期的商品,优化推荐的算法,让这些发展用户转化成忠诚用户。而对于保持用户来说可以有针对性的推荐一些预期之外但又能让用户感兴趣的商品,保持用户的好奇心和新鲜感,提高消费转化。

这个项目分析到这儿就算是结束了,现在根据所有分析得到的结果进行汇总,方便大家梳理。

1.每日访问用户总数和页面总访问量波动不大,只有在2014-12-12突然增长,合理考虑是双十二购物节的原因,导致访问数增多。

2.复购率为25.03%,跳失率为1.86%,说明商品的介绍页面和商品的推荐算法都能够吸引用户停留,但复购率不高,要加强用户消费的转化。

3.在用户行为转化漏斗模型分析中,大部分人会略去“收藏”这一步骤,完成浏览-加购-购买的流程。因此,针对“收藏”到“加购”之间流失的用户应该针对性地分析这些用户行为,简化他们的购物流程,增加实现购买的转化率。

4.实现浏览-购买的人数只有146人,说明对于很多用户来说,浏览的商品并不是感兴趣的,或者推荐的商品不符合其购买预期,所以针对这一情况,淘宝应该优化推荐算法,更加精准地投放商品信息,增加浏览-购买的转化率。

5.在用户偏好商品分析中,1863这一类商品从浏览到收藏到加购再到购买一直都是第一名,这说明用户对这类商品有非常大的需求量和忠诚度。浏览量、加购量与购买量有较高的相关性。

6.在用户行为偏好分析中,每天的21时是用户行为总数最多的时间,从18时开始用户行为总数就开始上升,一直持续到21时,22时用户行为总数开始回落,23时开始明显下降,但仍然保持很高的总数。在10时至18时,用户的浏览、收藏、加购和购买行为数目平稳,没有较大波动,18时往后到22时,用户的浏览、收藏、加购和购买行为均有稳定提升。因此,淘宝平台可以在18时至23时加大商品的推送力度,增加商品的曝光量,提升商品的购买率。除此之外可以观察到相比于其他三种用户行为,“收藏”这一用户行为一直都没有很大幅度的增长,说明用户对“收藏”这一行为并没有很重视。

    以上就是本篇文章【【数据分析】淘宝用户行为分析——基于R语言和Tableau】的全部内容了,欢迎阅览 ! 文章地址:http://nhjcxspj.xhstdz.com/quote/2769.html 
     行业      资讯      企业新闻      行情      企业黄页      同类资讯      网站地图      返回首页 物流园资讯移动站 http://yishengsujiao.xhstdz.com/ , 查看更多   
发表评论
0评