项目范例成果报告 第五章 数据处理和可视化表达.pdf
第五章数据处理和可视化表达
第五章数据处理和可视化表达
网络购物平台客户行为数据分析报告
——以网络购物平台零食销售数据分析为例
一、引言
随着移动互联网和物联网的飞速发展,人类社会产生的数据以惊人的
速度增长。海量的数据几乎包含一切形式的结构化、半结构化以及非结构
化的数据,如网络日志、音频、视频、图片、地理位置信息等。如何高效
地对这些数据进行采集、存储、处理,并从中发掘到有价值的信息,是大
数据分析处理需要解决的问题。
二、分析目的
在日常工作,生活和学习中,大数据已成为人们提取信息、做出决策
的重要依据。大数据分析,使得商家可以通过分析网络购物平台客户的行
为数据,如客户购物订单中包含的商品,客户的购物行为特征、消费特征
等数据,为商品的区域摆放、捆绑销售等决策提供依据,甚至根据客户的
购物喜好,为客户提供个性化需求或服务,以提升市场的占有率。
通过完成“网络购物平台客户行为数据分析和可视化表达”项目,认
识大数据及其特征,认识大数据对人们日常生活的影响,了解数据采集、
分析和可视化表达的基本方法;学会选用恰当的软件工具或平台处理数
据,完成分析报告;理解对数据进行保护的意义。
三、数据需求
1.零食销售数据
包括零食名称(title)、店铺名称(store)、零食价格(price)、零食
订单量(paynum)等数据。
·1·
项目范例成果报告
2.客户订单数据
包括客户订单中商品名称等数据。
3.客户消费特征数据
包括客户年龄、平均每次消费金额、平均消费周期(天)等数据。
4.客户购物行为特征数据
包括客户身高、体重、年龄以及客户属性等数据。
四、数据采集
1.确定数据来源
项目所需的零食销售数据、客户订单数据、客户消费特征数据、客户
购物行为特征数据等,来源于网络购物平台。
2.数据的采集
通过网络数据采集法,利用Python爬虫程序等工具从网络购物平台采集
零食销售数据、客户订单数据、客户消费特征数据以及客户购物行为特征
数据。
爬虫程序采集零食销售数据关键代码如下所示。
defparsePage(ilt,html):
try:
tlt=re.findall(r\raw_title\\:\.*?\,html)
sto=re.findall(r\nick\\:\.*?\,html)
plt=re.findall(r\view_price\\:\[\d\.]*\,html)
pay=re.findall(r\view_sales\\:\.*?\,html)
foriinrange(len(plt)):
title=eval(tlt[i].split(:)[1])
store=eval(sto[i].split(:)[1])
price=eval(plt[i].split(:)[1])
paynum=eval(pay[i].split(:)[1])
ilt.append([title,store,price,paynum])
except:
print()
·2·