文档详情

项目范例成果报告 第五章 数据处理和可视化表达.pdf

发布:2025-05-27约1.09万字共12页下载文档
文本预览下载声明

第五章数据处理和可视化表达

第五章数据处理和可视化表达

网络购物平台客户行为数据分析报告

——以网络购物平台零食销售数据分析为例

一、引言

随着移动互联网和物联网的飞速发展,人类社会产生的数据以惊人的

速度增长。海量的数据几乎包含一切形式的结构化、半结构化以及非结构

化的数据,如网络日志、音频、视频、图片、地理位置信息等。如何高效

地对这些数据进行采集、存储、处理,并从中发掘到有价值的信息,是大

数据分析处理需要解决的问题。

二、分析目的

在日常工作,生活和学习中,大数据已成为人们提取信息、做出决策

的重要依据。大数据分析,使得商家可以通过分析网络购物平台客户的行

为数据,如客户购物订单中包含的商品,客户的购物行为特征、消费特征

等数据,为商品的区域摆放、捆绑销售等决策提供依据,甚至根据客户的

购物喜好,为客户提供个性化需求或服务,以提升市场的占有率。

通过完成“网络购物平台客户行为数据分析和可视化表达”项目,认

识大数据及其特征,认识大数据对人们日常生活的影响,了解数据采集、

分析和可视化表达的基本方法;学会选用恰当的软件工具或平台处理数

据,完成分析报告;理解对数据进行保护的意义。

三、数据需求

1.零食销售数据

包括零食名称(title)、店铺名称(store)、零食价格(price)、零食

订单量(paynum)等数据。

·1·

项目范例成果报告

2.客户订单数据

包括客户订单中商品名称等数据。

3.客户消费特征数据

包括客户年龄、平均每次消费金额、平均消费周期(天)等数据。

4.客户购物行为特征数据

包括客户身高、体重、年龄以及客户属性等数据。

四、数据采集

1.确定数据来源

项目所需的零食销售数据、客户订单数据、客户消费特征数据、客户

购物行为特征数据等,来源于网络购物平台。

2.数据的采集

通过网络数据采集法,利用Python爬虫程序等工具从网络购物平台采集

零食销售数据、客户订单数据、客户消费特征数据以及客户购物行为特征

数据。

爬虫程序采集零食销售数据关键代码如下所示。

defparsePage(ilt,html):

try:

tlt=re.findall(r\raw_title\\:\.*?\,html)

sto=re.findall(r\nick\\:\.*?\,html)

plt=re.findall(r\view_price\\:\[\d\.]*\,html)

pay=re.findall(r\view_sales\\:\.*?\,html)

foriinrange(len(plt)):

title=eval(tlt[i].split(:)[1])

store=eval(sto[i].split(:)[1])

price=eval(plt[i].split(:)[1])

paynum=eval(pay[i].split(:)[1])

ilt.append([title,store,price,paynum])

except:

print()

·2·

显示全部
相似文档