引入互联网搜索量的P2P网络借贷成交额预测研究.doc
文本预览下载声明
引入互联网搜索量的2网络借贷成交额预测研究
引入互联网搜索量的2网络借贷成交额预测研究
一、引言
国外网络借贷平台模式引入中国以来,让很多敢于尝试互联网投资的投资者认识了2网络借贷模式。2网络借贷作为互联网金融的重要组成部分,发展迅速。但由于我国2发展的年限较短,监管和制度法规还在逐步完善,仍存在很多风险和隐患,使得部分用户因为看不到其未来的发展,所以面对操作简单,收益可观的2网络借贷望而却步。许多学者研究发现互联网搜索量与实际的市场需求之间具有显著的相关关系,并且在预测模型中引入互联网搜索量有助于提高预测模型的精度。为帮助用户合理预估借贷风险与2网络借贷市场的发展趋势,本文引入百度指数,通过预测2网络交易规模给用户提供决策参考。
二、研究理论与模型建立
随着谷歌公司谷歌趋势和百度公司百度指数的推出,对于某一关键字的互联网搜索量数据不再难于获取,两类产品的推出为互联网环境下预测模型研究的发展奠定了基础。
è- , é[1]在智利运用谷歌指数构建一个谷歌汽车趋势指数,以普通自回归移动平均模型为基准,建立了加入谷歌汽车指数的对比模型,通过对模型的研究得出3模型最优,带有参数的拟合度更好。
在宏观经济预测方面, , [2]在预测私人消费时引入了互联网搜索变量谷歌指数。学者以自回归模型为基准模型,以加入了谷歌指数的模型作为对比模型,比较两类模型的拟合优度。通过对比两类模型,发现在置信水平下,加入谷歌指数的模型较基本模型拟合优度提高了。
不含互联网搜索量的预测模型建立
本文选取的数据是以月为跨度的2网络借贷成交额数据,也称2网络借贷成交额的时间序列数据。所谓时间序本文由论文联盟:收集整理列就是按照时间的顺序记录的一系列有序数据,通过对时间序列进行观察、研究,寻找其变化发展的规律,预测未来走势[3]。在时间序列的预测中,对于存在波动的时间序列的预测方法有自回归模型,移动平均模型和自回归移动平均模型等。以自回归模型为例,本文构建的基本模型如下:
其中:
为产品或服务的市场需求量;
为时间;
表示随机变量;
引入互联网搜索量的预测模型建立
时间序列除了在模型上扩展外,在模型的变量上也有所拓展。在一些研究中,学者们在基本模型中引入外生变量,通过探讨变量之间的相关性,提高预测的准确度。谢蒙萌[4]在研究多元线性回归模型在客户发展的预测中,引入了本地区网点数量、本地区高速公路入口流量、本地区和本地区机动车新增车辆数等解释变量,研究结果发现结合引入变量能够更好的实现预测效果。随着互联网的不断发展,互联网中蕴含的信息越来越得到学者们的重视。在2017年,谷歌公司推出谷歌趋势后,一些学者的注意力开始转向了互联网搜索量,分析互联网中某个关键词的搜索量与现实社会行为之间的关系。研究发现互联网中用户的相关关键词搜索量数据与客流量、股票价格等存在显著的相关关系[5]。
基于以上学者的研究成果,本文将探索互联网搜索量与2网贷成交额之间的关系,并在预测模型式中引入互联网搜索量,比较其与基本模型的预测效果,建立对比模型如下:
其中:
为产品或服务的市场需求量;
为时间;
为该产品或服务的搜索量数据;
表示随机变量;
三、实证研究
样本数据
网贷成交额
2网贷成交额数据分析
根据图1的散点图,可以发现2的百度搜索量越高,其实际网贷成交额越大,说明二者之间相关性较强,所以本文我们选用百度指数来预测2网贷成交规模。
1.平稳性分析
根据图1的散点图可以看出,2网贷成交额没有稳定的均值和方差,大体呈现上升趋势,说明该时间序列不具有平稳性,需要对其进行差分变换。
2.自相关与偏自相关分析
运用对2网络借贷成交额进行一阶差分自相关和偏自相关分析后可发现,自相关系数和偏自相关系数的值都比较小,没有超过±的置信上限和置信下限,说明一节差分后的数据具有平稳性,可以在此基础上建立预测模型。
时间序列预测模型分析
1.不含互联网搜索量的预测模型拟合
根据拟合结果表2可以看出,方的值为,说明模型用于预测2网贷成交额的拟合结果较好,可以解释实际数据的%。预测模型的均方根误差为,说明该模型的观测值和真值之间有一定偏差,模型拟合的准确度有待提升。
根据表3中的参数可以得出不含互联网搜索量的预测模型如下:
根据2网贷成交额数据预测得出的拟合曲线如下:
2.引入互联网搜索量的预测模型拟合
从拟合结果表4可以看出,加入互联网搜索量的2网贷预测模型方值为,高出不含互联网搜索量的方值,说明加入互联网搜索量的预测模型比不加互联网搜索量的预测模型的拟合效果更好,解释度更优。为,说明原
显示全部