文档详情

《经济和金融领域运用文本大数据研究的国内外文献综述》2800字.docx

发布:2025-03-07约3.93千字共4页下载文档
文本预览下载声明

经济和金融领域运用文本大数据研究的国内外文献综述

1.理论研究现状

从行为金融学的相关理论来看人们投资者的行为时会发现,人们的投资活动也容易受自身的心理因素影响REF_Ref2862\r\h[9]。投资活动往往暴露了一些投资者的感性情绪,据此研究工作人员认为,决策者的投资偏好一般都是多个方面、容易改变的,这种投资偏好往往只在进行决策的过程中才能逐渐形成;投资者往往由于自身势单力薄,缺乏专业知识REF_Ref4548\r\h[15],消息渠道和投资经验等原因根据“噪声信息”投资,相关投资社区等就容易因同类用户的聚集而形成噪声并互相影响,干扰自身判断,也有明显的羊群效应REF_Ref26434\r\h[1],“出盈保亏”现象也很普遍,这些无不说明投资者的情绪会对其行为产生影响,由此分析投资者的情绪表达对于其投资行为是十分重要的参考REF_Ref26692\r\h[2]。

从情绪衡量的指标来看,许多研究人员从寻找可以衡量投资者情绪的数据来源出发,使用时间序列模型分析其与股市收益的相关性,并得出其与股市收益存在长期正相关的关系,也说明了投资者情绪与社会投资活动存在较强的关联,其决策会对市场变化发生一定程度的影响REF_Ref1932\r\h[6]。而随着深度学习技术的发展,现代量化投资者情绪可以从海量的网络文本数据中高效地挖掘出其隐含的情绪状态,并从中提取出有价值的信息。

2.理论发展

人们的非理性的行为可能产生持续性影响,通过结合心理学与行为学的相关理论,系统地研究金融活动中的参与者行为REF_Ref512\r\h[14],理查德·塞勒证明了人的性格确实会对个人决策与市场结果造成系统性影响。迈尔斯塔特曼从行为投资组合、心理会计、行为资产定价模型论述投资者的认识偏差、认知错误。

神经网络模拟人脑中各个神经元对于信息的传递处理过程,按照其连接形态和方式可以组成不同的网络。神经网络由大量的节点之间相互连接构成,每一个节点都可以用来代表一个输出的函数,这个节点输出的函数也被我们统统地称为一个激励函数,而每两个节点之间的相互连接都可以代表一个对于通过该节点连接产生信号的加权值,这个节点的加权值也被我们统统地称为输出的权重,整个神经网络的每一个输出根据其所受连接的方式、激励函数以及其权重的不同而变化。有的研究者提出可以将其应用于自然语言处理领域,这么做的最大优势主要就是无需再花费大量的时间精力在进行特征提取与选择上。将单词的分布式表达器输入应用到了神经网络中,运用卷积、点乘、非线性函数、矩阵相乘等运算,自动地提取并给出对文本进行分类有价值的信息,具有易读性,具备抗干扰能力,能够保持模型相对稳定REF_Ref31277\r\h[3]。

在情绪衡量方面,网络用户的行为、评论往往是运用分析模型计算的重要领域,Da、EngelbergGao(2015)通过民众在互联网上的搜索内容来衡量投资者情绪的变化。Jiangetal.(2016)通过LM词典对经理人的文本情感指数予以搭建,根据相关研究和分析,未来股市收益、情感指数二者间的关系即反向影响。MeenaRambocas回顾在线情绪分析的营销文献,并从分析单元、抽样分析和情绪分析的角度得出了情绪对用户的营销作用REF_Ref22767\r\h[17]。在国内,研究人员通过从虚拟交流平台获取数据,构建出一系列可以用来评价投资者心理状态的指标;或者采用相关指标,如消费者信心指数(池丽旭、庄心田,2009)、好淡指数(吕志岩,2013、曾炫川,2015)、新增开户数、开放式股票型基金资金净流入(王春,2014)等对投资者偏好,信心,投资者增加量等相对较为广泛接受的指标进行间接分析。REF_Ref31336\r\h[5]从文本情感分析的角度,人们研究的对象从IPO公司上市前主流财经媒体正负面词汇数(汪昌云、武佳薇,2015)、东方财富网标题内容的词频统计(易洪波等,2015)、用户在股吧、论坛的评论数(刘珂言,2015)、知网、微博话题信息文本分析(孟雪井、孟祥兰、胡杨洋,2016)以及东方财富网股吧的评论数据(孟志青、郑国杰、赵韵文,2018)等都有作为直接代理变量衡量投资者情绪指标REF_Ref15290\r\h[10]。

3.理论应用及成果

凭借着文本分类技术的快速发展与进步,金融学领域的文本分析效率得到大幅度的提高,利用文本挖掘技术精炼非结构化文本数据,机器学习在文本分析上的应用是十分热门的课题。通过解析人们的评价和言论获取的文本数据,可以用于刻画关注度、情绪或语调、可读性、新闻隐含波动率和意见分歧等方面。

文本信息的来源多种多样,从虚拟网络社区的发帖与跟评,消费者对产品的评价,上市公司

显示全部
相似文档