学术科研
基于文本分析与机器学习的文献学习
发布于:2021-07-13 来源:美高梅mgm1888公司官网

【编者按】信息的膨胀使得人们获取信息的渠道越来越宽,量也越来越大。但由于信息量的迅速增加,给人们获取有用知识带来了“噪声”,对“减噪”的研究也成为数据挖掘的研究热点。机器学习方法是数据挖掘的一种重要方法,它将计算机科学和人工智能科学结合在一一起,本期选取三篇关于机器学习和文本分析在文献中应用的文章。

推文信息1:伊志宏,杨圣之,陈钦源.分析师能降低股价同步性吗——基于研究报告文本分析的实证研究[J].中国工业经济,2019(01):156-173.

一、引言

股价同步性指个股价格波动与市场价格波动之间的关联性,是财务与金融学领域备受关注的研究热点之一。由于股价同步性反映了公司特质信息融入股价的程度,学术界把股价同步性作为衡量股票市场信息传递效率的指标,并研究股价同步性对公司经营活动产生的影响。现有研究普遍认为,中国的股票市场股价同步性较高,公司特质信息不能较好地融入股价,严重损害了资本市场资源配置能力,因而在中国的资本市场上,对股价同步性的研究具有重要的理论和实践意义。与此同时,当前中国正处于金融改革的新阶段。党的十九大报告中明确提出,新时代中国金融发展与建设的方向为“深化金融体制改革,增强金融服务实体经济能力”。 显然,只有在股票价格充分反映公司特质信息的前提下,金融市场才能发挥合理配置资源的能力,进而服务于实体经济,因此,关注资本市场信息传递效率亦是中国金融领域研究的当务之急。 在前述背景下,关注股价同步性的成因,并且研究如何降低股价同步性,是一项重要而迫切的任务,对提高资本市场定价效率,促进中国金融市场健康发展,助力新时代中国的金融改革具有重大意义。

二、理论分析与假设

1已有的研究表明,公司特质信息是影响股票价格的重要因素,受到投资者极大关注这促使分析师挖掘并传递有增量价值的公司特质信息。同时,由于公司特质信息对投资者而言具有信息含量,通过提供公司特质信息,分析师能够发布质量更高的报告,这有利于分析师的职业生涯发展。由于分析师获取公司特质信息的能力存在差异存在某些特征的分析师的关注会降低公司的股价同步性分析师如果能够将公司特质信息传递到股票市场,通过降低这种信息不对称,从理论上看能够降低个股的股价同步性。

据此,文章提出:假说 1:分析师报告中提供的公司特质信息含量越高,分析师所关注的公司股价同步性越低。

2)公司信息不对称、公司特质信息与股价同步性。 已有研究表明,不同企业之间的信息不对称程度存在差异。 企业的信息不对称程度通过影响投资者的信息获取成本,进而影响到投资者对分析师报告的依赖程度。分析师报告中的公司特质信息降低股价同步性这一假设成立的前提在于,企业的公司特质信息无法反映到资本市场中,即公司存在严重的信息不对称。 因此,当企业的信息不对称问题更加严重时,分析师报告中的公司特质信息降低股价同步性的效果应当更加显著。 基于以上分析,文章提出:

假说 2:当关注公司的信息不对称程度越高时,报告中提供的公司特质信息的含量与股价同步性之间的负相关关系越强。

3)分析师报告影响力、公司特质信息与股价同步性。分析师报告的公司特质信息能够缓解投资者与公司之间的信息不对称,并降低股价同步性的假设蕴含另一个前提:分析师发布的报告包含股价中所未能反映的信息,能够影响市场。 如果市场不认可分析师所提供的报告信息,不依据报告信息进行投资决策, 那么分析师提供的信息内容对股价无法产生影响, 当然也无法降低股价同步性。 因此,分析师报告对市场的影响力是报告所提供的公司特质信息能够对股价同步性产生影响的另一个关键。 分析师个人特征分析师信息渠道的不同分析师报告的评级与语气都会显著影响依据以上观点,文章提出:

假说 3:分析师报告的影响力越大时,报告中提供的公司特质信息的含量与股价同步性之间的负相关关系越强。

三、研究设计及主要结论

    为检验以上问题,文章以沪深A 股所有上市公司为样本, 搜集了 2009—2015 年相关的分析师研究报告共计250915 份,研究了分析师报告中公司特质信息含量与股价同步性之间的关系。文章采用支持向量机的文本分析技术, 将分析师报告中的文本分为与公司特质信息相关的句子以及与公司特质信息无关的句子,实证检验分析师报告中公司特质信息含量与股价同步性的关系。 实证发现:分析师报告中公司特质信息含量越高, 公司的股价同步性越低, 并且这一负向关系在公司信息不对称水平更高、分析师报告影响力更大时更加显著。 进一步研究发现,明星分析师、所在券商规模更大的分析师、经验丰富的分析师所发布的报告中公司特质信息含量更高;公司特质信息含量更高的报告盈余预测更加准确,不仅更受投资者关注,而且能够引起更强的市场反应。文章的结论表明,分析师作为资本市场重要的信息发现者与信息传播中介,可以通过发布研究报告促进信息融入股票价格,提高资本市场运行效率。文的研究丰富了分析师和股价同步性两方面的研究文献,同时为分析师报告进行文本分析提供了新的视角,对投资者、上市公司、分析师以及监管部门具有重要的理论意义和实践意义。

推文信息2:胡楠,薛付婧,王昊楠.管理者短视主义影响企业长期投资吗?——基于文本分析和机器学习[J].管理世界,2021,37(05):139-156+11+19-21.

一、引言

管理者短视主义,起源于社会心理学的时间导向理论,指管理者的决策视域较短,相对于关注企业未来发展,管理者更倾向于关注当下能够即刻满足的利益。这种时间导向通常被认为是一种先天的、稳定的个人特质和潜意识过程,但也会部分受到后天环境的影响。高层梯队理论和时间导向理论认为,管理者对时间认知的特质会决定其行为。那么,管理者短视主义会对企业长期投资产生何种影响?二者之间的关系会受到何种因素的调节作用?管理者短视主义是否会通过影响长期投资而最终影响企业未来绩效?以上是文章希望探讨的问题。文章的贡献体现在以下几个方面:(1)把基于社会心理学的时间导向理论和高层梯队理论结合,引入企业长期投资领域并得到验证。(2)考察了多种监督因素对管理者短视和长期投资关系的抑制作用,这对充分发挥企业、市场和政府的监管作用提供了理论启示。(3)将文本分析和机器学习方法引入管理者短视的研究,提出全新的能够直接衡量管理者短视的文本指标。(4)从管理者主观性情层面提供了研究管理者短视的新视角。

二、理论分析与假设

由于管理者短视导致其决策视域较短,出于对当下业绩和股票表现的考虑,他们宁愿最大化短期财务业绩和股票价格而牺牲企业长远利益。因此,短视的管理者在进行投资决策时,更加倾向于选择期限短、收益高的项目。而资本支出和研发等长期投资通常都具有投入在前收益在后、产出不确定和收益跨期性等特点。研发则需要大量资金的持续投入,并且周期长、风险大,往往会导致较高的经营风险。因此,短视的管理者会利用其掌握的资源和个人权威,影响企业的投资规模和方式,减少企业的资本支出和研发支出。基于此,文章提出以下假设。

 H1:管理者短视主义与企业长期投资之间呈负相关关系。

公司治理机制往往通过股东大会、董事会与监事会三方的权利分立和制衡来平衡企业内部利益主体之间的关系。股东拥有对企业重大事项的监督权和决策参与权,可以“用手投票”替换不合格的管理者,制约管理者的短视等自利性行为。董事会设置的独立董事和专门委员会等制度,可以监督和制约管理者的职权行使。监事会可对企业的业务活动进行监督和检查,纠正管理者在执行职务时损害股东利益的自利性行为,降低管理者短视的可能性。因此,公司治理水平越高时,即便管理者具有短视主义特质,其短视行为也会被抑制,管理者短视与企业长期投资间的负相关关系会减弱。

相较于个人投资者,机构投资者往往资金规模大、专业知识强,对企业管理者的影响力也更强。他们通常奉行价值投资理念,有更强的动机去关注和获取企业的长期价值信息,而不是过分依赖于短期业绩信息。因此机构投资者通常被认为会有效地监督管理者,促进企业长期行为。当监督型机构投资者的持股比例越高时,即便管理者具有短视主义特质,其短视行为也会被抑制,管理者短视与企业长期投资的负相关关系会减弱。

分析师具备专业的信息搜索和处理能力,能够根据海量信息对企业价值做出预测和评级,一旦分析师发现管理者有短视等机会主义行为,则会降低公司股价和市场价值估值,这将使管理者的机会主义行为受到约束。同时,当分析师关注度越高时,管理者隐藏的信息就越可能被揭露给投资者,企业也越容易暴露于利益相关者的监督之下,从而亦使管理者短视主义行为受到约束。因此,分析师关注度越高时,即便管理者具有短视主义特质,其短视行为也会被抑制,管理者短视主义与企业长期投资间的负相关关系会减弱。综合以上分析,文章提出以下假设。

H2a:公司治理水平越高时,管理者短视主义与企业长期投资的负相关关系越易受到抑制。

H2b:监督型机构投资者的持股比例越高时,管理者短视主义与企业长期投资的负相关关系越易受到抑制。

H2c:分析师关注度越高时,管理者短视主义与企业长期投资的负相关关系越易受到抑制。

三、研究设计及主要结论

文章基于社会心理学的时间导向理论和高层梯队理论,以中国A 股上市公司 2007~2018 年年报中的管理者讨论与分析(MD&A)内容为对象,采用文本分析和机器学习方法构建了管理者短视指标,从管理者的内在特质视角理论阐述并实证检验了管理者短视主义对企业长期投资的影响机理。研究结果表明:(1)当MD&A 披露越多的“短期视域”词汇时,这反映出管理者越具有短期时间导向特质。(2)管理者短视主义会导致企业减少资本支出和研发支出,在控制了影响管理者短视的环境因素变量和其他短视代理变量、排除了内生性问题、管理者机会主义影响以及替换长期投资计算方式之后,该结果依然存在。(3)公司治理水平越高、监督型机构投资者持股比例和分析师关注度越高时,管理者短视主义对企业长期投资的负向影响越会受到抑制。 (4)企业长期投资在管理者短视主义特质与未来绩效间发挥了中介效应,管理者短视主义通过减少研发支出或降低资本投资效率进而损害了企业的未来绩效。

推文信息3:张宗新,吴钊颖.媒体情绪传染与分析师乐观偏差——基于机器学习文本分析方法的经验证据[J].管理世界,2021,37(01):170-185+11+20-22.

一、引言

近年来,媒体舆情对资本市场的影响力日益凸显。例如在2015 4 月,部分媒体报道“4000 点才是 A 股牛市的开端”的观点,此后券商分析师信心指数环比增长 21%。而在 2019 年底,白酒行业关于甜蜜素事件的负面舆情继 2012 年塑化剂事件后再次爆发,致使白酒板块的整体股价遭受了重大负向冲击。最新研究也表明,媒体舆情会引导市场注意力和交易行为,显著影响资本市场的价格波动性特征,甚至引起股票价格过度反应与反转效应。那么,在中国资本市场中,媒体情绪所形成的意见环境是否会影响分析师的盈利预测行为?若上述影响效应存在,媒体情绪将通过哪些路径传染至分析师情绪?媒体情绪对分析师乐观偏差的传染效应又是否会影响资本市场平稳运行?然而在以往的文献中,上述问题还未得到系统性的讨论。对这些问题的回答不仅有利于认识媒体报道及其情绪的潜在影响,也有助于更加全面客观评估证券分析师的行为及其有限理性特征,对进一步规范媒体行为和深化证券分析师相关制度建设具有较好的借鉴意义。

二、理论分析与假设

以往文献大多基于“分析师是完全理性人”这一前提,立足于理性因素视角来解释分析师群体的系统性乐观偏差。但随着行为金融理论的发展,国内外的一些学者否定了这一前提的合理性,并通过实证检验证实了分析师是不完全理性的,而媒体报道,特别是网络媒体报道,是证券分析师日常核心工作的主要信息来源,报道中所表达的部分有偏的观点与情绪会不可避免地向分析师传递,甚至干扰有限理性分析师群体的认知与判断。因此文章认为,分析师盈利预测的乐观偏差会受到媒体报道情绪这一非理性因素的显著影响。当市场上媒体情绪较为乐观时,一方面分析师基于公共信息提高对公司未来发展的信心程度,另一方面分析师可能受到媒体乐观情绪的感染变得更加激进甚至“过度反应”,从而发布较为乐观积极的分析报告以及存在乐观偏差的盈利预测。而当市场上媒体情绪较为悲观时,分析师会对公司的业绩表现保持更加谨慎的态度,同时悲观的媒体情绪也会平抑分析师的乐观倾向,由此导致分析师发布乐观程度较低的盈利预测。基于上述分析,文章提出假设 H1

H1:媒体报道情绪会显著正向影响分析师盈利预测的乐观偏差,即分析师存在媒体情绪传染效应

基于既有行为金融学研究,文章认为可能存在“分析师有限关注”与“投资者情绪”两条影响路径将媒体报道情绪传染至分析师。 从“分析师有限关注”路径来说,认知资源的稀缺性使得分析师与普通投资者一样受到有限注意力的约束 ,因此,分析师们往往将目光投射到市场热切关注或乐观看好的公司,体现出情绪驱动的特征。一方面,媒体报道是分析师日常工作的重要消息来源,此时部分有偏的媒体观点可能被有限理性的分析师接纳并感知,而越乐观的媒体情绪能够吸引更多乐观分析师的注意力。另一方面,较高的乐观分析师关注度意味着此时分析师群体的乐观情绪高涨,甚至胜过了信息增量的理性作用。在二者的共同作用下,处在信息不确定困境的分析师倾向于表现出行动趋同的羊群行为,跟随市场情绪发布有偏报告,进而产生更大程度的盈利预测乐观偏差。因此,拥有乐观媒体情绪的上市公司能够吸引到更多具有乐观情绪的分析师的关注,而当乐观分析师关注度较高时,分析师在盈利预测时会产生更高程度的乐观偏差。由此,文章提出假设 H2

H2:媒体情绪越乐观的公司受到乐观分析师的关注度越高,使得分析师会发布更高程度的盈利预测乐 观偏差,即乐观分析师关注度是媒体情绪传染效应的传导路径。

“投资者情绪”路径来说,行为金融学领域研究表明,市场情绪会通过干预投资者的信心建立和预期形成过程来进一步影响他们的投资决策行为。而悲观的媒体报道诱使投资者产生对公司未来业绩表现的悲观预期,抑制了投资者的乐观情绪,从而使股票价格受到下行压力的冲击,同时正反馈效应使得悲观情绪在投资者之间不断传染和累积,产生强大的投资者情绪。不少学者也研究证实了投资者情绪在分析师预测行为上起着重要的影响作用。因此,当公司的媒体情绪较为乐观时,持有该公司股票的投资者会受到媒体乐观情绪的感染而对公司未来业绩持乐观态度。乐观的投资者情绪会进一步传递到分析师群体,促使分析师发布较为乐观的盈利预测报告。由此,文章提出假设 H3

H3:媒体报道情绪通过影响公司层面的投资者情绪,进而促使分析师盈利预测的乐观偏差度随投资者情绪波动发生系统性变化,即投资者情绪是媒体情绪传染效应的传导路径。

较多的经验证据表明分析师乐观偏差会显著影响股价走势。但较高的分析师乐观偏差也意味着公司信息环境的透明度较低。因为在乐观偏差的影响下,证券分析师不能及时地向外部投资者反馈公司的负面信息,导致股价不能全面准确地反映基本面信息。因此,当分析师盈余预测出现的乐观偏差频次越高,公司负面消息未及时披露的可能性越大,则潜在的股价下跌风险也越高。而当累积的负面消息最终被市场识破时,将导致股价泡沫的破灭,使得股价大幅下挫。基于上述分析,文章认为分析师盈利预测的乐观倾向会促使公司股价过度反应,即公司股价在分析师乐观情绪的支持下过度上涨,而一旦爆发潜在的外部负面冲击又会促使股价过度下跌,因此市场上股票收益的波动幅度加剧。由此,文章提出假设H4a

H4a:分析师盈利预测的乐观偏差会显著加剧股价波动。

现有研究提出媒体情绪会显著影响资本市场中资产价格的走势与波动幅度。值得注意的是,分析师预测的乐观倾向可能构成了媒体情绪影响市场收益波动的重要中间渠道与共振效应机制。狂热且过于乐观的媒体情绪,会显著地影响分析师的盈利预测行为,促使有限理性的分析师发布乐观倾向的分析报告,而分析师盈利预测的乐观偏差又会进一步提升媒体报道的乐观情绪,二者相互影响形成正反馈机制,导致股价泡沫的产生并加剧股票收益的波动。而压抑且消极的媒体情绪会致使分析师发布较为谨慎的预测报告,此时分析师能够更为理性且准确地对公司未来盈利状况进行预测,因此股价的波动幅度减轻。基于上述分析,文章认为,分析师的乐观情绪在媒体报道情绪影响股价波动的过程中起着重要的中介作用。综上所述,文章提出假设H4b

H4b:分析师盈利预测的乐观偏差是媒体情绪影响市场收益波动的传导机制,即分析师的乐观情绪在体情绪加剧股价波动的过程中发挥了中介效应。

三、研究设计及主要结论

文章以2013~2017 年间沪深两市 A 股上市公司为研究样本,通过编写爬虫程序获取公司百度新闻报道,运用基于机器学习方法的自然语言处理技术对文本情绪进行分析测算,从行为金融学视角考察了媒体情绪对分析师盈利预测乐观倾向的影响,同时挖掘了媒体情绪传染效应的作用机制,及其对股票市场波动的影响。研究结果表明:(1)分析师盈利预测的乐观偏差会受到媒体情绪的显著正向影响,即存在媒体情绪传染效应。(2)媒体情绪会通过“分析师有限关注”以及“投资者情绪”两条路径传染至分析师情绪。(3)媒体情绪传染效应会给资本市场带来波动风险冲击。一方面,分析师盈利预测时的乐观倾向会显著加剧资本市场股票收益的波动率和尾部风险;另一方面,分析师的乐观情绪也在媒体情绪助推股价波动的过程中发挥了部分中介效应的作用,构成媒体情绪影响股价波动的传导路径及共振机制。(4)进一步研究发现,相比非明星分析师,明星分析师的预测行为受到媒体情绪影响的程度更低但仍然显著,意味着明星分析师理性程度相对更高但也是有限理性。此外,明星分析师在资本市场上具有更高的影响力,容易受到非明星分析师等“非理性羊群”的追随和趋同,因此明星分析师的乐观预测会引起更大幅度的市场波动,同时明星分析师的媒体情绪传染效应会更大程度地影响资本市场稳定运行。