[发明专利]一种基于多种自然语言处理技术的无人驾驶新闻分析方法在审
申请号: | 202211389089.6 | 申请日: | 2022-11-08 |
公开(公告)号: | CN115617970A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 白羽;黄启迪 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/951;G06F16/9535;G06F40/30;G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 合肥中谷知识产权代理事务所(普通合伙) 34146 | 代理人: | 袁锦波 |
地址: | 230000 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多种 自然语言 处理 技术 无人驾驶 新闻 分析 方法 | ||
本发明涉及一种基于多种自然语言处理技术的无人驾驶新闻分析方法,所述基于多种自然语言处理技术的无人驾驶新闻分析方法包括以下步骤:针对无人驾驶新闻,利用网络爬虫技术,爬取网络媒体新闻;数据预处理;主题数量确定和LDA模型;Word2vec文本向量化和LSTM建模训练;新闻分类和计算每日新闻情绪值;主题‑情绪可视化分析。本发明通过手动标注消极训练集和积极态度数据集,提高LSTM模型的准确率,计算的情绪值准确率高;通过LDA模型更好地区分新闻报道关于无人驾驶技术的主题,并计算出每类主题下新闻情绪值,为媒体机构、政策制定者、机构投资者与监管者带来及时反馈,具有一定的经济和社会效益。
技术领域
本发明属于新闻分析技术领域,尤其涉及一种基于多种自然语言处理技术的无人驾驶新闻分析方法。
背景技术
在计算机技术和大数据技术的推动下,越来越多的研究者开始从媒体新闻、公司报道等方面提取出文本情绪信息,相关研究仍然处于快速发展之中。与之相应的,计算机科学领域中的大数据和人工智能技术的快速发展也使得海量的信息挖掘和分析更加自动化、智能化,特别是自然语言处理领域中以机器学习、深度学习算法为代表的文本挖掘技术的日渐成熟,为上市公司和市场投资者提供了更有效及时的新闻媒体信息,但现有的方法效率和准确性有待提高。
目前,无人驾驶技术成为汽车产业发展新变量。鲜有针对无人驾驶相关新闻进行文本分析的研究,因此如何通过对无人驾驶新闻进行挖掘分析和文本处理以实现对无人驾驶技术提供重要数据支持,以帮助改善或提高相关政策文件制定,且如何使投资者针对新闻情绪做出理性决策,进而及时调整投资策略成为当下研究重点。
因此,有必要提供一种新的基于多种自然语言处理技术的无人驾驶新闻分析方法解决上述技术问题。
发明内容
本发明的目的就在于为了解决上述问题而提供一种基于多种自然语言处理技术的无人驾驶新闻分析方法。
本发明通过以下技术方案来实现上述目的:
一种基于多种自然语言处理技术的无人驾驶新闻分析方法,包括以下步骤:
S1:采集与无人驾驶相关的新闻文档数据;
S2:对所述新闻文档数据进行预处理,得到处理后新闻文档数据;
S3:构建主题提取模型,通过所述主题提取模型对所述处理后新闻文档数据进行主题提取和困惑度值计算,得到多个新闻主题数据和困惑度值,基于所述困惑度值大小选择出最优的若干个新闻主题数据;
S4:构建情绪值计算模型,将所述新闻文档数据输入所述情绪值计算模型中进行训练,得到训练后情绪值计算模型;
S5:将所述处理后新闻文档数据输入所述训练后情绪值计算模型,得到每条所述处理后新闻文档数据的情绪值;
S6:基于最优的若干个新闻主题数据和每条所述处理后新闻文档数据的情绪值制作出制作出每个不同的所述新闻主题数据下情绪值的视觉图表,实现了新闻分析的目的。
作为本发明的进一步优化方案,所述步骤S1中采集与无人驾驶相关的新闻文档数据的具体内容如下:通过网络爬虫技术,从互联网中爬取含有与无人驾驶相关的关键词的新闻文档数据,所述关键词包括无人驾驶、自动驾驶和智能驾驶。
作为本发明的进一步优化方案,所述步骤S2中对所述新闻文档数据进行预处理,得到处理后新闻文档数据,具体内容如下:对所述新闻文档数据进行数据清洗,包括去除重复、无关的新闻文档数据并对其中进行停用词去除和分词处理。
作为本发明的进一步优化方案,所述步骤S3中构建主题提取模型,通过所述主题提取模型对所述处理后新闻文档数据进行主题提取和困惑度值计算,得到多个新闻主题数据和困惑度值,基于所述困惑度值选择出最优的若干个新闻主题数据,具体内容如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211389089.6/2.html,转载请声明来源钻瓜专利网。