[发明专利]一种基于语义分析的政府网站舆情监测系统在审
申请号: | 201810188075.5 | 申请日: | 2018-03-07 |
公开(公告)号: | CN108595472A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 郭亚光 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
地址: | 230000 安徽省合*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据预处理模块 语义 倾向分析模块 信息获取模块 语义分析 监测系统 显示模块 政府网站 归纳 关键字提取单元 初步筛选 决策分析 网络舆情 文字信息 网站 筛选 分类 管理 | ||
1.一种基于语义分析的政府网站舆情监测系统,其特征在于:包括信息获取模块、数据预处理模块、语义倾向分析模块和舆情显示模块;
所述信息获取模块采用网络爬虫技术,通过互联网获取公众在网站中输入的咨询或留言互动所留下的所有信息,并将获取的所有信息发送至数据预处理模块;
所述数据预处理模块用于接收公众在网站中咨询或留言互动所留下的所有信息进行初步筛选,筛选所有信息中的图像或表情信息,将图像或表情信息转化为文字,进而得到纯文字信息,并将提取后的纯文字信息进行热点关键词提取,且按照关键字的不同进行分类归纳,归纳后的纯文字信息发送至语义倾向分析模块;
所述语义倾向分析模块用于接收数据预处理模块发送的分类归纳后的文字信息,对不同关键字分类下的文字信息进行语义分析,分析出文字信息中的不同语义,计算不同语义所占的比重,并将语音比重高的语义发送至舆情显示模块;
所述舆情显示模块用于接收语义倾向分析模块发送的语音比重最高对应的语义,并进行语义信息的显示,直观展示了公众的倾向。
2.根据权利要求1所述的一种基于语义分析的政府网站舆情监测系统,其特征在于:所述数据预处理模块包括初步筛选单元、关键字提取单元、分类归纳单元;
所述初步筛选单元用于对信息获取模块发送的咨询互动与留言互动的所有信息进行图像或表情提取,并将提取的图像或表情与存储的图像或表情进行对比,进而将图像或表情翻译为对应的文字信息,编译后的文字信息插入图像或表情所在的位置;
所述关键字提取单元用于接收初步筛选单元发送的经翻译后的所有文字信息,并将翻译后的所有文字信息进行关键字提取,提取的关键字发送至分类归纳单元;
所述分类归纳单元用于接收关键字提取单元发送的关键字,根据关键字对所有文字信息进行分类,将分类后的文字信息发送至语义倾向分析模块。
3.根据权利要求1所述的一种基于语义分析的政府网站舆情监测系统,其特征在于:所述不同语义所占的比重为Ki,
4.根据权利要求3所述的一种基于语义分析的政府网站舆情监测系统,其特征在于:所述不同语义所占的比重为Ki构成集合Ai(a1,a2,...,an),其中,n为不同语义的种类,采用冒泡法筛选出最高的语义比重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810188075.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于智能规划的知识获取方法
- 下一篇:一种基于云计算的大数据应用平台