[发明专利]对象评价方法及装置、存储介质、电子装置在审
申请号: | 202011443361.5 | 申请日: | 2020-12-11 |
公开(公告)号: | CN112906374A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 陈奕铭 | 申请(专利权)人: | 中信银行股份有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F16/31;G06F16/38;G06F16/33;G06F40/279;G06F40/211 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张峰 |
地址: | 100020 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象 评价 方法 装置 存储 介质 电子 | ||
本发明实施例提供了一种对象评价方法及装置、存储介质、电子装置,该方法包括:从确定的N个媒体文件中提取与目标对象相关联的关键语句,得到目标对象的语料信息,其中,N个媒体文件属于不同的媒体载体,N是大于或等于1的自然数;基于语料信息构建目标对象的词袋;确定词袋中每个词在不同的媒体载体中的权重值;利用每个词在不同的媒体载体中的权重值评价目标对象。通过本发明,解决了相关技术中语料获取不准确,导致对对象的评价不准确的问题,达到准确的通过语料信息评价对象的效果。
技术领域
本发明实施例涉及数据处理领域,具体而言,涉及一种对象评价方法及装置、存储介质、电子装置。
背景技术
以用户评论内容建立的语料系统对于舆情监督、形象构建具有较强的普适性,往往能较为准确地监测某一时间范围内某主体的情感词条。不过这种语料没有较强的结构性,所获语料也因而不够稳定,尤其各种媒体平台逐渐推行反爬机制,普通用户语料的获取难度在日益提升,尽管有些时候语料仅用于检测评价。
针对现有技术中存在的语料获取不准确,导致对对象的评价不准确的问题,相关技术中尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种对象评价方法及装置、存储介质、电子装置,以至少解决相关技术中语料获取不准确,导致对对象的评价不准确的问题。
根据本发明的一个实施例,提供了一种对象评价方法,包括:
从确定的N个媒体文件中提取与目标对象相关联的关键语句,得到上述目标对象的语料信息,其中,上述N个媒体文件属于不同的媒体载体,上述N是大于或等于1的自然数;
基于上述语料信息构建上述目标对象的词袋;
确定上述词袋中每个词在上述不同的媒体载体中的权重值;
利用上述每个词在上述不同的媒体载体中的权重值评价上述目标对象。
根据本发明的另一个实施例,提供了一种对象评价装置,包括:
第一提取模块,用于从确定的N个媒体文件中提取与目标对象相关联的关键语句,得到上述目标对象的语料信息,其中,上述N个媒体文件属于不同的媒体载体,上述N是大于或等于1的自然数;
第一构建模块,用于基于上述语料信息构建上述目标对象的词袋;
第一确定模块,用于确定上述词袋中每个词在上述不同的媒体载体中的权重值;
第一评价模块,用于利用上述每个词在上述不同的媒体载体中的权重值评价上述目标对象。
在一个实例性实施例中,上述第一提取模块,包括:
第一获取单元,用于利用爬虫程序从上述不同的媒体载体中获取预设日期的上述N个媒体文件;
第一提取单元,用于提取上述N个媒体文件中与上述目标对象相关联的每个媒体文件的标题和导语,得到上述关键语句;
第一确定单元,用于将上述关键语句确定为上述目标对象的语料信息。
在一个实例性实施例中,上述装置还包括:
第一存储模块,用于在基于上述语料信息构建上述目标对象的词袋之后,将上述语料信息存储至数据库中;
分配模块,用于在上述数据库中对上述语料信息分配对应的索引;
第二存储模块,用于将上述索引存储至上述数据库中的数据表中。
在一个实例性实施例中,上述第一确定模块,包括:
第二确定单元,用于确定上述词袋中每个词在上述N个媒体文件中出现的频率,得到上述词袋中每个词的词频;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中信银行股份有限公司,未经中信银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011443361.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种氦氧-空气潜水减压控制系统及其方法
- 下一篇:紧密联接的单模块后处理系统