[发明专利]评价要素的识别方法、装置及系统有效
申请号: | 201610346263.7 | 申请日: | 2016-05-23 |
公开(公告)号: | CN107423278B | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 姜珊珊;董滨;郑继川;张佳师;童毅轩 | 申请(专利权)人: | 株式会社理光 |
主分类号: | G06F40/205 | 分类号: | G06F40/205 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 黄灿;张博 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评价 要素 识别 方法 装置 系统 | ||
本发明提供了一种评价要素的识别方法、装置及系统,属于自然语言处理领域。评价要素的识别方法包括:接收输入文本;利用第一条件随机场模型对输入文本进行识别,得到第一识别结果,所述第一识别结果包括所述第一条件随机场模型识别出的待判定评价要素;利用第二条件随机场模型对输入文本进行识别,得到第二识别结果,所述第二识别结果包括所述第二条件随机场模型识别出的假阳性评价要素,其中,假阳性评价要素是误判为评价要素的要素;根据所述第一识别结果和所述第二识别结果识别出所述输入文本中的评价要素。本发明的技术方案能够准确识别出文本中的评价要素。
技术领域
本发明涉及自然语言处理领域,特别是指一种评价要素的识别方法、装置及系统。
背景技术
目前用户对产品的评价通常是通过文本来进行表达,为了更好地理解和分析评价文本中的观点,评价要素的观点挖掘成为评价分析领域的主要课题。评价要素的观点挖掘主要包含两个步骤,评价要素的抽取和其对应的情感倾向的判别。评价要素可以是被评价的对象或对象的特征。例如,在手机产品领域,“手机”和“屏幕”可以是评价要素。
在评价分析领域,评价要素抽取通常被当作一个命名实体识别任务,并采用判别式模型的条件随机场模型。与其他信息抽取任务相同,评价要素抽取的评价标准是准确率和召回率。准确率是条件随机场模型正确判断为该类的样本数与条件随机场模型判断属于该类的样本总数之比率,体现了条件随机场模型识别结果的准确程度;召回率是条件随机场模型正确判断为该类的样本数与属于该类的样本总数之比率,体现了条件随机场模型识别结果的完备性。
其中,提高准确率意味着减少假阳性结果,在条件随机场模型的应用中,现有技术往往通过特征调优来提高准确率。
然而单纯地对条件随机场模型进行特征调优的效果并不好。这是由于,要素词并不一定总是评价要素。例如,某用户评论写道“某手机的XX屏,很好很强大~”,其中“XX屏”是一个评价要素;但在另一条广告软文中出现“某手机采用强大的高清XX屏,…”。其中“XX屏”并不是评价要素,因为这个句子中并不存在观点。对于上述情况,很难找到一个方案来提高条件随机场模型识别结果的准确率。
发明内容
本发明要解决的技术问题是提供一种评价要素的识别方法、装置及系统,能够准确识别出文本中的评价要素。
为解决上述技术问题,本发明的实施例提供技术方案如下:
一方面,提供一种评价要素的识别方法,包括:
接收输入文本;
利用第一条件随机场模型对输入文本进行识别,得到第一识别结果,所述第一识别结果包括所述第一条件随机场模型识别出的待判定评价要素;
利用第二条件随机场模型对输入文本进行识别,得到第二识别结果,所述第二识别结果包括所述第二条件随机场模型识别出的假阳性评价要素,其中,假阳性评价要素是误判为评价要素的要素;
根据所述第一识别结果和所述第二识别结果识别出所述输入文本中的评价要素。
进一步地,所述利用第一条件随机场模型对输入文本进行识别之前,所述方法还包括:
获取多组第一训练数据,每组第一训练数据中包括有文本以及文本中标注的评价要素;
生成所述第一条件随机场模型的特征;
利用所述多组第一训练数据对所述第一条件随机场模型的特征的权重进行估计,并根据估计的权重生成所述第一条件随机场模型。
进一步地,所述第一条件随机场模型的特征为词级别的特征。
进一步地,所述利用第二条件随机场模型对输入文本进行识别之前,所述方法还包括:
获取多组第二训练数据,每组第二训练数据中包括有文本以及文本中标注的假阳性评价要素;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610346263.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:订单信息生成方法及装置
- 下一篇:一种金融信贷短信的信息抽取和分析方法