[发明专利]观点提取方法及装置在审
申请号: | 201810205252.6 | 申请日: | 2018-03-13 |
公开(公告)号: | CN110309407A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 沈一;蔡龙军;茅越;李明 | 申请(专利权)人: | 优酷网络技术(北京)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35;G06F17/27 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 观点提取 编码信息 特征信息 网络模型 循环神经网络 编码模块 解码模块 输入编码 输入解码 注意力机制 准确度 | ||
本公开涉及一种观点提取方法及装置。该方法通过网络模型实现,该网络模型包括编码模块以及解码模块,方法包括:获取待提取对象的特征信息;将特征信息输入编码模块中进行处理,确定待提取对象的编码信息;将编码信息输入解码模块中进行处理,确定待提取对象的观点提取结果,其中,编码模块包括循环神经网络,解码模块包括具有注意力机制的循环神经网络。根据本公开实施例,能够获取待提取对象的特征信息,将特征信息输入编码模块中进行处理,确定待提取对象的编码信息,将编码信息输入解码模块中进行处理,确定待提取对象的观点提取结果,通过利用网络模型实现获取待提取对象的观点提取结果,提高了观点提取结果的准确度。
技术领域
本公开涉及计算机技术领域,尤其涉及一种观点提取方法及装置。
背景技术
随着社交网络、移动互联网的不断普及,人们发布信息的成本越来越低,越来越多的用户乐于在互联网上分享自己的观点,这些观点对于舆情分析以及基于大数据的预测有着重要的意义。然而,相关技术中,观点提取结果的准确度较低。
发明内容
有鉴于此,本公开提出了一种观点提取方法及装置,能够准确地获取观点提取结果。
根据本公开的一方面,提供了一种观点提取方法,所述方法通过网络模型实现,所述网络模型包括编码模块以及解码模块,所述方法包括:
获取待提取对象的特征信息;
将所述特征信息输入所述编码模块中进行处理,确定所述待提取对象的编码信息;
将所述编码信息输入所述解码模块中进行处理,确定所述待提取对象的观点提取结果,
其中,所述编码模块包括循环神经网络,所述解码模块包括具有注意力机制的循环神经网络。
在一种可能的实现方式中,所述网络模型还包括嵌入模块,
其中,获取待提取对象的特征信息,包括:
确定所述待提取对象的多个初始信息;
将所述多个初始信息输入所述嵌入模块进行向量化处理,确定所述多个初始信息的向量信息;
将所述向量信息确定为所述特征信息。
在一种可能的实现方式中,所述编码模块包括第一隐藏层,所述特征信息包括T个编码时序的特征信息,
其中,将所述特征信息输入所述编码模块中进行处理,确定所述待提取对象的编码信息,包括:
将所述T个编码时序的特征信息输入所述第一隐藏层中进行处理,确定所述待提取对象的T个编码时序的编码信息,
其中,T为正整数。
在一种可能的实现方式中,所述解码模块包括第二隐藏层和输出层,所述输出层输出N个解码时序的观点提取结果,
其中,将所述编码信息输入所述解码模块中进行处理,确定所述待提取对象的观点提取结果,包括:
将第i-1个解码时序的隐藏层结果、第i-1个解码时序的观点提取结果以及第i-1个解码时序的语义信息输入到所述第二隐藏层中进行处理,确定第i个解码时序的隐藏层结果;
根据所述第i个解码时序的隐藏层结果以及所述T个编码时序的编码信息的相关度,分别确定针对所述第i个解码时序的所述T个编码时序的编码信息的T个权重;
通过注意力调整函数对所述T个编码时序的编码信息以及所述T个权重进行处理,确定第i个解码时序的语义信息;
将所述第i个解码时序的语义信息、第i-1个解码时序的观点提取结果以及所述第i个解码时序的隐藏层结果输入到所述输出层中进行处理,确定第i个解码时序的观点提取结果,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于优酷网络技术(北京)有限公司,未经优酷网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810205252.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:点击率预估方法、装置、设备及存储介质
- 下一篇:一种自动化搜索的方法