[发明专利]观点提取方法及装置在审
申请号: | 201810205252.6 | 申请日: | 2018-03-13 |
公开(公告)号: | CN110309407A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 沈一;蔡龙军;茅越;李明 | 申请(专利权)人: | 优酷网络技术(北京)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35;G06F17/27 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 观点提取 编码信息 特征信息 网络模型 循环神经网络 编码模块 解码模块 输入编码 输入解码 注意力机制 准确度 | ||
1.一种观点提取方法,其特征在于,所述方法通过网络模型实现,所述网络模型包括编码模块以及解码模块,所述方法包括:
获取待提取对象的特征信息;
将所述特征信息输入所述编码模块中进行处理,确定所述待提取对象的编码信息;
将所述编码信息输入所述解码模块中进行处理,确定所述待提取对象的观点提取结果,
其中,所述编码模块包括循环神经网络,所述解码模块包括具有注意力机制的循环神经网络。
2.根据权利要求1所述的方法,其特征在于,所述网络模型还包括嵌入模块,
其中,获取待提取对象的特征信息,包括:
确定所述待提取对象的多个初始信息;
将所述多个初始信息输入所述嵌入模块进行向量化处理,确定所述多个初始信息的向量信息;
将所述向量信息确定为所述特征信息。
3.根据权利要求1所述的方法,其特征在于,所述编码模块包括第一隐藏层,所述特征信息包括T个编码时序的特征信息,
其中,将所述特征信息输入所述编码模块中进行处理,确定所述待提取对象的编码信息,包括:
将所述T个编码时序的特征信息输入所述第一隐藏层中进行处理,确定所述待提取对象的T个编码时序的编码信息,
其中,T为正整数。
4.根据权利要求3所述的方法,其特征在于,所述解码模块包括第二隐藏层和输出层,所述输出层输出N个解码时序的观点提取结果,
其中,将所述编码信息输入所述解码模块中进行处理,确定所述待提取对象的观点提取结果,包括:
将第i-1个解码时序的隐藏层结果、第i-1个解码时序的观点提取结果以及第i-1个解码时序的语义信息输入到所述第二隐藏层中进行处理,确定第i个解码时序的隐藏层结果;
根据所述第i个解码时序的隐藏层结果以及所述T个编码时序的编码信息的相关度,分别确定针对所述第i个解码时序的所述T个编码时序的编码信息的T个权重;
通过注意力调整函数对所述T个编码时序的编码信息以及所述T个权重进行处理,确定第i个解码时序的语义信息;
将所述第i个解码时序的语义信息、第i-1个解码时序的观点提取结果以及所述第i个解码时序的隐藏层结果输入到所述输出层中进行处理,确定第i个解码时序的观点提取结果,
其中,T、N以及i为正整数,T≥N,N≥i≥1。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取样本对象的特征信息;
将所述样本对象的特征信息输入初始网络模型中进行处理,获取训练结果,其中,所述初始网络模型包括编码模块以及解码模块,所述编码模块包括循环神经网络,所述解码模块包括具有注意力机制的循环神经网络;
根据所述训练结果以及期望结果,确定模型损失;
根据所述模型损失,调整所述初始网络模型中的参数权重,确定调整后的网络模型;
在所述模型损失满足训练条件的情况下,将调整后的网络模型确定为最终的网络模型。
6.根据权利要求1至5中任意一项所述的方法,其特征在于,所述待提取对象包括视频评论、商品评论、新闻评论中的一种。
7.一种观点提取装置,其特征在于,所述装置通过网络模型实现,所述网络模型包括编码模块以及解码模块,所述装置包括:
特征信息获取单元,用于获取待提取对象的特征信息;
编码信息确定单元,用于将所述特征信息输入所述编码模块中进行处理,确定所述待提取对象的编码信息;
提取结果确定单元,用于将所述编码信息输入所述解码模块中进行处理,确定所述待提取对象的观点提取结果,
其中,所述编码模块包括循环神经网络,所述解码模块包括具有注意力机制的循环神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于优酷网络技术(北京)有限公司,未经优酷网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810205252.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:点击率预估方法、装置、设备及存储介质
- 下一篇:一种自动化搜索的方法