[发明专利]使用神经网络系统识别短文本时效性的方法在审
申请号: | 201911061720.8 | 申请日: | 2019-11-01 |
公开(公告)号: | CN110826315A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 徐英杰;周源 | 申请(专利权)人: | 智者四海(北京)技术有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 谢玲 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 神经网络 系统 识别 文本 时效性 方法 | ||
1.一种用于神经网络系统的训练方法,其特征在于,所述神经网络系统用于确定短文本的时效性并且包括深层网络和浅层网络,所述训练方法包括:
从短文本中获取训练集,所述训练集包括:短文本的文本特征、与所述短文本关联的时效性特征以及所述短文本所属的话题特征;
将所述短文本的文本特征、与所述短文本关联的时效性特征输入至深层网络训练深层网络的参数,将短文本所属的话题特征输入至浅层网络训练浅层网络的参数;以及
当验证集中的损失值和调和均值满足设定条件时,停止训练,确定所述深层网络的参数和所述浅层网络的参数。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取M个短文本;以及
通过关键词替换将所述M个短文本扩展至N个短文本;所述N>M,且M和N为正整数。
3.根据权利要求1所述的方法,其特征在于,所述短文本包括第一问题文本,所述方法还包括:
判断所述第一问题文本中的词语是否存在于时效性相关的词语列表中;以及
若存在,则在所述词语的位置处插入至少一个所述词语,得到第二问题文本;
所述从短文本中获取训练集,包括:
对所述第二问题文本进行分词,得到所述第二问题文本的文本特征和时效性特征。
4.根据权利要求1所述的方法,其特征在于,所述短文本所属的话题特征是由问题发布者所标记的特征。
5.一种神经网络系统,所述神经网络系统由计算机实现,其特征在于,包括:
特征构建层,用于获取短文本的文本特征、与所述短文本关联的时效性特征以及所述短文本所属的话题特征;
学习层,所述学习层包括深层网络和浅层网络,所述深层网络用于接收所述短文本的文本特征、与所述短文本关联的时效性特征和用于产生深层特征,所述浅层网络用于接收所述短文本所属的话题特征和用于产生浅层特征;以及
分类层,用于根据所述深层特征和所述浅层特征得到各类时效性的概率。
6.根据权利要求5所述的神经网络系统,其特征在于,所述深层网络包括嵌入模型和双层transformer模型,所述浅层网络包括独热编码和线性模型。
7.一种使用神经网络系统识别短文本时效性的方法,其特征在于,所述神经网络系统包括深层网络和浅层网络,所述方法包括:
获取待识别短文本的文本特征、与所述待识别短文本关联的时效性特征以及所述待识别短文本所属的话题特征;
将所述待识别短文本的文本特征、与所述待识别短文本关联的时效性特征输入至所述深层网络,将所述待识别短文本所属的话题特征输入至所述浅层网络;以及
输出所述待识别文本对应的各时效类型的概率。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
根据业务的需求设置阈值条件,将满足所述阈值条件的概率对应的时效性识别为短文本的时效性分类结果,所述时效性的类型包括长时效、短时效以及无时效。
9.一种电子设备,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4或7-8任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有可执行指令,该指令被处理器执行时使处理器执行如权利要求1-4或7-8任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智者四海(北京)技术有限公司,未经智者四海(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911061720.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:乳腺影像配准方法和装置
- 下一篇:一种可视化髋臼假体置入装置