[发明专利]文字中获取表达式的方法和装置有效
申请号: | 201710358003.6 | 申请日: | 2017-05-19 |
公开(公告)号: | CN108959235B | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 林得苗 | 申请(专利权)人: | 北京庖丁科技有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/253;G06N3/08 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 臧静 |
地址: | 100091 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种文字中获取表达式的方法和装置,涉及人工智能领域。该文字中获取表达式的方法包括:在待测文本中提取得到N个待测词语,将待测词语的词向量作为一层运算的节点;将一层运算中第i个节点、一层运算中第1个节点至第i‑1个节点以及运算符集输入至循环神经网络子网络中,得到二层运算的节点;根据二层运算的节点,确定一层运算中的有效运算符;直至经过多层运算,得到M+1层运算的节点,且根据M+1层运算的节点,得到M层运算中的有效运算符的个数为0为止;根据一层运算中的有效运算符至M‑1层运算中的有效运算符,以及与有效节点对应的词语,生成表达式。能够提高文本的核对效率。 | ||
搜索关键词: | 文字 获取 表达式 方法 装置 | ||
【主权项】:
1.一种文字中获取表达式的方法,其特征在于,包括:按照在所述待测文本中的排列顺序,在所述待测文本中提取得到N个待测词语,将所述N个待测词语的词向量作为一层运算的N个节点,所述待测文本包括文字,N为大于1的整数;将所述一层运算中的第i个节点、所述一层运算中的第1个节点至第i‑1个节点以及预设的运算符集输入至循环神经网络的子网络中,得到二层运算的节点,所述二层运算的节点为一层运算中所述子网络输出的隐向量,所述运算符集包括运算符的词向量,i为整数,且1≤i≤N;根据所述二层运算的节点,确定所述一层运算中的有效运算符;直至将M层运算的节点中的第j个节点、所述M层运算的节点中的第1个节点至第j‑1个节点、所述一层运算的节点至所述M‑1层运算的节点以及所述运算符集输入至所述循环神经网络的子网络中,得到M+1层运算的节点,且根据所述M+1层运算的节点,得到所述M层运算中的有效运算符的个数为0为止,所述M+1层运算的节点为所述M层运算中上述子网络输出的隐向量,M和j均为大于1的整数;根据所述一层运算中的有效运算符至所述M‑1层运算中的有效运算符,以及与所述有效节点对应的词语,生成所述待测文本中表达式,所述有效节点为与所述有效运算符对应的节点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京庖丁科技有限公司,未经北京庖丁科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710358003.6/,转载请声明来源钻瓜专利网。