[发明专利]文本时间语义确定方法、装置及电子设备在审
申请号: | 201810025251.3 | 申请日: | 2018-01-11 |
公开(公告)号: | CN108255811A | 公开(公告)日: | 2018-07-06 |
发明(设计)人: | 蒋宏飞;李健铨;晋耀红;杨凯程 | 申请(专利权)人: | 北京神州泰岳软件股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 装置及电子设备 语义确定 语义 时间单位 计算机应用技术 问答系统 语义理解 消歧 智能 | ||
1.一种文本时间语义确定方法,其特征在于,包括:
获取待处理文本;
确定所述文本的时间范围类别;获取所述文本的时间量词;以及,获取所述文本的时间单位;
根据所述时间范围类别、所述时间量词和所述时间单位,确定所述文本的时间语义。
2.根据权利要求1所述的方法,其特征在于,所述确定所述文本的时间范围类别,包括:
通过文本分词技术,获取所述文本包含的词,作为文本词;以及,获取时间范围类别表述词集;
针对所述文本词与所述表述词集内的表述词的两两组合,通过基于词向量的文档相似度算法,获取所述文本词与所述表述词之间的语义相似度;
根据所述语义相似度和预设的选取规则,从所述表述词集内选取一个表述词;
获取与选取的表述词对应的时间范围类别,作为所述文本的时间范围类别。
3.根据权利要求1或2所述的方法,其特征在于,所述获取所述文本包含的时间量词,包括:
通过文本分词算法,获取所述文本包含的词;
通过词性标注算法,获取所述词的词性;
获取所述词性为未知的词,作为第一词;以及获取所述词性为量词的词,作为第二词;
若在所述文本中所述第一词与所述第二词之间包括第三词,则将所述第一词作为第一时间量词;以及,将所述第二词包含的时间量词作为第二时间量词。
4.根据权利要求3所述的方法,其特征在于,所述将所述第二词包含的时间量词作为第二时间量词,包括:
若所述第二词中包含时间单位,则将所述第二词中包含的数词作为所述第二时间量词;
若所述第二词中不包含时间单位,则将所述第二词作为所述第二时间量词。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
将所述时间量词转换为预设表示形式的时间量词;以及,将所述时间单位转换为预设的时间单位;
所述根据所述时间范围类别、所述时间量词和所述时间单位,并确定所述文本的时间语义,包括:
根据所述时间范围类别、所述预设表示形式的时间量词和所述预设的时间单位,确定所述文本的时间语义。
6.一种文本时间语义确定装置,其特征在于,包括:
文本获取单元,用于获取待处理文本;
时间范围类别确定单元,用于确定所述文本的时间范围类别;
时间量词获取单元,用于获取所述文本的时间量词
时间单位获取单元,用于获取所述文本的时间单位;
时间语义确定单元,用于根据所述时间范围类别、所述时间量词和所述时间单位,确定所述文本的时间语义。
7.根据权利要求6所述的装置,其特征在于,所述时间范围类别确定单元包括:
文本词获取子单元,用于通过文本分词技术,获取所述文本包含的词,作为文本词;
表述词集获取子单元,用于获取时间范围类别表述词集;
语义相似度获取子单元,用于针对所述文本词与所述表述词集内的表述词的两两组合,通过基于词向量的文档相似度算法,获取所述文本词与所述表述词之间的语义相似度;
表述词选取子单元,用于根据所述语义相似度和预设的选取规则,从所述表述词集内选取一个表述词;
时间范围类别获取子单元,用于获取与选取的表述词对应的时间范围类别,作为所述文本的时间范围类别。
8.根据权利要求6或7所述的装置,其特征在于,所述时间量词获取单元包括:
文本词获取子单元,用于通过文本分词算法,获取所述文本包含的词;
词性标注子单元,用于通过词性标注算法,获取所述词的词性;
第一词获取子单元,用于获取所述词性为未知的词,作为第一词;
第二词获取子单元,用于获取所述词性为量词的词,作为第二词;
时间量词确定子单元,用于若在所述文本中所述第一词与所述第二词之间包括第三词,则将所述第一词作为第一时间量词;以及,将所述第二词包含的时间量词作为第二时间量词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳软件股份有限公司,未经北京神州泰岳软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810025251.3/1.html,转载请声明来源钻瓜专利网。