[发明专利]文本时间语义确定方法、装置及电子设备在审
申请号: | 201810025251.3 | 申请日: | 2018-01-11 |
公开(公告)号: | CN108255811A | 公开(公告)日: | 2018-07-06 |
发明(设计)人: | 蒋宏飞;李健铨;晋耀红;杨凯程 | 申请(专利权)人: | 北京神州泰岳软件股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 装置及电子设备 语义确定 语义 时间单位 计算机应用技术 问答系统 语义理解 消歧 智能 | ||
本发明实施例提供一种文本时间语义确定方法、装置及电子设备,一种文本量词确定方法、装置及电子设备,涉及计算机应用技术领域。其中,文本时间语义确定方法包括:获取待处理文本;确定所述文本的时间范围类别;获取所述文本的时间量词;以及,获取所述文本的时间单位;根据所述时间范围类别、所述时间量词和所述时间单位,确定所述文本的时间语义。本发明实施例提供的技术方案,不仅可以解决智能问答系统中时间语义理解和消歧的问题,还可以有效提高文本时间语义的准确性。
技术领域
本申请涉及自然语言处理技术领域,具体涉及一种文本时间语义确定方法、装置及电子设备,以及一种文本量词确定方法、装置及电子设备。
背景技术
聊天机器人是在大数据及人工智能技术驱动下产生的一个热门应用,要求根据用户输入的聊天内容,自动生成相应的回复。目前市场上有各种类型的聊天机器人,比如客服机器人、儿童教育机器人、车载控制机器人等。聊天机器人
在聊天机器人智能问答系统中,经常会出现关于时间交互问题。时间推理是面向时间问题的研究领域,在人工智能(如语义Web、机器人导航、自然语言处理)和其他领域有着广泛的应用前景。在智能问答系统中时间推理有着广泛的应用,在问题的匹配、以及答案消歧上依赖着时间语义理解和消歧技术。
目前,智能问答系统中用以解决时间语义理解和消歧的问题所采用的方法主要是传统的自然语言处理算法,例如,标签匹配算法,基于深度学习词向量匹配的算法,以及卷积神经网络CNN、循环神经网络LSTM等神经网络的算法等。然而,完全利用传统的自然语言处理算法,使得在识别数字、量词单位、区分数字大小等方面显得乏力,无法做到较准确的理解时间。例如,对于类似“三年以上”,“两年以上”、“两年以下”,“四到五年”等时间表达方式,现有智能问答系统并没有一个很好的解决办法。
综上所述,用于确定文本时间语义的现有技术存在时间语义理解准确度较低的问题。
发明内容
本发明实施例提供一种文本时间语义确定方法、装置及电子设备,用以解决现有技术存在时间语义理解准确度较低的问题。此外,本发明实施例提供一种文本量词确定方法、装置及电子设备。
第一方面,本发明实施例中提供了一种文本主题确定方法,包括:获取待处理文本;确定所述文本的时间范围类别;获取所述文本的时间量词;以及,获取所述文本的时间单位;根据所述时间范围类别、所述时间量词和所述时间单位,确定所述文本的时间语义。
结合第一方面,本发明在第一方面的第一种实现方式中,所述确定所述文本的时间范围类别,包括:通过文本分词技术,获取所述文本包含的词,作为文本词;以及,获取时间范围类别表述词集;针对所述文本词与所述表述词集内的表述词的两两组合,通过基于词向量的文档相似度算法,获取所述文本词与所述表述词之间的语义相似度;根据所述语义相似度和预设的选取规则,从所述表述词集内选取一个表述词;获取与选取的表述词对应的时间范围类别,作为所述文本的时间范围类别。
结合第一方面或第一方面的第一种实现方式,本发明在第一方面的第二种实现方式中,所述获取所述文本包含的时间量词,包括:通过文本分词算法,获取所述文本包含的词;通过词性标注算法,获取所述词的词性;获取所述词性为未知的词,作为第一词;及获取所述词性为量词的词,作为第二词;若在所述文本中所述第一词与所述第二词之间包括第三词,则将所述第一词作为第一时间量词;以及,将所述第二词包含的时间量词作为第二时间量词。
结合第一方面的第二种实现方式,本发明在第一方面的第三种实现方式中,所述将所述第二词包含的时间量词作为第二时间量词,包括:若所述第二词中包含时间单位,则将所述第二词中包含的数词作为所述第二时间量词;若所述第二词中不包含时间单位,则将所述第二词作为所述第二时间量词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳软件股份有限公司,未经北京神州泰岳软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810025251.3/2.html,转载请声明来源钻瓜专利网。