[发明专利]语句所记述事件的发生时间推定方法、设备及存储介质有效
申请号: | 201710370231.5 | 申请日: | 2017-05-23 |
公开(公告)号: | CN107329948B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 姬晨 | 申请(专利权)人: | 南京风数智能科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/279;G06F40/258 |
代理公司: | 北京华识知识产权代理有限公司 11530 | 代理人: | 乔浩刚 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 记述 事件 发生 时间 推定 方法 设备 存储 介质 | ||
1.一种语句所记述事件的发生时间推定方法,其特征在于,包括:
获取文本中包含时间信息的语句作为时间语句,所述文本为需要推定时间的待推语句所在的文本;所述文本为预先确定的包含主角信息的关键句;
根据所述时间信息对各所述时间语句进行分类,并基于各类别中的时间语句计算属于类别的第一特征向量,所述第一特征向量为各所述类别中时间语句的数字化表征向量;
计算所述文本中需要推定时间的待推语句的第二特征向量,所述第二特征向量为所述待推语句的数字化表征向量;
将所述第二特征向量与各所述第一特征向量进行匹配,并根据匹配结果确定所述待推语句所记述事件的发生时间。
2.如权利要求1所述的语句所记述事件的发生时间推定方法,其特征在于,所述获取文本中包含时间信息的语句作为时间语句包括:
获取包含明确时间信息的第一时间语句;
和/或,
获取包含时间推定信息的第二时间语句。
3.如权利要求2所述的语句所记述事件的发生时间推定方法,其特征在于,所述根据所述时间信息对各所述时间语句进行分类包括:
针对获取到的所述第一时间语句:
根据各所述第一时间语句所包含的明确时间信息对各所述第一时间语句进行分类;
针对获取到的所述第二时间语句:
基于所述文本的发表时间或第二时间语句的前一时间语句对应的时间,根据所述第二时间语句所包含的所述时间推定信息推定所述第二时间语句对应的时间;
根据所述第二时间语句对应的时间,对各所述第二时间语句进行分类。
4.如权利要求1-3任一项所述的语句所记述事件的发生时间推定方法,其特征在于,所述基于各类别中的时间语句计算属于类别的第一特征向量包括:
调用分词器对各所述类别中的所述时间语句进行分词处理;
利用词向量算法计算各所述类别中的词语的词向量;
基于所述词向量计算各所述类别的第一特征向量;
所述计算所述文本中需要推定时间的待推语句的第二特征向量包括:
调用分词器对所述待推语句进行分词处理;
利用词向量算法计算所述待推语句中的词语的词向量;
基于所述词向量计算所述待推语句的第二特征向量。
5.如权利要求4所述的语句所记述事件的发生时间推定方法,其特征在于,所述调用分词器对各所述类别中的所述时间语句进行分词处理之后还包括:
利用关键词抽取算法抽取进行分词处理的各词语中的关键词以及各所述关键词的权重;
利用词向量算法计算所述关键词的词向量;
根据各所述关键词的词向量和权重计算各所述类别的第一特征向量;
所述调用分词器对所述待推语句进行分词处理之后还包括:
利用关键词抽取算法抽取所述进行分词处理的各词语中的关键词以及各所述关键词的权重;
利用词向量算法计算所述关键词的词向量;
根据各所述关键词的词向量和权重计算所述待推语句的第二特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京风数智能科技有限公司,未经南京风数智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710370231.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:燃气轮机发电机组的鲁棒自适应控制器
- 下一篇:一种语义匹配方法和系统