[发明专利]一种从文本中提取农历时间的方法及装置在审
申请号: | 201410270720.X | 申请日: | 2014-06-17 |
公开(公告)号: | CN105183704A | 公开(公告)日: | 2015-12-23 |
发明(设计)人: | 傅尚斌 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/30 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李睿;姚开丽 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 提取 农历 时间 方法 装置 | ||
技术领域
本发明涉及终端领域中的数据处理技术,尤其涉及一种从文本中提取农历时间的方法及装置。
背景技术
在自然语言的发展历程中,人们走过一条从规则到统计的认识过程。在特定场景下,利用统计的方式,可以归纳出描述时间的种种方式,比如:描述具体日期的有XXXX年XX月XX日、几月几号;描述星期的有星期三、下周一等等。
在描述时间的过程中,农历与阳历存在一定的区别,例如:在描述日期时,从一号到十号,农历的表达方式是在数字前面加上“初”字,所以当出现几月初几的时候即可确定是用农历描述的;从十一号开始,农历与阳历的描述方式又是相同的,这需要用户根据生活环境及表达习惯等其他知识来判别。
目前,随着科学技术的发展,手机、平板电脑等便携式智能终端设备的普及率越来越高,短信、email等通讯软件在人们日常生活中发挥的作用也越来越大。在实际应用中,将会议及日常事务的行程安排等通过短信、email等方式传递给终端设备,在终端设备接收到信息后,若能自动地提取信息中与日程相关的农历时间信息,将更加方便人们的生活。
发明内容
有鉴于此,本发明实施例期望提供一种从文本中提取农历时间的方法及装置,能够自动地将农历时间从文本中提取出来,方便用户进行日程管理。
为达到上述目的,本发明的技术方案是这样实现的:
本发明实施例提供一种从文本中提取农历时间的方法,所述方法包括:
根据农历时间的模型文件,提取文本中的农历时间成分;将所述农历时间成分转换成农历时间值。
较佳的,该方法还包括:生成农历时间的模型文件,具体为:统计农历时间的表达规则;根据所述规则生成农历时间的正则表达式;将所述正则表达式封装成农历时间的模型文件。
较佳的,所述生成农历时间的正则表达式,包括:将表示农历时间的确切时间设置于表示农历时间的相对时间之前。
较佳的,所述根据农历时间的模型文件,提取文本中的农历时间成分,包括:将文本中的内容与所述模型文件中的正则表达式进行遍历匹配;对匹配得到的农历时间成分进行提取。
较佳的,所述方法还包括:构建时间对象;所述将农历时间成分转换成农历时间值,包括:将所述提取的农历时间成分赋给所述时间对象的控制字段,获取农历时间值;所述时间对象的控制字段,依次包括:年、月、日、时、分、秒。
较佳的,所述方法还包括:当所述农历时间成分中含有相对时间时,对获取的农历时间值进行相对时间计算。
本发明实施例还提供一种从文本中提取农历时间的装置,所述装置包括:提取模块、以及转换模块;其中,所述提取模块,用于根据农历时间的模型文件,提取文本中的农历时间成分;所述转换模块,用于将所述农历时间成分转换成农历时间值。
较佳的,所述装置还包括生成模块,所述生成模块,用于生成农历时间的模型文件,具体为:统计农历时间的表达规则,根据所述规则生成农历时间的正则表达式,将所述正则表达式封装成农历时间的模型文件。
较佳的,所述生成模块,具体用于将表示农历时间的确切时间设置于表示农历时间的相对时间之前。
较佳的,所述提取模块,具体用于将文本中的内容与所述模型文件中的正则表达式进行遍历匹配;对匹配得到的农历时间成分进行提取。
较佳的,所述装置还包括构建模块,所述构建模块,用于构建时间对象;所述转换模块,具体用于将所述提取的农历时间成分赋给所述时间对象的控制字段,获取农历时间值。
较佳的,所述转换模块,还用于当所述农历时间成分中含有相对时间时,对获取的农历时间值进行相对时间计算。
本发明实施例提供的从文本中提取农历时间的方法及装置,根据农历时间的模型文件,提取文本中的农历时间成分;将所述农历时间成分转换成农历时间值;如此,能够基于农历时间的模型文件,自动地从文本中提取农历时间成分,并将所提取的农历时间成分转换成具体的农历时间值,这样,实现了农历时间的自动提取和转换,能够有效地方便用户对生活及工作进行日程管理。
附图说明
图1为本发明实施例从文本中提取农历时间的方法实现流程示意图;
图2为本发明实施例生成农历时间的模型文件的实现流程示意图;
图3为本发明实施例提取及转换农历时间成分的实现流程示意图;
图4为本发明实施例从文本中提取农历时间的装置组成结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410270720.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:寻找相近语义汉字对的方法和装置
- 下一篇:一种无数据引脚系统