[发明专利]活动通知文本识别并自动转换为日历项的方法无效
申请号: | 201110344694.7 | 申请日: | 2011-11-04 |
公开(公告)号: | CN103093334A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 周超然;杜婷;肖颖华;刁媛;鲁文宇;曾庆鼎 | 申请(专利权)人: | 周超然;杜婷;肖颖华;刁媛;鲁文宇;曾庆鼎 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 611130 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 活动 通知 文本 识别 自动 转换 日历 方法 | ||
技术领域
本发明属于计算机自然语言处理领域,具体涉及一种识别活动通知并自动将活动通知转换为日历项的方法。
背景技术
现代信息技术的发达,造就了信息的高效广泛传播,足不出户就可知天下事。然而,正是随着信息技术的不断改革升级,信息流变得无比的庞大,给信息使用者寻求有用的信息带来了困难。这一问题已经不单单成为个人生活中的障碍,更成为社会企业提高生产效率所不得不面临的重要问题。传统的处理方式包括滤除冗余信息和抽取主要信息。对于信息的滤除,需要分析具体的社会经济环境,这依赖于庞大的工作量。但是,抽取信息的主要内容就仅仅是对文本进行解析,相对而言,工作量有了大幅的减少。通常情况下,对一个活动通知文本信息而言,其最主要的要素为主题、时间、地点等。而事实上,经过考察发现时间格式具有相对固定的形式和较少的变化。因此,从文本中对时间进行提取是一个切实可行的设想。而且,在活动通知文本当中,文本的主题也有着固定的格式约束,这也为主题的提取提供了可能性。最后,对于活动通知文本中出现的地点,基于前述方法,也能够做到有效的提取。这样一来,就极大的简化了活动通知文本信息的呈现形式,为人们的生活带米了便利。
发明内容
本发明的目的在于填补现阶段对于自动提取活动通知生成日程方面的技术空白,从而能够达到自动提取文本中的日程信息并自动生成日历项的效果。
本发明所述的方法主要解决的首要技术问题是要从内容纷繁复杂的文本信息中提取出用户可能需要的日程信息。在获取包含日程内容的文本信息后,本发明立即对文本内容进行分析与挖掘,分别找出包含主题、时间、地点等要素的字段,再对其(特别是时间)进行相应的处理,提取出日历项中需要记录的内容,最后按iCalender的标准化格式生成能够兼容Google日历等多种日程安排软件的ics文件,由此达到方便用户记录日程并管理日程的目的。
本发明启用后,当用户选定了包含日程信息的相关文本后,本发明可以自动提取关于日程的主题、时间、地点等关键信息,然后生成日程项并存入谷歌日历中。
本发明的主要使用步骤如下:
●当用户需要将某文本信息中的相关内容记录下来并生成日历项时,只需选中想要生成日历项的活动通知文本,启动使用了本发明所述方法的软件,所选的文本内容就将会作为源文本进行处理。
●在获得源文本后,本发明开始对其内容进行处理,提取时间、地点、主题三种语素。对于时间语素,根据被提取的时间语素的具体表达形式对其进行标准化,作为日历项的时间参数;对于地点和主题语素则直接作为日历项中对应的地点和主题信息填入。生成完整的日历项信息后,通过软件的用户界面显示。
●用户可以通过用户界面对提取出的日历项内容进行个性化的更改,确认内容准确无误后,可以点击保存,本发明则可根据最终确认的日历项信息生成日历项源文件,存入本地,或者根据用户设置的账户信息将日历项直接发布到用户的网络日历中,以实现日历的集中管理。
本发明相对于现有的技术具有如下优点:21世纪的人们,不仅要面对生活中海量的各类信息,还要面对繁忙的日常活动。而日程安排于是成为了人们生活中的重要一环,而现有的日程安排软件均需要用户手动输入日程信息,而本发明可以通过对文本的分析自动生成日历项,同时又可供用户根据自身需要手工调整,大大提升了用户日程管理的效率。
同时本发明生成的日历项采用国际通用的iCalendar日历存储标准,为谷歌日历等多种日历管理应用所兼容,用户通过本发明自动生成的日历项可以保存到这些日历管理应用中,大大扩展了其日历管理的功能。
附图说明
图1:本发明所述的文本中时间要素提取处理程序框图
图2:本发明所述的时间标准化处理程序框图
图3:本发明所述的开始时间和结束时间处理程序框图
图4:本发明所述的文本中地点要素提取处理程序框图
图5:本发明所述的文本中主题要素提取处理程序框图
具体实施方法
该方法可通过软件在手机和个人电脑上实现中文文本中时间、地点、主题的提取。以及对时间日期格式的统一化,并实现地点学习入库的功能。
时间提取与处理
这一部分主要针对中文句段进行自动时间提取,并将原文中时间格式统一转换为标准格式:“XXXX年XX月XX日(星期X)XX:XX”。针对会议、活动等通知文本进行时间提取和转换,存在一个对模糊时间的处理(如:明天下午5点,下周三等)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于周超然;杜婷;肖颖华;刁媛;鲁文宇;曾庆鼎,未经周超然;杜婷;肖颖华;刁媛;鲁文宇;曾庆鼎许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110344694.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理