[发明专利]一种智能Web表单自动填充方法及系统有效
申请号: | 201110107333.0 | 申请日: | 2011-04-28 |
公开(公告)号: | CN102184204A | 公开(公告)日: | 2011-09-14 |
发明(设计)人: | 叶施仁;杨长春;廖定安;周建龙;单延平;姚平安;周叶 | 申请(专利权)人: | 常州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 楼高潮 |
地址: | 213164 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 web 表单 自动 填充 方法 系统 | ||
技术领域
本发明涉及一种表单填充方法及系统,特别涉及以前填写过的内容在新表单中不需再次录入的自动填充方法及系统。
背景技术
随着互联网的普及,电子政务、电子商务和各种办公自动化取得了蓬勃的发展,很多用户都需要通过填写大量表单来进行各类事务处理,如填报计划、汇报业务、数据采集等。
表单的内容通常由提示要输入内容的标签和紧随其后需要用户输入的表单域组成。如文本框、复选框、单选框、下拉选择框等。用户把数据输入表单域以后,再提交服务器处理。而这些表单往往包含很多重复的内容,用户需要反复填写自己的单位信息和个人信息等重复内容。例如,求职人员尽管已经有Word文档等形式的简历,但招聘网站填写个人信息时需要进行大量的复制、粘贴等手工操作,来填充姓名,性别,家庭住址,教育经历等数十项内容。用户需要在不同的招聘网站重复同样的工作,费时费力,容易出错。
有一些产品和技术可以减少互联网上填报中重复的工作。例如,Autoformer能收集注册、登录简单表单中用户名、地址、电话等基本信息,用户在下次遇到类似的表单时进行自动填充。其中新表单与历史表单标签相同时,同名标签对应的数据被记忆和重用。当标签不同时,例如,“邮编”和“邮政编码”需要填充相同,这种情况无法自动填充。在基于互联网的实际的事务处理系统中,表单非常普及,并且数据复杂,这些简单的自动填充技术无法解决。
发明内容
本发明的目的是提供一种能自动识别出语义相同的重复部分,解决填写表单中重复内容问题智能Web表单自动填充方法及系统。
本发明的技术方案是:
一种智能Web表单自动填充方法,包括语义库和资源库,该方法包括以下步骤:
1) 提取表单中的标签名,归一化为所述语义库的标准名;
2)根据所述标准名查找所述资源库,选择所述候选值进行填表;
3) 选择所述候选值进行填表。
进一步,所述语义库存储带概率的所述标签名到所述标准名的映射概率。
进一步,所述资源库的建立步骤为:
21)从参考文档或历史表单填充数据中提取“标签名-候选值”对;
22)根据所述语义库将“标签名-候选值”对归一化为“标准名-候选值”对;
23)将所述“标准名-候选值”对存储于所述资源库。
更进一步,所述资源库的建立步骤为:
201)从参考文档或历史表单填充数据中提取“标签名-候选值”对;
202)根据所述语义库将“标签名-候选值”对归一化为“标准名-候选值-可信度”对;
203)将所述“标准名-候选值-可信度”对存储于所述资源库。
进一步,所述步骤202)和步骤203)之间设有步骤204),用于删除可信度小于过滤阈值的“标准名-候选值-可信度”对。
一种智能Web表单自动填充系统,其特征在于,包括:
语义库,用于存储的标签名到标准名的映射集合;
资源库,用于存储“标准名-候选值”对的集合;
归一化模块,用于提取表单中的标签名,归一化为所述语义库的标准名;
检索模块,用于根据所述标准名查找资源库,选取候选值;
填表模块,用于根据选择的所述候选值进行填表。
进一步,所述语义库存储所述标签名到所述标准名的映射概率。
进一步,所述资源库存储“标准名-候选值-可信度”对的集合,设有可信度的过滤阈值。
本发明的有益效果是:通过语义库的映射关系,对表格中的标签名进行归一化处理,并从资源库中选取候选值进行自动填表,通过该系统和方法,使用户的输入最小化,减轻了用户重复输入的负担,增强了用户体验效果。资源库的可信度的设置也使该系统能够学习用户的偏好,使自动填表的结果更符合用户的需求。
附图说明
图1为本发明表单智能自动填充方法示意图;
图2为本发明实施例的实施流程图;
图3为本发明实施案例新表单样图;
图4为本发明实施案例新表单自动填充效果图。
具体实施方式
下面结合附图对本发明的具体实施方式进行详细的说明。
如图1所示,一种智能Web表单自动填充方法,包括语义库和资源库,该方法包括以下步骤:
1) 提取表单中的标签名,归一化为所述语义库的标准名;
2)根据所述标准名查找所述资源库,选择所述候选值进行填表;
3) 选择所述候选值进行填表。
一种智能Web表单自动填充系统,其特征在于,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州大学,未经常州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110107333.0/2.html,转载请声明来源钻瓜专利网。