[发明专利]网站校对信息的建立方法及装置在审
申请号: | 201510719773.X | 申请日: | 2015-10-29 |
公开(公告)号: | CN106649324A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 冯鸳鹤 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙)11348 | 代理人: | 王伟锋,刘铁生 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网站 校对 信息 建立 方法 装置 | ||
技术领域
本发明涉及互联网技术领域,特别是涉及一种网站校对信息的建立方法及装置。
背景技术
网站错别字,顾名思义是指网站所有内容网页出现的错字和别字。网站错别字的出现,原因是多方面的,其不良的影响或者危害也是不容忽视的。特别是政府网站,随着一些政策性文件的出台,错别字识别已作为政府网站硬性的考核指标项。
政府网站错别字识别的主要任务在于人物和职称不对称信息的查找,例如:某某人的职称为副主任,若政府网站上展示成某某人为正主任,这种错误在政府行业是及其严重的错误,特别是对某人职称的降低更是不允许出现的;而确定人物与职称之间的关系是政府网站错别字识别的前提。目前,在确定人物与职称之间的关系时,通常是人工从各种网站内收集人物与职称关系;但是,由于人物与职称的信息发布渠道不统一,即人物与职称关系分散在各种网页中,需要人工在互联网上随机查找人物与职称关系,导致确定的人物与职称关系不全面、不准确。
发明内容
有鉴于此,本发明提供的一种网站校对信息的建立方法及装置,主要目的在于解决由于人物与职称的信息发布渠道不统一,需要人工在互联网上随机查找人物与职称关系,导致确定的人物与职称关系不全面、不准确的问题。
为了解决上述问题,本发明主要提供如下技术方案:
一方面,本发明提供了一种网站校对信息的建立方法,该方法包括:
获取预设网站内的内容页面中的页面内容;
将所述页面内容拆分为句子,并对每个句子进行分词;
从所述分词中确定人物与职称关系;
将所述人物与职称关系保存到人物职称库,所述人物职称库用于存储所述人物与职称关系。
另一方面,本发明还提供一种网站校对信息的建立装置,该装置包括:
获取单元,用于获取预设网站内的内容页面中的页面内容;
拆分单元,用于将所述获取单元获取的所述页面内容拆分为句子;
分词单元,用于对所述拆分单元拆分的每个句子进行分词;
确定单元,用于从所述分词单元的所述分词中确定人物与职称关系;
保存单元,用于将所述确定单元确定的所述人物与职称关系保存到人物职称库,所述人物职称库用于存储所述人物与职称关系。
借由上述技术方案,本发明提供的技术方案至少具有下列优点:
本发明提供的网站校对信息的建立方法及装置,获取预设网站内的内容页面中的页面内容,将该些页面内容拆分成句子,并对每个句子进行中文分词,从该分词中确定人物与职称关系,将确定后的人物与职称关系保存到人物职称库中,以该人物职称库中存储的人物职称关系为网站校对信息;与现有技术中人工确定人物与职称关系相比,本发明能够自动的、全面的分析出预设网站中各种页面中存在的人物与职称关系,由于预设网站均具有一定的权威性,因此确保了从预设网站中确定人物与职称关系的准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种网站校对信息的建立方法的流程图;
图2示出了本发明实施例提供的一种确定人物与职称关系的方法的流 程图;
图3示出了本发明实施例提供的一种预设网站的页面示意图;
图4示出了本发明实施例提供的一种网站校对信息的建立装置的组成框图;
图5示出了本发明实施例提供的另一种网站校对信息的建立装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供一种网站校对信息的建立方法,如图1所示,该方法包括:
101、获取预设网站内的内容页面中的页面内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510719773.X/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置