[发明专利]一种语义分析方法在审
申请号: | 201710568057.5 | 申请日: | 2017-07-12 |
公开(公告)号: | CN107315739A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 胡淦;周银行;杨东;董振江;陶苗苗;陈焕;郑中华 | 申请(专利权)人: | 安徽博约信息科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京轻创知识产权代理有限公司11212 | 代理人: | 沈尚林 |
地址: | 230000 安徽省合肥市高新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 分析 方法 | ||
技术领域
本发明涉及网络技术领域,尤其涉及一种语义分析方法。
背景技术
随着网络的兴起,网络活动已经深入人们日常的生活,用户常常会通过关键字词来搜索自己想要的信息,如用户在搜索引擎上输入关键字词,然后搜索引擎通过关键字的匹配算法等来检索诸如链接、视频和图片之类的信息。然而,由于自然语言在各个层次上广泛存在了各种各样的歧义性或多义性,除了词的本意之外,很可能包含了某些其他隐含的语义,仅仅通过关键字匹配的方法,很难为用户提供精准的搜索信息,甚至会得出毫无相关的结果。
为了加强匹配的相关性,提高搜索的准确性,近年来出现了很多种语义分析方法,其检索的结果更加接近于自然语言的本意。现有的这些方式基本都是在进行大样本数量的统计分析中找出各种词之间的相关性,也有部分采用基于语义知识库的分析方法。
但是现有的这些语义分析方法普遍存在着以下问题:
1、当要分析的隐含语义很多时,对单进程的内存要求较高,训练效率低。
2、语义知识库需要人工编写,耗时耗力,并且对文本中含有的冗余和噪音容错性不强,重用性差。
3、当在语义知识库中查询不到某个数据集的相关信息时,需要手动的去录入该数据集的相关信息,智能性不足,为使用中带来了很多不便。
发明内容
本发明要解决的技术问题是提供一种语义分析方法。
为了解决上述技术问题,本发明采用的技术方案是,一种语义分析方法,包括以下步骤:
(1)接收用户输入的数据;
(2)确定数据的任务类型;
(3)确定数据的语义解析方式;
(4)解析数据,确定语义分析结果。
作为优选,设置语义模板库,所述语义模板库包括基础模板库和网络模板库。
所述基础模板库存储有以前积累并经固定的语义模板,该模板库包括数据的任务类型和其配置的解析方式。
作为进一步优选,所述网络模板库,是在基础模板库中不存在相应信息的时候,自动的从搜索引擎中抽取得到最优语义解析方式的模板库。
作为优选,步骤(2)确定数据的任务类型是对用户输入的数据在语义模板库中的基础模板库中进行分解、匹配,从而寻找到相同或相近的任务类型进行定型。
作为优选,步骤(3)确定数据的语义解析方式,是先根据当前确定的数据任务类型确定语义分析的初步解析方式集;然后采用异步并发机制对初步解析方式集中的每个解析方式进行解析,若其中有一条解析成功,则终止此次解析;若解析不到相关信息,则表明基础模板库中不存在与当前数据相关的信息,则自动将该条数据转到网络模板库中进行解析,若解析不到相关信息,则自动更新网络模板库。
若从基础模板库或网络模板库中解析成功所获取的解析方式,该解析方式即为用户输入数据的语义解析方式。
作为优选,步骤(4)解析数据,确定语义分析结果,是根据获得的解析方式解析当前用户输入的数据,确定该数据的语义分析结果。
作为进一步优选,分解是按照语义模板库中的规则自动分解成模板识别的符号;匹配是对分解后的数据集进行任务类型符号匹配;定型是经过匹配后确定的匹配任务类型,且匹配任务类型有一个或多个,具体通过预设的配置进行设定。
作为进一步优选,初步解析方式集是指由多个语义解析方式组成的集合;异步并发机制是对每个解析方式同时解析。
本发明的有益效果是:
在语义模板库的基础模板库中进行异步并发的语义分析,取得快速高效的数据分析结果,当基础模板库中不存在当前数据的语义分析方式时,自动将该条数据转到网络模板库中进行解析,若解析不到相关信息,转而自动、智能地从搜索引擎中抽取相应解析方式进行解析,从而可以达到提高搜索的智能和准确性。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1是本发明语义分析方法实施例的总流程图。
图2是本发明语义分析方法实施例的确认数据类型流程图。
图3是本发明语义分析方法实施例的确定数据解析方式流程图。
图4是本发明语义分析方法实施例的网络模板库的自动更新流程图。
具体实施方式
图1是本发明提出的一种语义分析方法总流程图,包括以下步骤:
步骤S101,接收用户输入的数据;
其中,用户输入的数据为自然语言信息中的文本信息,是用户通过电子设备上安装的输入法软件输入的文本信息。
步骤S102,确定数据的任务类型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽博约信息科技股份有限公司,未经安徽博约信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710568057.5/2.html,转载请声明来源钻瓜专利网。