[发明专利]一种面向中文查询句的三级查询目标分析方法无效
申请号: | 200910172770.3 | 申请日: | 2009-11-27 |
公开(公告)号: | CN101706792A | 公开(公告)日: | 2010-05-12 |
发明(设计)人: | 郑逢斌;毋琳;赖积保;乔保军;葛强 | 申请(专利权)人: | 河南大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 郑州联科专利事务所(普通合伙) 41104 | 代理人: | 刘建芳 |
地址: | 475001 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 中文 查询 三级 目标 分析 方法 | ||
技术领域
本发明涉及查询目标分析方法,特别是一种面向中文查询句的三级查询目标分析方法。
背景技术
在使用中文自然语言查询的系统中,其基本的处理流程是:由用户采用自然语言给出包括查询条件和查询目标的中文查询句,系统对该查询句进行句法、词法、语义的分析和理解,从中识别出相关的查询条件和查询目标,并以此构成对知识库的检索语句,得到正确答案,生成中文回答句反馈给用户,以结束一次查询的过程。在整个流程中,对于查询句的分析,或者说对于查询目标的识别是整个系统正确工作的第一步。若对于查询目标分析错误,将直接导致知识检索和答句生成的错误,也就会直接影响到系统的工作效率和正确性。
一般来说,常用的查询目标分析方法有模板匹配和相似度计算等方法。模板匹配方法在应用时,是将由统计得到的大量常用问句以形式化的方式表示,作为模板,要求用户在进行信息查询时严格按照模板的组织结构来表述查询意图。这种方法的封闭测试正确率很高,但对于用户的使用限制较多,很难达到自然语言查询所希望的无障碍交流,一旦用户查询句的表述形式超出了系统模板的范围,系统则会显得无能为力。因此,在现代的查询工作中,该方法大多作为一种辅助手段来识别查询目标。相似度计算方法,主要是通过对词法分析后的查询句中词语共现概率、特征词使用频度等内容的计算和统计,得到查询句中各部分内容作为查询目标的概率值——即相似度,以此相似度的大小来确定查询目标。这种方法对于用户的输入限制相对较少,但由于中文的灵活多样性,使得根据统计结果计算出的相似度命中查询目标的概率降低,自然语言问答时有时会出现答非所问的情况。
由于技术限制,目前中文自然语言查询的系统大多都以受限语言作为处理对象,采用统计得到的知识库作为查询依据,或者在此基础上加入概率统计。但是由于中文无论从结构形式上,还是表述方式上,或者词语选择上都十分灵活多变,因此采用上述处理方式是无法满足实际查询需求的。例如,在进行信息查询时,查询句的结构形式可以是特指问句、是非问句、正反问句、选择问句,甚至还可以是祈使句,不同的问句形式所包含的查询信息量以及对于查询目标的表示也都会有明显的差别。再如,在某些查询中,其结果值应该是知识库中多个域值的某种关系计算结果,而不单是某一个域值;或者对应于知识库中的同一个域的查询,在查询句的表述中,可以有很多不同类型的词语和概念。这些都会导致中文自然语言查询系统在应对复杂句查询和知识库无冗余时处于两难的境地。而以上这些问题的关键点就在于对于任何一个查询句,系统是否能正确快速地识别出其查询目标,只有找到了查询目标才能够进行查询的后续工作。
综上所述,要提高对中文查询句中查询目标的识别率,单纯地从扩大知识库、规则库的规模和增加概率计算是远远不够的。要突破这种查询限制,必须要有一种新的方法来对查询目标的识别问题进行改进。
发明内容
本发明目的在于提供一种面向中文查询句的三级查询目标分析方法,该方法是基于受限语言的中文查询句的查询目标分析方法,能够理解不同结构形式的用户查询句,用户查询句在表述方式上更为自由。
为了实现上述目的,本发明采用如下技术方案:一种面向中文查询句的三级查询目标分析方法,其特征在于:包括以下步骤:
(1)根据系统语言的受限情况,通过大规模语料分析和统计,建立复合概念和推演规则的知识库;
(2)在句法和词法分析的基础上,对查询句进行语义理解,识别出其中的查询目标,并将该查询目标归类为直接查询目标、逻辑推理目标、比较判断目标;
(3)若识别出比较判断目标,则根据查询句类型、比较元素关系、比较元素值来源以及比较结果类型内容的不同,提取到对应的逻辑推理目标或直接查询目标;若无比较判断目标,则直接进入步骤(4);
(4)若识别出逻辑推理目标,则系统需要经过概念分解或规则推演,转化为相对应的直接查询目标;若无逻辑推理目标,则直接进入步骤(5);
(5)若识别出直接查询目标,系统可以直接进行查询转换,将其转换为数据提取目标,用于检索专业基本知识库获取答案;
(6)根据查询和分析结果,以及查询句中初始查询目标的类型,通过概念合成和推理,产生回答用户目标的值,并以此形成反馈给用户的答句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910172770.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:卷烟包装机涂胶控制装置
- 下一篇:一种卷烟包装机组的小包透明纸包装机