[发明专利]一种自动问答系统及方法有效
申请号: | 200610090738.7 | 申请日: | 2006-06-28 |
公开(公告)号: | CN101097573A | 公开(公告)日: | 2008-01-02 |
发明(设计)人: | 杨海松 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/00 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 沈泳;逯长明 |
地址: | 518044广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 问答 系统 方法 | ||
1.一种自动问答系统,包括接口单元、分词单元、推理单元、语言知识库、推理知识库,其特征在于,还包括:
关键词归一化表,用于存储同义词的分组,并在每一组同义词中确定一个关键词,作为该组同义词的归一化词;
归一化单元,用于接收所述分词单元输出的对用户输入问句分词后产生的关键词序列,并根据所获得的关键词,查询所述关键词归一化表,获得该关键词序列的每一个关键词的归一化词,从而获得对应于所述用户输入问句的归一化词序列,并将该归一化词序列输出到所述推理单元;
所述推理单元根据该归一化词序列查询所述推理知识库,找到与该归一化词序列具有相同关键词序列的设定问句与所述用户输入问句匹配,并查询该设定问句对应的答句,将该答句作为系统应答通过所述接口单元输出。
2.根据权利要求1所述的自动问答系统,其特征在于,还包括推理知识库生成子系统,该子系统包括:
设定问句分词单元,用于接收知识库管理员输入的设定问句,并根据所述语言知识库存储的关键词信息对该问句进行分词,获得对应所述设定问句的关键词序列;
更新单元,用于接收所述设定问句的关键词序列,以及管理员输入的对所述设定问句的答句,将两者的内容以及对应关系存储到所述推理知识库供所述推理单元查询。
3.根据权利要求2所述的自动问答系统,其特征在于,所述推理知识库生成子系统,还包括:
设定问句归一化单元,用于接收所述设定问句分词单元输出的关键词序列,并查询所述关键词归一化表,获得对应于该关键词序列的每一个关键词的归一化词,形成归一化的关键词序列;
所述更新单元接收的所述设定问句的关键词序列是所述归一化的关键词序列。
4.根据权利要求3所述的自动问答系统,其特征在于,所述设定问句归一化单元使用与所述归一化单元相同的关键词归一化表。
5.根据权利要求1所述的自动问答系统,其特征在于,所述推理知识库用于存储问答语句对,每一个问答语句对包括设定问句和对应的答句;并且所述设定问句采用关键词序列形式存储,所述的关键词中可以包含任意词通配符。
6.根据权利要求5所述的自动问答系统,其特征在于,所述推理单元获得的与用户输入问句的关键词序列完全相同的设定问句,包括在若干位置上为任意词通配符,而其他对应位置的关键词完全相同的设定问句。
7.一种自动问答的方法,应用于具有语言知识库、推理知识库、以及关键词归一化表的系统,其特征在于,接收用户输入问句后进行下述处理:
71)对用户输入问句进行分词,获得关键词序列;
72)对所述关键词序列进行归一化处理;
73)以归一化处理后的关键词序列作为依据,查询与该归一化的关键词序列具有完全相同的关键词序列的设定问句;所述完全相同,包括关键词相同和关键词所处于的位置相同;
74)根据所获得的设定问句查找与该设定问句对应的答句;
75)将所述答句作为对所述用户输入问句的系统应答输出。
8.根据权利要求7所述的自动问答的方法,其特征在于,所述步骤72)的归一化处理根据关键词归一化表进行。
9.根据权利要求7所述的自动问答的方法,其特征在于,所述步骤73)的查询过程,具体是按照使用归一化的关键词序列,在所述推理知识库中查找与该关键词序列头一个关键词具有相同关键词的设定问句,将获得的所有问句作为当前结果集合;对下一个关键词的查找以所述当前结果集合为检索范围,进行与上述步骤同样的查找,直到所述关键词序列的所有关键词查找完毕。
10.根据权利要求9所述的自动问答的方法,其特征在于,所述相同关键词,可以为任意词通配符。
11.根据权利要求9所述的自动问答的方法,其特征在于,所述步骤73)获得的与该归一化的关键词序列具有完全相同的关键词序列的设定问句可以为多个设定问句的结果集合;此时,所述步骤74)随机选取将该结果集合中某一个设定问句对应的答句作为系统应答。
12.根据权利要求7所述的自动问答的方法,其特征在于,若所述步骤73)无法获得与用户输入问句的归一化的关键词序列具有完全相同的关键词序列的设定问句,则选择一个缺省答句作为系统应答,不进行步骤74)、步骤75)。
13.一种更新自动问答系统的推理知识库的方法,其特征在于,接收知识库管理员输入的问答语句对后,进行如下处理:
131)对设定问答语句对的设定问句进行分词,获得对应于该设定问句的关键词序列;
132)将上一步骤所获得的关键词序列进行归一化处理;
133)将归一化处理后的所述设定问句的关键词序列,以及对应于该设定问句的答句加入推理知识库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610090738.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:刺血针装置
- 下一篇:用于确定等离子体特性的方法