[发明专利]一种中文自动应答方法及系统有效
申请号: | 200610145985.2 | 申请日: | 2006-11-30 |
公开(公告)号: | CN101178711A | 公开(公告)日: | 2008-05-14 |
发明(设计)人: | 杨海松 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 刘岩 |
地址: | 518044广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 自动 应答 方法 系统 | ||
1.一种中文自动应答方法,其特征在于,包括步骤:
A、确定用户输入的中文语句的类别及关键词序列,从问答语句库中查找与用户输入语句类别相同的关键词序列;
B、将用户输入语句的关键词序列与所述查找到的关键词序列进行匹配,将其中匹配成功的关键词序列对应的应答语句返回给用户。
2.如权利要求1所述的方法,其特征在于,确定用户输入语句的类别及关键词序列的具体步骤为:
对用户输入语句进行中文分词处理,得到词序列;
根据所述词序列中包含的句类特征词确定用户输入语句的类别,将句类特征词及停用词从所述词序列中删除,余下的词序列为用户输入语句的关键词序列。
3.如权利要求1所述的方法,其特征在于,所述步骤B中,若匹配不成功,则向用户返回缺省应答语句。
4.如权利要求1或3所述的方法,其特征在于,所述步骤B具体包括步骤:
B1、提取用户输入语句的关键词序列中的第一个关键词做为匹配依据,将所述查找到的关键词序列全部添加到结果集合中;
B2、将做为匹配依据的关键词与结果集合中各关键词序列的相应位置的内容分别进行匹配,将其中匹配不成功的关键词序列从结果集合中剔除;
B3、判断所述结果集合中是否有剩余的关键词序列,若是,执行步骤B4,否则,随机选择一个与用户输入语句的类别相对应的缺省应答语句返回给用户;
B4、判断用户输入语句的关键词序列中是否存在下一个关键词,若存在,将其做为匹配依据,返回步骤B2,否则,将当前结果集合中的关键词序列对应的应答语句返回给用户。
5.如权利要求4所述的方法,其特征在于,所述步骤B2中,按照做为匹配依据的关键词在用户输入语句的关键词序列中的位置,查找结果集合中各关键词序列在该位置的内容,若该位置的内容为任意词通配符或者与做为匹配依据的关键词相同,则本次匹配成功。
6.如权利要求1所述的方法,其特征在于,所述问答语句库用于存储已定义的问答语句对,所述问答语句对由管理员输入的问题语句的关键词序列、类别及相应的应答语句构成。
7.如权利要求6所述的方法,其特征在于,利用管理员输入的问答语句对更新问答语句库的过程为:
确定所述问答语句对中的问题语句的类别及关键词序列;
查找问答语句库中是否存在与所述问题语句类别相同的关键词序列,若存在,则将所述问答语句对中的应答语句添加到问答语句库中,与查找到的关键词序列关联保存,否则,将所述问题语句的关键词序列、类别与问答语句对中的应答语句关联保存到问答语句库中。
8.如权利要求7所述的方法,其特征在于,确定所述问答语句对中的问题语句的类别及关键词序列的具体过程为:
对管理员输入的问题语句进行中文分词处理,得到词序列;
根据所述词序列中包含的句类特征词确定所述问题语句的类别,将句类特征词及停用词从所述词序列中删除,余下的词序列为所述问题语句的关键词序列。
9.如权利要求7所述的方法,其特征在于,若管理员输入的问题语句中包含有任意词通配符,则该问题语句的关键词序列中包含有任意词通配符。
10.一种中文自动应答系统,其特征在于,包括:
用户语句分析模块,用于确定用户输入的中文语句的类别及关键词序列;
查询模块,用于从问答语句库中查找与用户输入语句类别相同的关键词序列,将用户输入语句的关键词序列与所述查找到的关键词序列进行匹配,将其中匹配成功的关键词序列对应的应答语句返回给用户。
11.如权利要求10所述的系统,其特征在于,所述用户语句分析模块具体包括:
第一分词子模块,用于对用户输入语句进行中文分词处理,得到词序列;
第一句类分析子模块,用于根据所述词序列中包含的句类特征词确定用户输入语句的类别,并将句类特征词及停用词从所述词序列中删除,得到用户输入语句的关键词序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610145985.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种在无线数据广播点播模式下XML文档分割方法
- 下一篇:拥塞状态上报方法