[发明专利]基于语音的问答系统和用于交互式语音系统的方法在审
申请号: | 201310390944.X | 申请日: | 2013-09-02 |
公开(公告)号: | CN104424290A | 公开(公告)日: | 2015-03-18 |
发明(设计)人: | 左祥;金浩 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L15/32 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 程连贞 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 问答 系统 用于 交互式 方法 | ||
1.一种基于语音的问答系统,包括:
问答数据存储单元,在该问答数据存储单元中相关联地存储问题以及对应于所述问题的答案;
语音识别单元,通过使用语言模型对于用户说出的问题进行语音识别;
语义相似度计算单元,根据语音识别单元对于用户说出的问题的识别结果,计算用户说出的问题与所述问答数据存储单元中存储的每个问题之间的语义相似度,其中,所述语义相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题所表达的意思上的相似程度;以及
分类单元,基于所述语义相似度计算单元所计算出的所述语义相似度,将用户说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
2.根据权利要求1的问答系统,还包括:
置信度计算单元,基于语音识别单元输出的有关用户所说出的问题的识别结果,为用户所说出的问题计算置信度;
其中,所述分类单元还能够基于所述置信度计算单元计算出的置信度,将用户所说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
3.根据权利要求1的问答系统,还包括:
输出单元,如果用户所说出的问题被分类为在存储单元内的问题,则该输出单元能够输出与用户所说出的问题相应的在所述问答数据存储单元中所存储的问题对应的答案。
4.根据权利要求1的问答系统,还包括:
更新单元,如果用户所说出的问题被分类为在存储单元外的问题,则该更新单元基于所述在存储单元外的问题更新所述问答数据存储单元中存储的问题和/或更新所述语言模型。
5.根据权利要求2的问答系统,其中所述置信度是通过将用户所说出的问题经由N元语言模型进行识别而得到的声学得分除以用户所说出的该问题经由音素网络进行识别而得到的声学得分来确定的。
6.根据权利要求1的问答系统,其中,所述语义相似度计算单元包括:
第一词袋产生部件,根据语音识别单元对于用户所说出的问题的识别结果,产生第一词袋,其中所述第一词袋包括该识别结果中所含的词;
第一词选择部件,根据语音识别单元对于用户所说出的问题的识别结果,从所述第一词袋选择其概率大于第一阈值的词,其中所述概率能够由通过N元语言模型得到的声学得分来确定;
第一检索部件,根据所述第一词选择部件所选择的词,从数据源检索文档;
第二词袋产生部件,为所述问答数据存储单元中存储的每个问题产生相应的第二词袋,其中每个第二词袋包括所述问答数据存储单元中所存储的相应的问题所含的词;
第二检索部件,基于每个第二词袋中的词,从数据源检索文档;以及
语义相似度计算部件,基于第一检索部件所检索到的文档和第二检索部件所检索到的文档,计算用户所说出的问题与所述问答数据存储单元中存储的每个问题之间的语义相似度。
7.根据权利要求6的问答系统,其中,所述语义相似度计算单元还包括:
第一过滤部件,根据词性,从所述第一词选择部件自所述第一词袋所选择的词中过滤掉一部分词,和/或根据词性,从所述第二词袋中过滤掉一部分词;
其中,所述第一检索部件针对过滤后的第一词袋进行检索,和/或第二检索部件针对过滤后的第二词袋进行检索。
8.根据权利要求7的问答系统,其中,所述语义相似度计算单元还包括:
领域词添加部件,向过滤后的第一词袋和/或过滤后的第二词袋添加与领域有关的词;
其中,所述第一检索部件针对进行上述添加后的第一词袋进行检索,和/或第二检索部件针对进行上述添加后的第二词袋进行检索。
9.根据权利要求6所述的问答系统,其中,所述语义相似度计算单元基于以下来进行语义相似度的计算:
第一检索部件所检索到的文档和第二检索部件所检索到的文档中的每个词;和/或
第一检索部件所检索到的文档和第二检索部件所检索到的文档之间的重合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310390944.X/1.html,转载请声明来源钻瓜专利网。