[发明专利]一种基于语音识别的目的地搜索方法及装置在审
申请号: | 201811295008.X | 申请日: | 2018-11-01 |
公开(公告)号: | CN109410935A | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 安栋;伍朗;刘继鹏;魏斌斌;冯智斌 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L21/0216;G06F16/58 |
代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 冯晓平 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音信号 实景图片 语音识别 搜索方法及装置 特征信息 语音特点 文本 结构化 相似度 字段 搜索 抓取 人工智能领域 模型识别 搜索引擎 特征提取 匹配 网页 输出 | ||
本发明实施例提供了一种基于语音识别的目的地搜索方法及装置,本发明涉及人工智能领域,方法包括:获取第一用户的第一语音信号,第一语音信号为第一用户发出的用于指示搜索目的地实景图片的语音信号;对第一语音信号进行特征提取,得到特征信息;根据特征信息识别语音特点,并采用与语音特点相匹配的语音识别模型识别第一语音信号得到目的地文本;根据目的地文本在搜索引擎上抓取多个实景图片及所在网页的结构化字段;提取结构化字段中的关键词,并计算关键词与目的地文本的相似度值;将相似度值最大的关键词所对应的实景图片作为目的地实景图片并输出至第一用户。本发明实施例提供的技术方案能够解决现有技术中目的地搜索的准确性低的问题。
【技术领域】
本发明涉及人工智能领域,尤其涉及一种基于语音识别的目的地搜索方法及装置。
【背景技术】
在用户需要搜索某些图片时,需要在搜索引擎中输入文字信息,然后搜索引擎展示对应的图片。例如,用户在搜索引擎中输入“西湖”这两个字,搜索引擎展示西湖的图片。但是在开车时,用户想要获取目的地的图片是很不方便的,甚至会影响用户安全驾驶。目前,用户难以在搜索目的地时直观地了解目的地的所处环境的实景情况,仅通过文字确认目的地容易出现目的地搜索的准确性低的问题。
【发明内容】
有鉴于此,本发明实施例提供了一种基于语音识别的目的地搜索方法及装置,用以解决现有技术中目的地搜索的准确性低的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种基于语音识别的目的地搜索方法,所述方法包括:
获取第一用户的第一语音信号,所述第一语音信号为所述第一用户发出的用于指示搜索目的地实景图片的语音信号;对所述第一语音信号进行特征提取,得到特征信息;根据所述特征信息识别语音特点,并采用与所述语音特点相匹配的语音识别模型识别所述第一语音信号,得到目的地文本;根据所述目的地文本在搜索引擎上抓取多个实景图片及多个实景图片所在网页的结构化字段;提取所述结构化字段中的关键词,并计算所述关键词与所述目的地文本的相似度值;将所述相似度值最大的关键词所对应的实景图片作为所述目的地实景图片,并输出所述目的地实景图片至所述第一用户。
进一步地,在所述获取第一用户的第一语音信号之后,并且在对所述第一语音信号进行特征提取,得到特征信息之前,所述方法还包括:
获取多个带噪语音信号样本及多个干净语音信号样本;构建并训练降噪模型,其中,所述降噪模型包括一个生成器及一个判别器,所述生成器接收所述带噪语音信号样本,并根据所述带噪语音信号样本生成新的语音信号,所述判别器鉴别所述生成器生成的所述新的语音信号是真实信号还是生成的信号;通过所述判别器与所述生成器的对抗训练,得到训练好的降噪模型;向所述训练好的降噪模型中输入所述第一语音信号,其中,所述降噪模型对所述第一语音信号进行降噪处理,并生成第二语音信号;获取所述降噪模型输出的所述第二语音信号,以替换所述获取的第一语音信号。
进一步地,在所述获取第一用户的第一语音信号之后,并且在对所述第一语音信号进行特征提取,得到特征信息之前,所述方法还包括:采用最小均方算法对所述第一语音信号进行降噪处理,并获取当前一次迭代对应的均方误差梯度;根据M次迭代对应的均方误差梯度的震荡情况,确定是否已经达到均方误差收敛敏感区,所述M次迭代中包括所述当前一次迭代;根据确定结果,更新下一次迭代时所述最小均方算法所采用的收敛因子;基于所述收敛因子输出降噪后的第一语音信号;用所述降噪后的第一语音信号替换所述获取的第一语音信号。
进一步地,所述提取所述结构化字段中的关键词,并计算所述关键词与所述目的地文本的相似度值,包括:对所述结构化字段进行分词处理;提取分词处理后的结构化字段中的关键词;向预设的词向量表示模型输入提取到的所述关键词及所述目的地文本,并获取所述词向量表示模型输出的每个关键词的向量表示及所述目的地文本的向量表示;采用余弦相似度公式计算所述关键词的向量与所述目的地文本的向量的相似度值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811295008.X/2.html,转载请声明来源钻瓜专利网。