[发明专利]一种带有图像理解的智能语音车载交互系统在审
申请号: | 201611230108.5 | 申请日: | 2016-12-27 |
公开(公告)号: | CN106782558A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 蒋雪峰;蒋顺恺 | 申请(专利权)人: | 重庆峰创科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/30;H04B1/3822;H04L29/08;H04N7/18;G06K9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 402368 重庆市大*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 带有 图像 理解 智能 语音 车载 交互 系统 | ||
1.一种带有图像理解的智能语音车载交互系统,包括带有图像理解的在线智能语音车载交互系统和离线智能语音车载交互系统,其特征在于:所述带有图像理解的在线智能语音车载交互系统,包括车载移动终端、车载无线网关、车联网云平台和互联网,用于整合车辆摄像头拍摄的周边路况图像信息、实时视频监控模块接收的实时采集当前车辆周边道路视频监控图像,以及根据用户对互联网资源信息的诸多需求其进行分析,实现图像的语义理解,将实时综合路况信息和连接互联网的更多更丰富的用户需求响应以智能语音的形式与用户进行交互;所述的离线智能语音车载交互系统,包括离线语音接收模块、车辆OBD接口、离线语音识别引擎、离线语音合成引擎、离线语音播放模块和车载移动终端,用于显示无需联网可完成的用户需求语音交互。
2.根据权利要求1所述的一种带有图像理解的智能语音车载交互系统,其特征在于:所述的车载移动终端用于接收该车辆周边路况图像信息和需要连接车联网云平台才能完成语音识别功能的复杂用户语音数据,并通过车载无线网关发送至车联网云平台,同时通过车载无线网关接收车联网云平台的图像理解引擎实时处理的交通路况信息和根据用户需求获取天气信息、新闻资讯、电子邮件、周边服务等一系列网络资源等其他用户需求响应的语音反馈信息,并与用户进行该功能的智能语音交互,包括车载图像接收模块、在线语音接收模块、车载图像发送模块、在线语音发送模块、语音反馈信息接收模块、在线语音播放模块; 其中,所述的车载图像接收模块,通过车载摄像头拍摄车辆周围路况视频,接收该车辆周边路况图像信息;所述的在线语音接收模块,通过采集用户的语音数据,接收用于需要连接车联网云平台才能完成语音识别功能的复杂用户语音数据;所述的车载图像发送模块,用于接收车载图像接收模块接收的车辆周边路况图像信息,并通过车载无线网关发送至车联网云平台;所述的在线语音发送模块,用于接收在线语音接收模块接收的需要连接车联网云平台才能完成语音识别功能的复杂用户语音数据;所述的语音反馈信息接收模块,通过车载无线网关接收语音反馈信息发送模块发送的语音信号;所述的在线语音播放模块,用于将在线语音合成引擎的合成结果播放给用户。
3.根据权利要求1所述的一种带有图像理解的智能语音车载交互系统,其特征在于:所述的车联网云平台,一方面,通过车载无线网关接收的需要连接车联网云平台才能完成语音识别功能的复杂用户语音数据进行理解、识别,另一方面,利用图像理解引擎将通过车载无线网关接收车载图像发送模块发送的车辆周边路况图像信息和实时视频监控模块实时采集当前车辆周边道路视频监控图像进行分析,实现图像的语义理解,并接收其他用户需求响应模块根据用户需求获取天气信息、新闻资讯、电子邮件、周边服务等一系列网络资源信息合成为语音信号,包括云端车载图像接收模块、云端语音接收模块、在线语音识别引擎、实时视频监控模块、图像理解引擎、其他用户需求响应模块、在线语音合成引擎、语音反馈信息发送模块;其中,所述的云端车载图像接收模块,通过车载无线网关接收车载图像发送模块发送的车辆周边路况图像信息;所述的云端语音接收模块,通过车载无线网关在线语音接收模块接收的需要连接车联网云平台才能完成语音识别功能的复杂用户语音数据;所述的在线语音识别引擎,对云端语音接收模块接收的需要连接车联网云平台才能完成语音识别功能的复杂用户语音数据进行理解、识别;所述的实时视频监控模块,汇集道路视频监控图像,根据车辆GPS定位,实时采集当前车辆周边道路视频监控图像;所述的图像理解引擎,整合云端车载图像接收模块接收的车辆周边路况图像信息和实时视频监控模块接收的实时采集当前车辆周边道路视频监控图像,对其进行分析,实现图像的语义理解;所述的其他用户需求响应模块,根据用户需求获取天气信息、新闻资讯、电子邮件、周边服务等一系列网络资源信息;所述的在线语音合成引擎,将图像理解引擎输出的信息和车联网云平台对用户其他需求的响应,合成为语音信号;所述的语音反馈信息发送模块,用于接收在线语音合成引擎合成为语音信号,并通过车载无线网关发送至语音反馈信息接收模块。
4.根据权利要求1所述的一种带有图像理解的智能语音车载交互系统,其特征在于:所述的车载无线网关,分别与车联网云平台和车载移动终端连接,用于实现车载移动终端和车联网云平台之间的无线通信功能;所述的互联网,与车联网云平台连接,用于获取天气信息、新闻资讯、电子邮件、周边服务等一系列网络资源。
5.根据权利要求1所述的一种带有图像理解的智能语音车载交互系统,其特征在于:所述的离线智能语音车载交互系统,包括离线语音接收模块、车辆OBD接口、离线语音识别引擎、离线语音合成引擎、离线语音播放模块和车载移动终端,用于显示无需联网可完成的用户需求语音交互;其中,所述的离线语音接收模块,通过采集用户的语音数据,接收用于控制汽车车窗、空调、广播等的用户基础语音控制命令;所述的车辆OBD接口,用于输出包括车速、转速、油耗等车况参数信息;所述的离线语音识别引擎,用于对离线语音接收模块接收的用于控制汽车车窗、空调、广播等的用户基础语音控制命令进行理解、识别;所述的离线语音合成引擎,用于将车辆OBD接口输出的车况参数信息和执行离线语音控制命令后汽车对用户的需求响应,合成为语音信号;所述的离线语音播放模块,用于将离线语音合成引擎的合成结果播放给用户;所述的车载移动终端,根据OBD协议与车辆OBD接口通信,并在在本地离线状态进行OBD信息以及简单语音识别、简单语音合成的信息处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆峰创科技有限公司,未经重庆峰创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611230108.5/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序