[发明专利]一种信息查询方法、装置、计算机设备及存储介质在审
申请号: | 201810529526.7 | 申请日: | 2018-05-29 |
公开(公告)号: | CN108829765A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 黄锦伦 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 谭果林 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体文件 内容文本 知识库 解析 计算机设备 时间戳信息 存储介质 文件类型 信息查询 转写 匹配 多媒体 查询关键字 不同文件 查询结果 查询请求 查询效率 匹配成功 文件标识 信息对应 映射关系 记录 预设 查询 保存 | ||
1.一种信息查询方法,其特征在于,所述信息查询方法包括:
获取多媒体文件;
采用预设的正则表达式,对所述多媒体文件的文件扩展名进行正则匹配,确定所述多媒体文件的文件类型;
根据所述文件类型对应的预设解析方式,对所述多媒体文件进行解析,得到所述多媒体文件的内容文本信息,以及每个所述内容文本信息对应的时间戳信息;
建立所述多媒体文件的文件标识、所述内容文本信息和所述时间戳信息之间的映射关系,并将所述文件标识、所述内容文本信息、所述时间戳信息,以及所述映射关系作为所述多媒体文件的文件转写记录,保存到多媒体知识库中;
若接收到用户发送的包含查询关键字的查询请求,则基于所述多媒体知识库,将所述查询关键字与所述内容文本信息进行匹配,并将匹配成功的文件转写记录作为查询结果;
输出所述查询结果。
2.如权利要求1所述的信息查询方法,其特征在于,所述文件类型为音频,所述根据所述文件类型对应的预设解析方式,对所述多媒体文件进行解析,得到所述多媒体文件的内容文本信息,以及每个所述内容文本信息对应的时间戳信息包括:
获取所述多媒体文件的音频格式;
若所述音频格式为非预设的音频格式,则对所述多媒体文件进行标准格式转换,得到所述预设的音频格式的目标音频文件;
对所述目标音频文件进行语音增强和降噪处理,得到包含基础语音帧的帧集合;
对所述帧集合中的每个所述基础语音帧进行语音识别,生成所述内容文本信息;
针对每个所述内容文本信息,按照预设方式生成该内容文本信息在所述帧集合中对应的时间戳信息,作为该内容文本信息对应的时间戳信息。
3.如权利要求2所述的信息查询方法,其特征在于,所述文件类型为视频,在所述获取所述多媒体文件的音频格式之前,所述信息查询方法还包括:
按照预设的音频格式提取所述多媒体文件的音频编码,并将所述音频编码作为更新后的所述多媒体文件。
4.如权利要求1所述的信息查询方法,其特征在于,所述文件类型为图片,所述根据所述文件类型对应的预设解析方式,对所述多媒体文件进行解析,得到所述多媒体文件的内容文本信息,以及所述内容文本信息对应的时间戳信息还包括:
对所述多媒体文件进行图片预处理,得到目标图片文件;
使用场景文本检测算法,获取所述目标图片文件中的文字区域;
采用光学字符识别的方式,提取所述文字区域的文字内容,作为所述内容文本信息;
将所述内容文本信息对应的时间戳信息设置为空。
5.如权利要求1至4任一项所述的信息查询方法,其特征在于,在所述输出所述查询结果之后,所述信息查询方法还包括:
若接收到所述用户对所述查询结果的加载指令,则根据所述加载指令确定待加载的文件转写记录;
根据所述待加载的文件转写记录中的文件标识,获取该文件标识对应的目标多媒体文件;
若所述目标多媒体文件的文件类型为图片,则显示所述目标多媒体文件;
若所述目标多媒体文件的文件类型为音频或视频,则获取所述待加载的文件转写记录中的时间戳信息包含的目标时间点,并驱动所述目标多媒体文件从所述目标时间点处开始执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810529526.7/1.html,转载请声明来源钻瓜专利网。