[发明专利]一种用户画像构建方法及装置有效
申请号: | 201910233082.7 | 申请日: | 2019-03-26 |
公开(公告)号: | CN111755015B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 刘克林 | 申请(专利权)人: | 苏州君林智能科技有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/02;G10L17/08;G10L17/18 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 215163 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 画像 构建 方法 装置 | ||
1.一种用户画像构建方法,其特征在于,包括:
采集第i条用户语音,其中,i=1,2,3,……;
获取短时帧语音,所述短时帧语音由第i条用户语音分帧生成;
获取短时帧特征向量,所述短时帧特征向量为根据第i条用户语音生成的每帧短时帧提取的特征向量;
获取语音特征向量,所述语音特征向量为根据第i条用户语音对应的所有短时帧特征向量生成;
生成用户特征标签,所述用户特征标签根据所述语音特征向量利用预设模型生成,所述特征标签包括用户身份标签、性别标签和年龄标签;
如果用户身份标签相同的用户语音数量达到预设值,则获取待画像语音,所述待画像语音为标记有所述用户身份标签的所有用户语音;
根据所述待画像语音生成的所有性别标签和年龄标签生成该用户的用户画像。
2.根据权利要求1所述的一种用户画像构建方法,其特征在于,所述方法还包括:如果用户身份标签相同的用户语音数量小于预设值,则
采集第i+1条用户语音;
获取短时帧语音,所述短时帧语音由第i+1条用户语音分帧生成;
获取短时帧特征向量,所述短时帧特征向量为根据第i+1条用户语音生成的每帧短时帧提取的特征向量;
获取语音特征向量,所述语音特征向量为根据第i+1条用户语音对应的所有短时帧特征向量生成;
生成用户特征标签,所述用户特征标签根据所述语音特征向量利用预设模型生成,所述特征标签包括用户身份标签、性别标签和年龄标签。
3.根据权利要求1所述的一种用户画像构建方法,其特征在于,所述获取短时帧语音包括:
将所述第i条用户语音按照预设时长分割成多个短时帧语音;
如果最末一个短时帧语音的时帧长度小于预设时长,则舍去最末一个短时帧语音。
4.根据权利要求1所述的一种用户画像构建方法,其特征在于,所述获取短时帧特征向量包括:
对每段短时帧语音以帧为单位对所述短时帧语音的高频部分进行预增强;
将预增强后的短时帧转换为频域信号;
根据所述频域信号计算每段短时帧的短时帧特征向量,所述短时帧特征向量包括倒梅尔能量谱。
5.根据权利要求1所述的一种用户画像构建方法,其特征在于,所述获取语音特征向量包括:
依次融合第i条用户语音对应的所有短时帧特征向量生成语音特征向量。
6.根据权利要求1所述的一种用户画像构建方法,其特征在于,如果用户语音的数量超过积累预设值,则根据所述待画像语音生成的所有性别标签和年龄标签生成该用户的用户画像包括:
获取所述待画像语音生成的所有性别标签和年龄标签;
利用多数选举法根据所述所有性别标签和年龄标签确定用于建构用户画像的性别标签和年龄标签;
生成该用户的用户画像,所述用户画像包括该用户的用户身份标签、利用多数选举法确定的性别标签和年龄标签。
7.一种用户画像构建装置,其特征在于,所述装置包括:
用户语音采集单元,用于采集第i条用户语音,其中,i=1,2,3,……;
短时帧获取单元,用于获取短时帧语音,所述短时帧语音由第i条用户语音分帧生成;
特征向量生成单元,用于获取短时帧特征向量,所述短时帧特征向量为根据第i条用户语音生成的每帧短时帧提取的特征向量;
所述特征向量生成单元还用于获取语音特征向量,所述语音特征向量为根据第i条用户语音对应的所有短时帧特征向量生成;
用户特征标签生成单元,用于生成用户特征标签,所述用户特征标签根据所述语音特征向量利用预设模型生成,所述特征标签包括用户身份标签、性别标签和年龄标签;
用户画像构建单元,用于如果用户身份标签相同的用户语音数量达到预设值,则获取待画像语音,所述待画像语音为标记有所述用户身份标签的所有用户语音;
所述用户画像构建单元还用于根据所述待画像语音生成的所有性别标签和年龄标签生成该用户的用户画像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州君林智能科技有限公司,未经苏州君林智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910233082.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数字隐写用的无失真子校验矩阵集合生成方法
- 下一篇:摄像装置