[发明专利]一种多账号的识别方法、装置、电子设备及存储介质在审
申请号: | 201911290891.8 | 申请日: | 2019-12-16 |
公开(公告)号: | CN111312257A | 公开(公告)日: | 2020-06-19 |
发明(设计)人: | 罗景 | 申请(专利权)人: | 五八有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/08;G10L17/00 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 300450 天津市滨海新区经济技术开*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 账号 识别 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种多账号的识别方法、装置、电子设备及存储介质,根据使用者使用至少一个待检测账号所产生的语音片段序列进行声纹提取和识别,生成原始声纹序列,将原始声纹序列中具有相同或相似特性的声纹构建关键声纹集合。语音片段序列包括注册阶段的语音片段和使用过程中的语音片段,以提升多账号识别的准确率和覆盖率。通过声纹识别,将每个关键声纹集合进行匹配,实现待检测账号的聚类,将具有相同或相似声纹的关键声纹集合对应的待检测账号标记为同一使用者,该方法可准确地将每个使用者注册的多个账号识别出来,便于后续对每个账号进行验证。
技术领域
本申请涉及计算机技术领域,尤其涉及一种多账号的识别方法、装置、电子设备及存储介质。
背景技术
随着社交网络的广泛流行,越来越多的网络服务提供商开始提供属于自己的多样化的社交网络服务,人们在使用各种网络服务时,通常在各个网站分别开通自己的账号。互联网应用场景中,账号是用户的身份标识,也是业务开展的基础。
为了提高业务量,一个用户通常注册多个账号在网站上进行业务开展,例如,在分类信息服务场景中,用户使用多个账号发布帖子,以吸引更多的人阅读从而获得利益。但是,同一个用户使用多个账号发布帖子会存在吸流的情况,与其他用户之间产生不正当竞争,获得不正当谋利。因此,大部分互联网服务为了保证网络平衡,存在很强的账号限制诉求,避免一个用户申请多个账号进行不正当谋利。
目前,为了避免一个用户申请多个账号的情况,通常采用手机号验证、身份证验证等手段,该验证手段通常是在用户注册阶段完成。采用这种方法虽然可以避免一个用户申请多个账号,但是该方法很容易被规避。而且这种验证方式通常都是在注册阶段,一旦完成注册,在账号的后续使用过程中,难以将同一用户的多账号识别出来进行验证。
发明内容
本申请提供了一种多账号的识别方法、装置、电子设备及存储介质,以解决现有的用户存在多账号的情况下,无法在使用过程中识别出来进行验证的问题。
第一方面,本申请提供了一种多账号的识别方法,包括以下步骤:
获取使用者使用至少一个待检测账号所产生的语音片段序列;
对所述语音片段序列进行声纹提取,生成原始声纹序列;
将所述原始声纹序列中具有相同或相似特性的声纹,构建成所述使用者的每个待检测账号的关键声纹集合,每个待检测账号对应至少一个关键声纹集合;
对不同的所述待检测账号对应的多个关键声纹集合进行匹配;
若不同的所述待检测账号之间存在至少两个关键声纹集合对应的声纹相同,则将声纹相同对应的至少两个关键声纹集合对应的不同待检测账号标记为同一个使用者。
进一步地,所述获取使用者使用至少一个待检测账号所产生的所述语音片段序列之前,还包括:
根据时间划分规则,将目标时间段内对应的语音片段生成语音片段序列;
或者,根据业务逻辑划分规则,将完成一次业务对应的语音片段生成语音片段序列。
进一步地,所述语音片段序列为存储的历史会话对应的语音片段序列;以及,所述对语音片段序列进行声纹提取,生成原始声纹序列,包括:
对所述存储的历史会话对应的语音片段序列进行声纹提取;
将提取出的历史声纹,生成原始声纹序列,所述原始声纹序列为历史声纹序列。
进一步地,所述语音片段序列为当前会话对应的语音片段序列;以及,所述对语音片段序列进行声纹提取,生成原始声纹序列,包括:
对所述当前会话的语音片段序列进行声纹提取;
将提取出的实时声纹,生成原始声纹序列,所述原始声纹序列为实时声纹序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五八有限公司,未经五八有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911290891.8/2.html,转载请声明来源钻瓜专利网。