[发明专利]兴趣识别方法、装置、设备及存储介质在审
申请号: | 202310391666.3 | 申请日: | 2023-04-13 |
公开(公告)号: | CN116401367A | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 董华;薛博文;刘晓宇;苟渝东 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/0455;G06N3/042;G06N3/088;G06F40/216 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 李兴福;臧建明 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 兴趣 识别 方法 装置 设备 存储 介质 | ||
本申请提供一种兴趣识别方法、装置、设备及存储介质,涉及大数据领域。该方法包括:获取语音通话数据,将语音通话数据转化为文本数据;根据文本数据,构建异构图,并通过统计方法确定异构图中的高频词;通过图神经网络的方式,对异构图进行分类处理,得到文本数据对应的至少一个分类;通过隐含狄利克雷分布的方式,对每个分类中的文档进行主题分析处理,得到每个分类的主题以及每个主题中的关键词;根据每个主题中的关键词和高频词,确定用户兴趣。本申请的方法,实现了用户兴趣的快速、准确识别,避免了人工识别用户兴趣的不准确性以及相应的人员浪费,减少了人力的浪费,降低了用户兴趣分析时间,提高了用户兴趣识别效率。
技术领域
本申请涉及大数据领域,尤其涉及一种兴趣识别方法、装置、设备及存储介质。
背景技术
随着互联网技术以及大数据的发展,互联网用户的使用习惯已从最初的自己寻找内容转变为依赖服务方给予的内容推送,因此精确地了解每个用户兴趣,能有效帮助服务方提供个性化的服务,提高用户的使用体验。
相关技术中,服务方可以在客服与用户大量的电话通话数据中,通过人工方式查找用户可能感兴趣的内容,服务方可以通过手动记录关键词的方式来分析用户的兴趣偏好。
然而,现有技术的兴趣识别方法耗费大量的人力,且人工分析时间长、效率低。
发明内容
本申请提供一种兴趣识别方法、装置、设备及存储介质,用以解决现有技术的兴趣识别方法耗费大量的人力,且人工分析时间长、效率低的问题。
第一方面,本申请提供一种兴趣识别方法,包括:
获取语音通话数据,将所述语音通话数据转化为文本数据;
根据所述文本数据,构建异构图,并通过统计方法确定所述异构图中的高频词;
通过图神经网络的方式,对所述异构图进行分类处理,得到所述文本数据对应的至少一个分类;
通过隐含狄利克雷分布的方式,对每个分类中的文档进行主题分析处理,得到每个分类的主题以及每个主题中的关键词;
根据所述每个主题中的关键词和所述高频词,确定用户兴趣。
这里,本申请提供了一种可以自动通过语音通话数据识别用户兴趣的方法,该方法将语音通话数据对应的文本数据构建成一个异构图,通过图神经网络的方式可以快速、准确地进行文本的分类,并结合隐含狄利克雷分布,识别出用户感兴趣的主题以及每个主题对应的关键信息,实现了用户兴趣的快速、准确识别,避免了人工识别用户兴趣的不准确性以及相应的人员浪费,减少了人力的浪费,降低了用户兴趣分析时间,提高了用户兴趣识别效率。
可选地,所述根据所述文本数据,构建异构图,包括:
根据所述文本数据,确定文档节点和单词节点;
根据所述文档节点和单词节点,构建异构图。
可选地,所述异构图包括特征矩阵和邻接矩阵;
相应地,所述根据所述文档节点和单词节点,构建异构图,包括:
通过所述文档节点和所述单词节点,构建特征矩阵;
通过所述特征矩阵中所有节点之间的关系,构建邻接矩阵。
其中,本申请在文本数据中提取文档和单词,构成了异构图的节点,具体地,将文档节点和单词节点作为特征矩阵的节点,通过各个节点之间的关系,构成邻接矩阵,上述矩阵结合图神经网络,可以准确确定文档中内容的相似度,从而对文档进行准确分类,进一步地提高了用户兴趣识别的准确性。
可选地,所述通过图神经网络的方式,对所述异构图进行分类处理,得到所述文本数据对应的至少一个分类,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310391666.3/2.html,转载请声明来源钻瓜专利网。