[发明专利]演员知名度确定方法、装置及电子设备在审
申请号: | 201910295962.7 | 申请日: | 2019-04-12 |
公开(公告)号: | CN110083830A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 都金涛;金超逸;董桐辉;陆祁;周寻 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;项京 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 词词 向量 装置及电子设备 演员信息 相似度 迭代 受众 置信 迭代结果 分段函数 词向量 | ||
1.一种演员知名度确定方法,其特征在于,包括:
获取多个演员的演员信息和受众程度表示量;
针对各个演员,通过word2vec工具,确定该演员的所述演员信息中演员姓名词的演员姓名词词向量;并确定该演员对应的演员姓名词词向量与其他演员对应的演员姓名词词向量之间的相似度,其中,所述其他演员是所述多个演员中除该演员之外的演员;
根据该演员对应的演员姓名词词向量与其他演员对应的演员姓名词词向量之间的相似度,对该演员的所述受众程度表示量进行迭代,直至当前迭代结果与前一次迭代结果之间的距离小于预设阈值,将所述当前迭代结果作为该演员的知名度置信值;
通过分段函数,根据所述知名度置信值,确定该演员的初始知名度。
2.根据权利要求1所述的方法,其特征在于,在所述确定该演员的初始知名度之后,所述方法还包括:
确定该演员参与作品的作品数;
根据该演员的所述初始知名度以及所述作品数,确定该演员的最终知名度。
3.根据权利要求1所述的方法,其特征在于,获取多个演员的演员信息,包括:
针对各个演员,获取该演员的描述信息;
通过分词算法,对该演员的所述描述信息进行分词,得到该演员的演员信息,所述演员信息包括该演员的演员姓名词和其他词,所述其他词是所述演员信息中除所述演员姓名词之外的词。
4.根据权利要求3所述的方法,其特征在于,所述通过word2vec工具,确定该演员的所述演员信息中演员姓名词的演员姓名词词向量,包括:
通过所述word2vec工具中skip-gram模型,根据所述演员信息包括的该演员的演员姓名词和其他词,确定该演员的所述演员信息中所述演员姓名词的演员姓名词词向量。
5.根据权利要求1所述的方法,其特征在于,所述根据该演员对应的演员姓名词词向量与其他演员对应的演员姓名词词向量之间的相似度,对该演员的所述受众程度表示量进行迭代,直至当前迭代结果与前一次迭代结果之间的距离小于预设阈值,将所述当前迭代结果作为该演员的知名度置信值,包括:
选取该演员对应的演员姓名词词向量与其他演员对应的演员姓名词词向量之间的相似度不小于预设相似度阈值的关联演员相似度;
根据所述关联演员相似度,通过预设迭代公式,对该演员的所述受众程度表示量进行迭代,直至当前迭代结果与前一次迭代结果之间的距离小于预设阈值,将所述当前迭代结果作为该演员的知名度置信值。
6.根据权利要求1所述的方法,其特征在于,所述通过分段函数,根据所述知名度置信值,确定该演员的初始知名度,包括:
确定所述知名度置信值位于的区间范围;
确定所述区间范围对应的区间分段函数;
通过所述区间分段函数,确定所述知名度置信值对应的该演员的初始知名度。
7.根据权利要求2所述的方法,其特征在于,所述确定该演员参与作品的作品数,包括:
针对该演员参与的各个作品,确定该演员对应该作品的权重;并将该演员对应各个作品的权重求和,得到该演员对应的作品数。
8.根据权利要求2或7所述的方法,其特征在于,所述根据该演员的所述初始知名度以及所述作品数,确定该演员的最终知名度,包括:
根据该演员的所述初始知名度以及所述作品数,通过预设公式:确定该演员的最终知名度;其中,actorFame为所述最终知名度,popularScore为所述初始知名度,weightedNumberOfWorks为所述作品数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910295962.7/1.html,转载请声明来源钻瓜专利网。