[发明专利]程序名称宽泛检测方法和装置在审
申请号: | 202011061564.8 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112199947A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 施登亮;周书恒;祝慧佳 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/289;G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 程序 名称 宽泛 检测 方法 装置 | ||
本说明书实施例提供一种程序名称宽泛检测方法和装置,该方法包括:获取一个程序的程序名称和主体名称后,首先从程序名称中解析出第一分词并分别将每个第一分词映射为第一词向量,从主体名称中解析出第二分词并分别将每个第二分词映射为第二词向量,接着根据各第一词向量生成用于表征程序名称内容特征的程序名称编码,接着根据程序名称编码和各第二词向量生成用于表征主体名称内容特征及第一分词与第二分词之间相似性的主体名称编码,接着将程序名称编码和主体名称编码输入分类器获得名称宽泛系数,接着根据名称宽泛系统与预设名称宽泛阈值的大小关系确定该程序的程序名称是否宽泛。
技术领域
本说明书一个或多个实施例涉及机器学习技术领域,尤其涉及利用机器学习进行程序名称宽泛检测的方法和装置。
背景技术
小程序是一种不需要下载安装即可使用的应用,小程序相对于传统的应用程序可以节约开发者的开发成本和推广成本,而且还可以降低用户的使用时间成本以及手机内存空间的占用。由于小程序的开发门槛低、使用便捷,而且适合生活服务类线下商铺以及非刚需低频应用的转换,因此各大流量平台均提供了小程序服务。
随着小程序服务平台上入驻小程序数量的不断增加,小程序名称宽泛的问题愈发突出,小程序名称宽泛是指使用太过宽泛的通用名词、行业词、产品名称、活动名称、功能词等作为小程序的名称。小程序使用宽泛的名称导致用户难以从大量小程序中搜索到所需的小程序,影响用户的使用体验。为此希望能有改进的方案,可以在小程序入驻小程序服务平台时准确检测小程序名称是否过于宽泛,以阻止名称过于宽泛的小程序入驻小程序服务平台。
发明内容
本说明书一个或多个实施例描述了一种程序名称宽泛检测方法和装置,将程序主体的名称作为参考信息来检测程序名称是否过于宽泛,从而提高程序名称宽泛检测的准确性。
第一方面,本说明书提供了一种程序名称宽泛检测方法,包括:
获取一个程序的程序名称和主体名称,其中,所述主体名称为所述程序的运营主体的名称;
从所述程序名称中解析出至少一个第一分词,并根据预先训练的分词-向量映射字典分别将每一个所述第一分词映射成相应的第一词向量;
从所述主体名称中解析出至少一个第二分词,并根据所述分词-向量映射字典分别将每一个所述第二分词映射成相应的第二词向量;
根据各所述第一词向量生成程序名称编码,其中,所述程序名称编码用于表征所述程序名称的内容特征;
根据所述程序名称编码和各所述第二词向量生成主体名称编码,其中,所述主体名称编码用于表征所述主体名称的内容特征以及所述第一分词和所述第二分词之间的相似性;
将所述程序名称编码和所述主体名称编码输入预先训练的分类器,并获得所述分类器输出的名称宽泛系数;
如果所述名称宽泛系统大于预先设定的名称宽泛阈值,则确定所述程序名称宽泛。
一种可能的实现方式,所述根据各所述第一词向量生成程序名称编码,包括:
利用预先训练的编码神经网对各所述第一词向量进行编码,获得每一个所述第一词向量对应的分词编码;
利用各所述分词编码进行编码融合,获得所述程序名称编码。
进一步地,在一个实施例中,所述利用预先训练的编码神经网对各所述第一词向量进行编码获得每一个所述第一词向量对应的分词编码,包括:
将各所述第一词向量输入所述编码神经网络,分别获得所述编码神经网络针对每一个所述第一词向量输出的所述分词编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011061564.8/2.html,转载请声明来源钻瓜专利网。