[发明专利]关键词识别方法、装置、设备、介质及计算机程序产品有效

申请号：	202111103103.7	申请日：	2021-09-18
公开（公告）号：	CN113961666B	公开（公告）日：	2022-08-23
发明（设计）人：	廖阔;唐晶	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06F16/35;G06F40/289;G06K9/62;G06N3/04;G06N3/08
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	孙晓丽
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	关键词识别方法装置设备介质计算机程序产品
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种关键词识别方法，其特征在于，所述方法包括：

获取目标文本，所述目标文本为待进行关键词识别的文本；

对所述目标文本中的字符依次进行特征映射，得到与所述字符顺次对应的映射特征结果；

将第i个字符的映射特征结果与至少一个其他映射特征结果融合，得到所述第i个字符的字符特征，i为正整数；

对所述目标文本进行分词处理，得到所述目标文本中的至少两个分词词汇；

基于所述字符特征获取所述分词词汇的词汇特征；

对所述词汇特征进行关键词预测，得到所述词汇特征对应的第一关键词概率；对至少两个相邻词汇特征组成的候选特征进行关键词预测，得到所述候选特征对应的候选关键词概率；基于所述第一关键词概率和所述候选关键词概率确定所述目标文本对应的关键词概率；其中，所述候选特征通过将至少两个相邻词汇特征组成至少两个子序列，并对所述子序列进行特征计算得到；所述候选关键词概率通过对所述候选特征进行回归预测得到；

基于所述关键词概率确定所述目标文本对应的关键词；

其中，所述对所述子序列进行特征计算，包括：

将所述子序列通过卷积神经网络，其中，激活函数采用线性整流函数，对所述子序列进行特征计算的公式为：

其中，分别为所述子序列中的词汇特征的词向量，W₁，b₁是卷积神经网络的参数，“*”是互相关运算符，ReLU函数的公式为：

ReLU(x)＝max(x,0)

经过上述特征计算后，得到所述候选特征的向量表示

2.根据权利要求1所述的方法，其特征在于，所述对至少两个相邻词汇特征组成的候选特征进行关键词预测，得到所述候选特征对应的候选关键词概率，包括：

对相邻两个词汇特征组成的第一候选特征进行关键词预测，得到所述第一候选特征对应的第二关键词概率；

或，

对相邻三个词汇特征组成的第二候选特征进行关键词预测，得到所述第二候选特征对应的第三关键词概率。

3.根据权利要求1所述的方法，其特征在于，所述候选特征基于所述至少两个词汇特征对应的词汇数量，对所述至少两个相邻词汇特征进行特征计算得到。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述基于所述字符特征获取所述分词词汇的词汇特征，包括：