[发明专利]实体检测模型训练方法、实体检测方法和计算机设备在审
申请号: | 202210741056.7 | 申请日: | 2022-06-28 |
公开(公告)号: | CN115130464A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 崔路男;曹利;潘树燊 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06K9/62 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 穆仁熙 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 检测 模型 训练 方法 计算机 设备 | ||
1.一种实体检测模型训练方法,其特征在于,所述方法包括:
获取包含多个实体的音乐文本,确定所述音乐文本中的真实实体以及真实实体类型;
将所述音乐文本输入待训练实体检测模型,由所述待训练实体检测模型对所述音乐文本中的各个字符进行组合得到多个字符对,并输出对所述多个字符对中的实体边缘字符进行检测后得到的样本实体对对应的样本实体及其样本实体类型;所述样本实体对由多个实体边缘字符组成,所述实体边缘字符表征实体的起始字符或结尾字符;
根据所述样本实体与所述真实实体的相似度以及所述样本实体类型与所述真实实体类型的相似度,调整所述待训练实体检测模型的模型参数,直至满足模型训练条件时得到实体检测模型。
2.根据权利要求1所述的方法,其特征在于,所述由所述待训练实体检测模型对所述音乐文本中的各个字符进行组合得到多个字符对,包括:
针对所述音乐文本中的每个字符,由所述待训练实体检测模型根据该字符以及所述音乐文本中该字符之后的各个字符,组合得到多个字符对。
3.根据权利要求1所述的方法,其特征在于,所述由所述待训练实体检测模型对所述音乐文本中的各个字符进行组合得到多个字符对,包括:
构建与所述音乐文本的字符数对应长度的二维矩阵,并将所述音乐文本中的各个字符作为所述二维矩阵的各个维度的元素,得到所述音乐文本对应的标注矩阵;
根据所述标注矩阵,获取所述音乐文本中的多个字符对。
4.根据权利要求3所述的方法,其特征在于,所述根据所述标注矩阵,获取所述音乐文本中的多个字符对,包括:
针对所述音乐文本中的每个字符,获取所述标注矩阵中的上三角矩阵中包含该字符的多个目标矩阵单元,根据所述多个目标矩阵单元对应字符对,得到所述音乐文本中的多个字符对。
5.根据权利要求1所述的方法,其特征在于,所述输出对所述多个字符对中的实体边缘字符进行检测后得到的样本实体对对应的样本实体及其样本实体类型,包括:
通过所述待训练实体检测模型获取每个字符对中各个字符的至少一个相邻字符;
根据所述各个字符的至少一个相邻字符确定所述各个字符的实体边缘特征,并根据所述实体边缘特征与预设特征阈值的比较结果确定各个字符是否为实体边缘字符;
若检测到该字符对中的每个字符均为实体边缘字符时,获取该字符对对应的样本实体类型,得到该字符对对应的包含所述样本实体类型的样本实体对;
获取所述音乐文本中所述样本实体对对应的样本实体,并输出所述样本实体及其样本实体类型。
6.根据权利要求5所述的方法,其特征在于,所述根据所述各个字符的至少一个相邻字符确定所述各个字符的实体边缘特征,包括:
若所述相邻字符为一个,根据每个字符对中各个字符的相邻字符的语义特征向量确定各个字符的实体边缘特征;
若所述相邻字符为多个,根据每个字符对中各个字符的前一相邻字符的语义特征向量和后一相邻字符的语义特征向量的差值,确定各个字符的实体边缘特征。
7.根据权利要求1所述的方法,其特征在于,所述根据所述样本实体与所述真实实体的相似度以及所述样本实体类型与所述真实实体类型的相似度,调整所述待训练实体检测模型的模型参数,直至满足模型训练条件时得到实体检测模型,包括:
根据所述样本实体与对应的真实实体的实体类型相似度确定第一损失值,根据所述样本实体与对应的真实实体的字符相似度确定第二损失值;
根据所述第一损失值和所述第二损失值确定目标损失值,根据所述目标损失值调整所述待训练实体检测模型的模型参数,直到所述目标损失值小于或等于预设损失阈值时,将当前的待训练实体检测模型作为训练完成的实体检测模型。
8.一种实体检测方法,其特征在于,所述方法包括:
获取音乐文本,将所述音乐文本输入实体检测模型;所述实体检测模型基于权利要求1至7任一项所述的方法训练得到;
获取所述实体检测模型输出的所述音乐文本中包含的实体以及每个实体的实体类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210741056.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种惯导与激光点阵融合导航系统
- 下一篇:一种医用近视镜防护面屏