[发明专利]成语推荐方法及装置、成语推荐模型的训练方法及装置有效
申请号: | 201911245157.X | 申请日: | 2019-12-06 |
公开(公告)号: | CN110990556B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 刘晓楠;郭昱;汪美玲;李长亮 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司;成都金山互动娱乐科技有限公司;北京金山软件有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/33;G06F16/338;G06F16/36 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 王治东 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 成语 推荐 方法 装置 模型 训练 | ||
1.一种成语推荐方法,其特征在于,包括:
确定目标文档的文体类型,其中,所述文体类型是指文章的体裁类型;
确定所述目标文档的目标推荐位置,并根据设定的窗口大小,确定所述目标推荐位置的上下文语句,并将包含所述目标推荐位置的上下文语句确定为目标语句;
将包含所述目标推荐位置的目标语句输入至所述目标文档的文体类型对应的成语推荐模型,输出所述目标推荐位置对应的推荐成语列表,其中,所述推荐成语列表包括至少一个推荐成语;
将所述推荐成语列表显示于所述目标文档的目标推荐位置。
2.如权利要求1所述的成语推荐方法,其特征在于,将包含所述目标推荐位置的目标语句输入至所述目标文档的文体类型对应的成语推荐模型,输出所述目标推荐位置对应的推荐成语列表,包括:
将所述目标推荐位置替换为掩膜标签;
将携带有所述掩膜标签的目标语句输入至所述目标文档的文体类型对应的成语推荐模型,生成语句向量,其中,所述语句向量包括与所述掩膜标签对应的掩膜向量;
所述成语推荐模型对所述语句向量进行处理,得到所述掩膜向量对应的至少一个成语以及每个所述成语对应的分值;
将分值高于设定阈值的成语作为推荐成语,生成并输出所述推荐成语列表。
3.如权利要求1所述的成语推荐方法,其特征在于,还包括:
在所述目标语句包含其他待推荐位置的情况下,将所述其他待推荐位置生成占位符。
4.一种成语推荐模型的训练方法,其特征在于,所述方法包括:
获取含有成语的训练文本,并确定所述训练文本的文体类型,其中,所述文体类型是指文章的体裁类型;
选取每一文体类型的训练文本中含有待推荐成语的语句,将所述待推荐成语所在位置生成空位,生成训练语句;
从预先生成的成语知识图谱中根据所述待推荐成语查找对应的相关成语,并将所述待推荐成语及其相关成语作为答案选项;
将所述训练语句和所述答案选项输入至成语推荐模型进行训练,得到每一文体类型对应的成语推荐模型。
5.如权利要求4所述的训练方法,其特征在于,所述成语知识图谱通过以下方法生成:
从预设的语料数据库中获取结构化数据,所述结构化数据包括多个成语、多个特征标签、所述成语与特征标签之间的标签关系信息以及多个所述成语之间的近义关系信息;
根据所述结构化数据构建成语知识图谱,以使所述成语知识图谱中包含有互为近义关系的成语以及每个所述成语对应的至少一个特征标签。
6.如权利要求5所述的训练方法,其特征在于,从预先生成的成语知识图谱中根据所述待推荐成语查找对应的相关成语,包括:
从预先生成的成语知识图谱中根据所述待推荐成语查找对应的至少一个近义关系的成语和至少一个随机成语。
7.如权利要求4所述的训练方法,其特征在于,将所述待推荐成语所在位置生成空位,生成训练语句,包括:
将所述待推荐成语对应的所述空位替换为掩膜标签,生成所述训练语句。
8.如权利要求4或7所述的训练方法,其特征在于,选取每一文体类型的训练文本中含有待推荐成语的语句,将所述待推荐成语所在位置生成空位,生成训练语句,包括:
在所述语句包含至少两个所述待推荐成语的情况下,将任一所述待推荐成语所在位置生成掩膜标签,将其他所述待推荐成语的位置生成占位符,生成每个所述待推荐成语对应的训练语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司;成都金山互动娱乐科技有限公司;北京金山软件有限公司,未经北京金山数字娱乐科技有限公司;成都金山互动娱乐科技有限公司;北京金山软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911245157.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:防松螺母及具有其的车辆
- 下一篇:一种同时测定粉尘正、反向渗透速率的实验装置