[发明专利]古诗词生成方法、装置、设备及存储介质在审
申请号: | 201910987761.3 | 申请日: | 2019-10-17 |
公开(公告)号: | CN110738061A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 刘艳鹏;张引 | 申请(专利权)人: | 北京搜狐互联网信息服务有限公司 |
主分类号: | G06F40/56 | 分类号: | G06F40/56 |
代理公司: | 11227 北京集佳知识产权代理有限公司 | 代理人: | 任美玲 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供的古诗词生成方法、装置、设备及存储介质,通过对多模态信息进行关键词提取,实现了多模态信息的规范化处理,进而能够接受更多种模态信息,支持更广泛的实际应用场景,充分反映用户意图;然后通过各模态信息的概率统计结果,为多模态信息的处理提供了数据基础;利用古诗词映射知识图谱,解决了现代汉语与古汉语之间的映射问题;最后,将得到的预设数目个古诗词关键词确定为古诗词主题词,并利用预先训练好的古诗词生成模型,生成与所述古诗词主题词相对应的目标古诗词,从而在古诗词生成过程中,充分融合了多模态信息,更全面的体现了用户意图,有效提升了古诗词生成质量。 | ||
搜索关键词: | 多模态信息 模态信息 用户意图 汉语 关键词确定 关键词提取 存储介质 概率统计 生成模型 数据基础 应用场景 映射问题 映射知识 预设 图谱 诗词 规范化 融合 | ||
【主权项】:
1.一种古诗词生成方法,其特征在于,包括:/n获取用户输入的多模态信息,所述多模态信息包括图像、视频、文本与音频中的至少两种;/n对所述多模态信息中各模态信息分别进行关键词提取,获得所述各模态信息分别对应的现代汉语关键词,作为目标现代汉语关键词;/n根据历史模态信息统计数据,获取所述各模态信息的出现概率;/n根据预先构建的古诗词映射知识图谱,获取与所述目标现代汉语关键词的相关度最高的古汉语关键词,作为目标古汉语关键词;/n根据所述目标古汉语关键词与所述目标现代汉语关键词之间的相关度,以及所述各模态信息的出现概率,确定所述目标古汉语关键词的权重;/n将所述目标古汉语关键词中权重最大的预设数目个古汉语关键词,确定为古诗词主题词;/n利用预先训练好的古诗词生成模型,生成与所述古诗词主题词相对应的目标古诗词。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狐互联网信息服务有限公司,未经北京搜狐互联网信息服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910987761.3/,转载请声明来源钻瓜专利网。