[发明专利]祝福语文本生成方法和装置、计算机可读存储介质有效
申请号: | 201811037203.2 | 申请日: | 2018-09-06 |
公开(公告)号: | CN109117485B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 宋阳;陈蒙 | 申请(专利权)人: | 北京汇钧科技有限公司 |
主分类号: | G06F40/56 | 分类号: | G06F40/56;G06F40/205;G06F40/216;G06Q30/0282 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 王云飞;刘剑波 |
地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 祝福 语文 生成 方法 装置 计算机 可读 存储 介质 | ||
1.一种祝福语文本生成方法,其特征在于,包括:
获取用户输入的场景主题词,其中,场景主题词为场景相关的祝福语主题词;
对场景主题词进行主题词扩展,得到扩展主题词;
根据场景主题词和扩展主题词,生成多个主题词序列;
将主题词序列输入预定自然语言生成模型,生成祝福语文本;
对预定自然语言生成模型生成的祝福语文本进行扩展,获取概率最高的N个祝福语文本,其中N为扩展宽度,N为大于1的自然数;
将N个祝福语文本输入预定语言模型,获取每个祝福语文本的困惑度;
将困惑度最低的祝福语文本作为最优祝福语文本反馈给用户;
其中,所述根据场景主题词和扩展主题词,生成多个主题词序列包括:
生成通用数据主题词序列语言模型和祝福语主题词序列语言模型;
将通用数据主题词序列语言模型和祝福语主题词序列语言模型按预定比例进行插值处理,确定综合主题词序列语言模型;
将场景主题词和扩展主题词输入综合主题词序列语言模型,获取多个主题词序列;
其中,所述将主题词序列输入预定自然语言生成模型,生成祝福语文本包括:
预先采用训练数据进行训练,获取预定自然语言生成模型;
将主题词序列输入预定自然语言生成模型,生成祝福语文本。
2.根据权利要求1所述的祝福语文本生成方法,其特征在于,还包括:
获取用户反馈的、用户修改后的祝福语文本;
将用户修改后的祝福语文本作为训练数据,对预定自然语言生成模型和预定语言模型进行优化。
3.根据权利要求1或2所述的祝福语文本生成方法,其特征在于,所述对场景主题词进行主题词扩展,得到扩展主题词包括:
获取祝福语主题词和词向量模型;
对场景主题词利用词向量模型在祝福语主题词的范围内进行相似度扩展;
将与用户主题词的相似度大于预定值的祝福语主题词,作为扩展主题词。
4.根据权利要求3所述的祝福语文本生成方法,其特征在于,所述获取祝福语主题词包括:
获取祝福语文本数据和通用数据,其中,福语文本数据包括节日祝福语文本和生日祝福语文本,通用数据包括现代诗歌数据、散文数据、歌词数据、小说数据和台词数据;
对祝福语文本数据和通用数据分别切词,得到祝福语文本数据的切词结果和通用数据的切词结果;
根据祝福语文本数据的切词结果和通用数据的切词结果获取一个词语出现祝福语文本数据的词频和出现在通用数据的词频;
若一个词语出现祝福语文本数据的词频大于出现在通用数据的词频、且所述词语出现在祝福语文本数据的次数大于预定值,则判定所述词语为祝福语主题词。
5.根据权利要求4所述的祝福语文本生成方法,其特征在于,所述获取词向量模型包括:
利用祝福语文本数据的切词结果和通用数据的切词结果进行训练,获取词向量模型。
6.根据权利要求1或2所述的祝福语文本生成方法,其特征在于,所述生成通用数据主题词序列语言模型和祝福语主题词序列语言模型包括:
对祝福语文本数据和通用数据分别切词,得到祝福语文本数据的切词结果和通用数据的切词结果,其中,福语文本数据包括节日祝福语文本和生日祝福语文本,通用数据包括现代诗歌数据、散文数据、歌词数据、小说数据和台词数据;
对祝福语文本数据的切词结果和通用数据的切词结果中的每句话进行主题词提取;
根据每句话的主题词,确定每个祝福语文本的主题词序列;
利用祝福语文本的主题词序列进行训练,以生成通用数据主题词序列语言模型和祝福语主题词序列语言模型。
7.根据权利要求1或2所述的祝福语文本生成方法,其特征在于,所述预先采用训练数据进行训练,获取预定自然语言生成模型包括:
获取训练数据,其中,所述训练数据包括祝福语文本数据和通用数据;
从每行训练数据提出一个主题词;
将当前主题词和之前的训练结果输入预定自然语言生成模型,进行本轮训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京汇钧科技有限公司,未经北京汇钧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811037203.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音翻译方法和语音翻译设备
- 下一篇:一种电动汽车充电站最优规划方法