[发明专利]一种基于文本风格迁移技术的文字美化方法在审
申请号: | 202110733282.6 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113627162A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 张楠坤 | 申请(专利权)人: | 北京海纳数聚科技有限公司 |
主分类号: | G06F40/268 | 分类号: | G06F40/268;G06F40/253 |
代理公司: | 北京智沃律师事务所 11620 | 代理人: | 吴志宏 |
地址: | 102200 北京市昌平区回*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 风格 迁移 技术 文字 美化 方法 | ||
本发明提供一种基于文本风格迁移技术的文字美化方法,包括下列步骤:S1:获取用户的第一输入文本,提取第一输入文本中的关键字,对关键字进行标签分类;S2:获取用户输入的风格要求的第二输入文本,通过语言模型判断风格要求所属的主题;S3:通过语言模型提取描述符合同一风格主题的若干语料文本,并进行排序处理;S4:根据描述主体所属标签类型,引入关联性密切的相关描述主体,并根据带有相关描述主体的语料文本,提取后作为补充描述文本;S5:输出与所述第一输入文本语义相同的第二写作风格的目标文本。本方法实现了文本写作风格的转换,有效解决了文本写作风格领域自适应问题,提高了文本写作风格转换的准确性。
技术领域
本发明涉及一种描述扩展方法,尤其是涉及一种基于文本风格迁移技术的文字美化方法。
背景技术
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
近些年来,智能写作技术得到了极大发展,尤其是利用神经网络来进行智能写作的发展更是迅速。智能写作通常是指给定包括一个或多个关键词的关键词序列的情况下,利用神经网络生成一段与所述关键词序列有关的描述文本。例如,给定描述外貌的几个关键词,利用神经网络根据提供的词语生成一段描写外貌的文本。然而,目前使用的神经网络生成的文本的句式和风格都很固定和单一,并不能满足用户日常写作或创作的需要。
发明内容
本发明提供了一种基于文本风格迁移技术的文字美化方法,解决了文本语义在扩展时的处理问题,其技术方案如下所述:
一种基于文本风格迁移技术的文字美化方法,包括下列步骤:
S1:获取用户的第一输入文本,提取第一输入文本中的关键字,对关键字进行标签分类;
S2:获取用户输入的风格要求的第二输入文本,通过语言模型判断风格要求所属的主题;
S3:通过语言模型提取描述符合同一风格主题的若干语料文本,并进行排序处理;
S4:根据描述主体所属标签类型,引入关联性密切的相关描述主体,并根据带有相关描述主体的语料文本,提取后作为补充描述文本;
S5:输出与所述第一输入文本语义相同的第二写作风格的目标文本。
进一步的,步骤S1中,所述标签类型包括名词标签和形容词标签。
所述形容词标签从消极到积极两个方向划分为多个严重程度不同的设定形容等级,所述形容词根据其权重,分配到不同的形容等级中。
进一步的,步骤S2中,所述主题包括多种目标应用场景,每种目标应用场景中训练有语料文本。
进一步的,步骤S3中,所述语料文本设有标记,标记内容包括描述主体和标记形容等级。
步骤S3中,若干具有描述主体的语料文本,按照空间顺序或者时间顺序进行排序。
进一步的,步骤S5中,对于输出的第二写作风格的目标文本,用户进行进一步的编辑和保存,语言模型对于确定的第二写作风格的目标文本,结合第一输入文本和第二输入文本,作为训练集进行语料文本的训练。
一种基于文本风格迁移技术的文字美化系统,包括获取模块、处理模块;
所述获取模块,用于获取第一写作风格的第一输入文本,以及获取用户输入的风格要求的第二输入文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海纳数聚科技有限公司,未经北京海纳数聚科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110733282.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:视频内容编辑器的编辑方法、装置及存储介质
- 下一篇:一种反击式矿山破碎机