[发明专利]文本增强方法、文本增强模型的训练方法及装置有效
申请号: | 202210452492.2 | 申请日: | 2022-04-27 |
公开(公告)号: | CN114817469B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 白安琪;王洪斌;权佳成 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/279;G06F40/289;G06F18/214 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 朱文杰 |
地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 增强 方法 模型 训练 装置 | ||
1.一种文本增强方法,其特征在于,包括:
获取待处理文本和所述待处理文本的目标增强类型;
将所述待处理文本和所述目标增强类型输入文本增强模型中进行文本增强处理,得到增强文本;所述增强文本符合所述目标增强类型对应的社会方言的语言特征;
其中,所述文本增强处理包括:根据所述待处理文本的文本特征,确定与所述待处理文本相匹配的至少一种目标增强方式;根据所述目标增强类型和所述至少一种目标增强方式,对所述待处理文本进行文本增强处理;
所述文本增强模型包括实体检测模块、句型检测模块和增强模块;所述实体检测模块,用于根据所述待处理文本的文本特征对所述待处理文本进行实体检测处理;所述句型检测模块,用于根据所述待处理文本的文本特征对所述待处理文本进行句型检测处理;所述增强模块,用于根据所述实体检测模块和所述句型检测模块的检测结果,确定与所述待处理文本相匹配的至少一种目标增强方式,根据所述目标增强类型和所述目标增强方式对所述待处理文本进行文本增强处理,得到增强文本。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待处理文本的文本特征,确定与所述待处理文本相匹配的至少一种目标增强方式,包括:
根据所述待处理文本的文本特征进行实体检测处理和句型检测处理,得到文本特征的检测结果;
根据所述检测结果确定与所述待处理文本相匹配的至少一种目标增强方式。
3.根据权利要求2所述的方法,其特征在于,所述待处理文本的文本特征包括分词结果和句型向量,所述分词结果是通过所述文本增强模型对所述待处理文本进行分词处理得到的,所述句型向量是通过所述文本增强模型根据所述分词结果生成的;
所述根据所述待处理文本的文本特征进行实体检测处理和句型检测处理,得到文本特征的检测结果,包括:
根据所述分词结果进行实体检测处理,得到所述待处理文本的用词特征的第一检测结果;所述实体检测处理用于检测所述分词结果对应的预设实体中是否存在允许进行实体范围变化的第一目标实体;
根据所述句型向量进行句型检测处理,得到所述待处理文本的句型特征的第二检测结果;
其中,所述句型检测处理包括以下至少一种:第一句型检测处理,用于检测所述待处理文本是否为强调句型;第二句型检测处理,用于检测所述待处理文本是否为含有动词的句型;第三句型检测处理,用于检测所述待处理文本是否为倒装句型;第四型检测处理,用于检测所述待处理文本是否为单句句型。
4.根据权利要求2所述的方法,其特征在于,所述待处理文本的文本特征包括分词结果和句型向量,所述分词结果是通过所述文本增强模型对所述待处理文本进行分词处理得到的,所述句型向量是通过所述文本增强模型根据所述分词结果生成的;
所述根据所述待处理文本的文本特征进行实体检测处理和句型检测处理,得到文本特征的检测结果,包括:
根据所述分词结果进行实体检测处理,得到所述待处理文本的用词特征的第一检测结果;所述实体检测处理用于检测所述分词结果对应的预设实体中是否存在允许进行实体范围变化的第一目标实体;
根据所述句型向量进行句型检测处理,得到所述待处理文本的预测概率集合;所述预测概率集合中包括所述待处理文本属于各预设句型的概率,所述预设句型包括强调句型、含有动词的句型、倒装句型、单句句型中的至少一个句型;
将所述预测概率集合中大于预设概率阈值的至少一个目标概率所对应的预设句型,确定为所述待处理文本的句型特征的第二检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210452492.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:锂电池及其制备工艺
- 下一篇:适用于目标应用的互动处理方法及装置