[发明专利]文本数据处理方法、设备和存储介质在审
申请号: | 202111481293.6 | 申请日: | 2021-12-06 |
公开(公告)号: | CN114297378A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 包祖贻;张月;章波;李辰;曹俊杰 | 申请(专利权)人: | 阿里巴巴达摩院(杭州)科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/205;G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈;孙明子 |
地址: | 310023 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种文本数据处理方法、设备和存储介质,该方法包括:先利用特征提取模型提取训练文本的第一文章向量,再根据第一文章向量和来源信息训练分类模型。之后,根据分类模型输出的分类结果,调整特征提取模型的模型参数,从而实现特征提取模型的预训练。接着,根据调整后的特征提取模型提取训练文本的第二文章向量,再根据第二文章向量和训练文本的评价信息训练评价模型。通过对特征提取模型的预训练,能够提升特征提取模型的特征提取能力,使其能够提取出包含训练文本的语义信息和来源信息的第二文章向量,再借助此信息丰富的第二文章向量训练评价模型,也能够提升评价模型的训练效果,保证评价模型对文本数据评价的准确性。 | ||
搜索关键词: | 文本 数据处理 方法 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111481293.6/,转载请声明来源钻瓜专利网。