[发明专利]一种基于语料领域的语料处理系统有效
申请号: | 201910009322.5 | 申请日: | 2019-01-04 |
公开(公告)号: | CN109871533B | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 孔洋洋;陈飞宇;朱劲松 | 申请(专利权)人: | 北京车慧科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 11393 北京市维诗律师事务所 | 代理人: | 李翔;杨安进 |
地址: | 100044 北京市海淀区西直门外大街16*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种基于语料领域的语料处理系统。该系统包括:第一训练模块,用于根据开放领域语料训练第一编码模型,根据目标领域参考语料训练第二编码模型;向量模块,用于将目标领域语料输入所述第一编码模型得到第一向量,将目标领域语料输入所述第二编码模型得到第二向量,将目标领域语料输入第三模型得到第三向量;第二训练模块,用于根据所述第一向量、所述第二向量以及所述第三向量训练语料处理模型。本申请的提供的技术方案,由于利用了开放领域的先验知识,减少了标签数据使用量,使得不仅效果得到显著提升,而且训练时间也大大缩短。 | ||
搜索关键词: | 语料 向量 编码模型 目标领域 处理系统 训练模块 标签数据 处理模型 领域语料 先验知识 向量训练 申请 参考 开放 | ||
【主权项】:
1.一种基于语料领域的语料处理系统,其特征在于,该系统包括:/n第一训练模块,用于根据开放领域语料训练第一编码模型,根据目标领域参考语料训练第二编码模型;/n向量模块,用于将目标领域语料输入所述第一编码模型得到第一向量,将目标领域语料输入所述第二编码模型得到第二向量,将目标领域语料输入第三模型得到第三向量;/n第二训练模块,用于根据所述第一向量、所述第二向量以及所述第三向量训练语料处理模型。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京车慧科技有限公司,未经北京车慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910009322.5/,转载请声明来源钻瓜专利网。