[发明专利]基于中值转化模型的句子对关系判别方法在审
申请号: | 201911081378.8 | 申请日: | 2019-11-07 |
公开(公告)号: | CN110825851A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 陈元宝;庄建昌;肖声明 | 申请(专利权)人: | 中电福富信息科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/205;G06K9/62;G06N20/00 |
代理公司: | 福州君诚知识产权代理有限公司 35211 | 代理人: | 彭东 |
地址: | 350000 福建省福州*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 中值 转化 模型 句子 关系 判别 方法 | ||
1.基于中值转化模型的句子对关系判别方法,其特征在于:其包括以下步骤:
步骤1,搜集所有的句子对SEN-A和SEN-B,所有的SEN-A构成一个A句的语料,所有的SEN-B构成B句的语料;
步骤2,分别将这两个语料中的SEN-A和SEN-B转化为向量形式得到各个句子对的embedding-a和embedding-b;
步骤3,得到了每个句子的embedding-a和embedding-b取平均值作为该句子对的embedding;
步骤4,将每一个句子对的embedding和其标签匹配,得到了结构化的语料集;
步骤5,以结构化的预料集使用现有成熟的机器学习分类算法或者深度学习的分类算法构建分类器,输出测试集的预测结果。
2.根据权利要求1所述的基于中值转化模型的句子对关系判别方法,其特征在于:步骤2中转化向量形式时采用word2vec、doc2vec、bert或其他文本分布式模型。
3.根据权利要求2所述的基于中值转化模型的句子对关系判别方法,其特征在于:doc2vec和bert直接得到句子的向量;word2vec得到句子中每个词的向量,然后取句子中所有词向量的平均值作为该句的向量。
4.根据权利要求1所述的基于中值转化模型的句子对关系判别方法,其特征在于:步骤3中去平均值的具体方法为:将一个句子对中A句的embedding和B句的embedding相加再除以2,所得的结果作为这一个句子对的embedding。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电福富信息科技有限公司,未经中电福富信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911081378.8/1.html,转载请声明来源钻瓜专利网。