[发明专利]基于孪生神经网络的文本自动评分方法、装置及电子设备在审
申请号: | 202110242778.3 | 申请日: | 2021-03-04 |
公开(公告)号: | CN112989784A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 李添财 | 申请(专利权)人: | 广州汇才创智科技有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F16/33;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈志明 |
地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 孪生 神经网络 文本 自动 评分 方法 装置 电子设备 | ||
1.一种基于孪生神经网络的文本自动评分方法,其特征在于,包括:
分别对待评价文本和参考文本进行切分,得到待评价句子集合和参考句子集合;
将所述待评价句子集合和所述参考句子集合分别进行预处理,得到每个句子的词汇集合,并确定每个所述词汇集合的词向量集合;
将所述待评价句子集合中每个待评价句子和所述参考句子集合中每个参考句子组成句子对,并分别输入所述句子对的两个所述词向量集合至孪生神经网络子网络,训练得到两个长度一致的句向量;
根据曼哈顿距离确定两个所述句向量的向量差,并将所述向量差转换为所述句子对的相似度;
根据所述相似度,确定与所述参考句子相匹配的所述待评价句子,记录匹配结果,所述匹配结果包括匹配成功的句子之间的相似度,以及未匹配成功的所述参考句子;
根据所述匹配结果,计算待评价文本的评分。
2.如权利要求1所述的基于孪生神经网络的文本自动评分方法,其特征在于,根据所述相似度,确定与所述参考句子相匹配的所述待评价句子,包括:
将所述相似度按照大小进行排列;
将所述相似度最大的句子对所对应的两个句子作为所述匹配成功的句子,并记录所述相似度最大的句子对的相似度;
将未匹配成功的句子组成的句子对作为待匹配的句子对,再次按照待匹配的句子的相似度大小进行排列,匹配并记录,直至不存在句子对为止;
记录所述参考句子集合中未匹配成功的所述参考句子的信息。
3.如权利要求1所述的基于孪生神经网络的文本自动评分方法,其特征在于,所述预处理包括:
分词处理、去除标点符号、去除空白字符和去除停用词。
4.如权利要求3所述的基于孪生神经网络的文本自动评分方法,其特征在于,还包括:
对所述待评价句子集合和所述参考句子集合进行所述分词处理,并去除标点符号和空白字符,得到每个句子的第一词汇集合,提取所述第一词汇集合的第一词法特征,所述第一特征为词汇字数总和和错别字字数;
去除所述第一词汇集合中的停用词,得到第二词汇集合,提取所述第二词汇集合的第二词法特征,所述第二特征为去除停用词后的词汇字数总和;
根据所述匹配结果、所述第一词法特征和所述第二词法特征,计算待评价文本的评分。
5.如权利要求1所述的基于孪生神经网络的文本自动评分方法,其特征在于,将所述向量差转换为所述句子对之间的相似度,包括:
判断所述向量差是否满足预设阈值,若所述向量差大于所述预设阈值,则所述句子相似度为0;若所述向量差小于预设阈值,则所述句子相似度满足公式其中,所述C为相似度,所述S为所述向量差,所述M为预设阈值。
6.如权利要求1所述的基于孪生神经网络的文本自动评分方法,其特征在于,还包括以下步骤训练所述孪生神经网络子网络:
分别将训练模板的两个词向量集合输入至孪生神经网络子网络进行训练,得到训练模板的两个句向量;
根据曼哈顿距离确定所述训练模板的两个句向量的向量差;
所述训练模板两个句向量的向量差经全连接层、softmax层处理得到预测结果,所述预测结果为二维向量;
确定所述预测结果和所述训练模板真实结果的向量差,得到神经网络的损失,所述训练模板真实结果为二维向量;
根据反向传播算法调整所述孪生神经网络子网络的权重。
7.如权利要求1所述的基于孪生神经网络的文本自动评分方法,其特征在于,还包括:
分别对所述待评价句子集合和所述参考句子集合中的句子进行编号;
对所述词汇集合进行标记,所述标记为所述词汇集合所属的句子编号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州汇才创智科技有限公司,未经广州汇才创智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110242778.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:对话处理方法、装置及电子设备
- 下一篇:用于非接触式感测物质的基准开关架构