[发明专利]评估由文本分类模型预测的文本分类异常在审
申请号: | 202010273725.3 | 申请日: | 2020-04-09 |
公开(公告)号: | CN111813928A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 谭铭;S·波达尔;L·克里希纳默西 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/117;G06F40/289;G06F40/30;G06K9/62;G06N20/00 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 李永敏;于静 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评估 文本 分类 模型 预测 异常 | ||
1.一种方法,包括以下步骤:
响应于在预先训练的文本分类器上运行至少一个测试短语以及基于针对每个相应的至少一个测试短语计算的得分来标识单独的预测分类标记,由计算机系统将合计在所述得分中的多个提取特征分解为针对所述至少一个测试短语中的每个词的多个词级得分;
由所述计算机系统向所述多个词级得分中的每个词级得分分配单独的热图值,每个相应的单独的热图值反映所述多个词级得分中的每个词级得分的权重;以及
由所述计算机系统输出所述单独的预测分类标记和反映所述多个词级得分中的每个词级得分的所述权重的每个单独的热图值,以用于定义标识所述至少一个测试短语中的每个词对于所述单独的预测分类标记的贡献的热图。
2.根据权利要求1所述的方法,进一步包括以下步骤:
响应于运行所述至少一个测试短语,针对多个分类标记中的每个单独的预测分类标记,由所述计算机系统按词合计所述多个词级得分;
针对每个单独的预测分类标记,由所述计算机系统按照从最高按词合计的得分递减的顺序标识多个词中的首选词列表;以及
由所述计算机系统输出所述单独的预测分类标记、每个单独的热图值和针对每个相应的单独的预测分类标记的所述首选词列表。
3.根据权利要求1所述的方法,进一步包括以下步骤:
由所述计算机系统基于所述多个特征中的单独的提取特征的多个组合的加权和、以及在所述预先训练的文本分类器中固定的加权模型参数来计算针对所述单独的预测分类标记的得分。
4.根据权利要求1所述的方法,其中,由所述计算机系统将合计在所述得分中的多个提取特征分解为针对所述至少一个测试短语中的每个词的多个词级得分的步骤进一步包括以下步骤:
由所述计算机系统分解所述多个提取特征,所述多个提取特征包括以下中的一个或多个:基于一元语法的特征,基于术语的特征,词嵌入特征的平均池化,词嵌入特征的最大池化,以及字符级特征。
5.根据权利要求1所述的方法,进一步包括以下步骤:
由所述计算机系统启动文本分类器模型;
由所述计算机系统通过应用具有多个训练短语的训练集来训练所述文本分类器模型;
由所述计算机系统将所述文本分类器模型部署为所述预先训练的文本分类器以供客户端测试;以及
响应于从所述客户端接收到所述至少一个测试短语,由所述计算机系统在所述预先训练的文本分类器上运行所述至少一个测试短语。
6.根据权利要求1所述的方法,其中,由所述计算机系统输出所述单独的预测分类标记和反映所述多个词级得分中的每个词级得分的所述权重的每个单独的热图值以用于提供标识所述至少一个测试短语中的每个词对于所述单独的预测分类标记的贡献的热图的步骤进一步包括以下步骤:
由所述计算机系统向客户端输出所述单独的预测分类标记和反映所述多个词级得分中的每个词级得分的所述权重的每个单独的热图值,其中,所述客户端在用户界面中输出每个单独的热图值,以用于以图形的方式表示每个词级得分的所述权重,以标识所述至少一个测试短语中的每个词对于所述单独的预测分类标记的贡献。
7.根据权利要求1所述的方法,其中,由所述计算机系统输出所述单独的预测分类标记和反映所述多个词级得分中的每个词级得分的所述权重的每个单独的热图值以用于提供标识所述至少一个测试短语中的每个词对于所述单独的预测分类标记的贡献的热图的步骤进一步包括以下步骤:
由所述计算机系统向客户端输出所述单独的预测分类标记和反映所述多个词级得分中的每个词级得分的所述权重的每个单独的热图值,其中,所述客户端确定每个单独的预测分类标记是否与期望的分类标记相匹配以用于客户端评估文本分类异常。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010273725.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:估计对象的可见性的方法
- 下一篇:芯片连接器组合及其预载支撑结构