[发明专利]跨语言文本分类在审
申请号: | 201910082027.2 | 申请日: | 2019-01-28 |
公开(公告)号: | CN110096588A | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | S·B·特亚马贡德鲁·纳加布尚 | 申请(专利权)人: | 埃森哲环球解决方案有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 爱尔兰*** | 国省代码: | 爱尔兰;IE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 数据结构 字符表示 卷积神经网络 集合 语言文本 子采样 推理 分类 并行卷积 文档获得 合并 连接层 池化 卷积 嵌入 应用 关联 概率 配置 | ||
本公开的实施例涉及跨语言文本分类。设备可以被配置为从文档获得文本。设备可以执行嵌入以获得指示与文本中所包括的字符相关联的概率的数据结构,并且将第一卷积应用于数据结构以获得文本中所包括的字符的不同表示。另外,设备可以将并行卷积应用于不同表示以获得字符表示的多个集合,对字符表示的多个集合进行子采样,并且将经子采样后的字符表示的多个集合池化到合并数据结构中。设备可以向卷积神经网络的全连接层提供合并数据结构以产生表示文本的特征的数据;并且向卷积神经网络的推理层提供表示文本的特征的数据,推理层提供指示针对文本的分类的数据。
技术领域
本公开的实施例涉及文本分类的领域,并且更具体地涉及跨语言文本分类。
背景技术
文本分类(也被称为文档分类)是将一个或多个分类、标签或类别指派给文档或文本的其它主体的方法。可以以各种方式(例如,根据主题、意图、类型和/或其它属性)并且出于各种原因(例如,为了组织文本、对文本进行排序、搜索文本等)来对文本进行分类。
发明内容
根据一些实施方式,设备可以包括:一个或多个存储器设备;以及一个或多个处理器,该一个或多个处理器被通信地连接至一个或多个存储器设备,以:从文档获得文本;执行嵌入以获得指示与文本中所包括的字符相关联的概率的数据结构;将第一卷积应用于数据结构以获得文本中所包括的字符的不同表示;将并行卷积应用于不同表示以获得字符表示的多个集合;对字符表示的多个集合进行子采样;将子采样后的字符表示的多个集合池化到合并数据结构中;将合并数据结构提供给卷积神经网络的全连接层以产生表示文本的特征的数据;以及将表示文本的特征的数据提供给卷积神经网络的推理层,该推理层提供指示针对文本的分类的数据。
根据一些实施方式,方法可以包括:通过设备,从训练文档获得文本;通过设备,获得指示与训练文档相关联的输入分类的数据;通过设备,执行嵌入以获得指示与文本中所包括的字符相关联的概率的字符向量;通过设备,将层叠卷积应用于字符向量以获得文本中所包括的字符的不同表示;通过设备,将并行卷积应用于不同表示以获得字符表示的多个集合;通过设备,对字符表示的多个集合进行子采样;通过设备,池化子采样后的字符表示的多个集合以获得与文本相关联的合并特征向量;通过设备,将合并向量提供给卷积神经网络的全连接层以产生表示文本的特征的数据;通过设备,将表示文本的特征的数据提供给卷积神经网络的推理层,该推理层提供指示针对文本的一个或多个分类的数据;以及通过设备,使用随机梯度下降、指示输入分类的数据和指示一个或多个分类的数据通过反向传播来训练卷积神经网络。
根据一些实施方式,非瞬态计算机可读介质可以存储指令,该指令包括:一个或多个指令,该一个或多个指令在由一个或多个处理器执行时使一个或多个处理器:从第一文档获得第一文本;执行嵌入以获得指示与第一文本中所包括的字符相关联的概率的字符向量;将第一卷积应用于字符向量以获得第一文本中所包括的字符的不同表示;将并行卷积应用于不同表示以获得字符表示的多个集合,并行卷积中所包括的卷积的每个性能不同于并行卷积中所包括的卷积的其它性能;对字符表示的多个集合进行子采样;池化字符表示的多个集合以获得合并数据结构;将合并数据结构提供给卷积神经网络的多个全连接层以产生表示第一文本的特征的数据;以及将表示第一文本的特征的数据提供给卷积神经网络的推理层,该推理层提供指示第一文档的第一分类的数据。
在一些实施例中,一种设备,包括:一个或多个存储器设备;以及一个或多个处理器,一个或多个处理器被通信地连接至一个或多个存储器设备,以:从文档获得文本;执行嵌入,以获得指示与文本中所包括的字符相关联的概率的数据结构;将第一卷积应用于数据结构,以获得文本中所包括的字符的不同表示;将并行卷积应用于不同表示,以获得字符表示的多个集合;对字符表示的多个集合进行子采样;将经子采样后的字符表示的多个集合池化到合并数据结构中;向卷积神经网络的全连接层提供合并数据结构,以产生表示文本的特征的数据;以及向卷积神经网络的推理层提供表示文本的特征的数据,推理层提供指示针对文本的分类的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于埃森哲环球解决方案有限公司,未经埃森哲环球解决方案有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910082027.2/2.html,转载请声明来源钻瓜专利网。