[发明专利]使用随机序列嵌入的符号序列分析的计算效率在审
申请号: | 201980030031.2 | 申请日: | 2019-05-03 |
公开(公告)号: | CN112470172A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 吴凌飞;许坤;陈品谕;陈家佑 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06N20/10;G06N3/04 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 吴信刚 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 随机 序列 嵌入 符号 分析 计算 效率 | ||
提供了一种分析符号序列的方法和系统。从所有者的计算设备接收符号序列的元数据。基于所接收的元数据来生成R个随机序列的集合,并且将其发送到所述符号序列的所有者的计算设备,以便基于所述R个随机序列的集合和所述符号序列来计算特征矩阵。从所有者的计算设备接收特征矩阵。在确定特征矩阵的内积低于阈值准确度时,迭代过程返回到生成R个随机序列。在确定特征矩阵的内积等于或高于阈值准确度时,基于机器学习对特征矩阵进行分类。经分类的全局特征矩阵被发送以显示在所有者的计算设备的用户界面上。
技术领域
本公开总体上涉及线性序列(linear sequences)的分类,并且更具体地涉及基于云的敏感数据的符号序列分析。
背景技术
近年来,字符串分类(string classification)已发展为核心学习任务,且在许多应用(包含计算生物学、文本分类和音乐分类)中取得相当大的兴趣。字符串数据中的一个挑战涉及在序列中不存在明确的特征。如本文所使用的,特征是被观察的现象的个体可测量的特性或特性。即使利用先进的特征(characteristic)选择技术,潜在特征的维度可能仍然较高,并且难以捕获特征的顺序性质。这使得序列分类比对特征向量分类更具挑战性的任务。
因此,本领域需要解决上述问题。
发明内容
从第一方面来看,本发明提供了一种用于分析数据的计算设备,该设备包括:处理器;网络接口,其耦合到所述处理器以实现通过网络的通信;存储装置,其耦合到所述处理器;存储在所述存储设备中的分析引擎,其中所述处理器对所述分析引擎的执行将所述计算设备配置成执行动作,所述动作包括:从所述符号序列的所有者的计算设备接收所述符号序列的元数据;基于所接收的元数据来生成R个随机序列的集合;通过所述网络向所述符号序列的所有者的计算设备发送所述R个随机序列的集合,以便基于所述R个随机序列的集合和所述符号序列来计算特征矩阵;从所述符号序列的所有者的计算设备接收所述特征矩阵;在确定所述特征矩阵的内积低于阈值准确度时,返回到基于所接收的元数据生成R个随机序列的集合的步骤;在确定所述特征矩阵的内积等于或高于所述阈值准确度时:将所述特征矩阵标识为全局特征矩阵;基于机器学习对所述全局特征矩阵进行分类;以及发送所述经分类的全局特征矩阵以在所述符号序列的所有者的所述计算设备的用户界面上显示。
从另一方面来看,本发明提供了一种用于分析数据的方法,所述方法包括:从所述符号序列的所有者的计算设备接收所述符号序列的元数据;基于所接收的元数据来生成R个随机序列的集合;向所述符号序列的所有者的计算设备发送所述R个随机序列的集合,以便基于所述R个随机序列的集合和所述符号序列来计算特征矩阵;从所述符号序列的所有者的计算设备接收所述特征矩阵;在确定所述特征矩阵的内积低于阈值准确度时,返回到基于所接收的元数据生成R个随机序列的集合的步骤;在确定所述特征矩阵的内积等于或高于所述阈值准确度时:将所述特征矩阵标识为全局特征矩阵;基于机器学习对所述全局特征矩阵进行分类;以及发送所述经分类的全局特征矩阵以在所述符号序列的所有者的所述计算设备的用户界面上显示。
从另一方面来看,本发明提供了一种计算设备,包括:处理器;网络接口,其耦合到所述处理器以实现通过网络的通信;存储装置,其耦合到所述处理器;存储在所述存储设备中的分析引擎,其中所述处理器对所述分析引擎的执行将所述计算设备配置成执行动作,所述动作包括:从符号序列的所有者的计算设备接收对于数据分析的请求;创建表示所述符号序列的所有者的所述计算设备的符号序列的字母表的概率分布的人工元数据;基于所述人工元数据生成R个随机序列的集合;通过所述网络向所述符号序列拥有者的所述计算设备发送所述R个随机序列的集合,以便基于所述R个随机序列的集合和所述符号序列来计算特征矩阵;从所述符号序列的所有者的计算设备接收所述特征矩阵;在确定所述特征矩阵的内积低于阈值准确度时,返回到基于所述人工元数据生成R个随机序列的集合的步骤;在确定所述特征矩阵的内积等于或高于所述阈值准确度时:将所述特征矩阵标识为全局特征矩阵;基于机器学习对所述全局特征矩阵进行分类;以及发送所述经分类的全局特征矩阵以在所述符号序列的所有者的所述计算设备的用户界面上显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980030031.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:防眩光玻璃板
- 下一篇:用于铝阳极氧化处理的电极