[发明专利]基于随机索引模式匹配的电子邮件关系查找器系统在审
申请号: | 201680023542.8 | 申请日: | 2016-08-25 |
公开(公告)号: | CN107533574A | 公开(公告)日: | 2018-01-02 |
发明(设计)人: | 卡洛林娜·索敏恩 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/50 | 分类号: | G06F17/50 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 索引 模式 匹配 电子邮件 关系 查找 系统 | ||
1.一种识别相似电子消息的装置,其特征在于,所述装置包括:
处理器;
所述处理器,用于:
检测第一电子消息;
检测所述第一电子消息中的一个或多个有效词的词集;
将检测到的所述第一电子消息中的一个或多个有效词的词集与来自多个其他电子消息的一个或多个有效词的词集进行比较;
呈现至少一个来自所述多个其他电子消息的第二电子消息,其中,所述多个其他电子消息包括与所述检测到的所述第一电子消息中的一个或多个有效词的词集相似的一个或多个有效词的词集。
2.根据权利要求1所述的装置,其特征在于,所述处理器用于通过以下方式检测所述第一电子消息中的一个或多个有效词的词集:
识别所述第一电子消息中的一个或多个单词;
从所识别的一个或多个单词中减去普通语言单词,形成剩余词集;
其中,所述剩余词集包括所述一个或多个有效词的词集。
3.根据权利要求1至2任意一项所述的装置,其特征在于,所述处理器用于将所述第一电子消息中的一个或多个有效词的词集转化为机器可读格式。
4.根据权利要求1至3任意一项所述的装置,其特征在于,所述处理器用于:
将所述第一电子消息中的一个或多个有效词的词集作为向量呈现,其中所述多个其他电子消息中的每组一个或多个有效词的词集作为向量呈现;
计算表示所述第一电子消息中的一个或多个有效词的词集的向量与所述多个其他电子消息中的每个向量之间的余弦距离;
使用所计算的余弦距离来识别来自与所述第一电子消息相似的多个其他电子消息中的至少一个其他电子消息。
5.根据权利要求1至4任意一项所述的装置,其特征在于,所述处理器用于通过以下方式检测所述第一电子消息中的一个或多个有效词的词集:
检测所述第一电子消息中的单词;
识别检测到的单词对应的向量,或者如果没有识别出所检测到的单词对应的向量,则为检测到的单词生成新向量;
使用所述第一电子消息中的每个单词对应的向量为所述第一电子消息编码转换矩阵;
从为所述第一电子消息编码的转换矩阵中减去普通语言转换矩阵;
其中,减法的结果对应于所述第一电子消息中的一个或多个有效词的词集。
6.根据前述权利要求1至5任意一项的装置,其特征在于,所述处理器用于通过随机索引系统检测所述第一电子消息中的一个或多个有效词的词集。
7.根据权利要求5至6任意一项所述的装置,其特征在于,所述处理器用于:
将减法的结果编码为向量表示;
将所述向量表示与向量表示的矩阵进行比较,其中所述矩阵中的每个向量表示与标识符相关联;
将标识符与所述向量表示相关联,其中,如果所述向量表示与所述矩阵中的现有向量表示不相似,则所述标识符包括新标识符,或者如果所述向量表示与所述矩阵中的现有向量表示相似,则所述矩阵中的现有向量表示的标识符;
识别具有相同标识符的其他电子消息,所述具有相同标识符的其他电子消息包括所述相似电子消息。
8.根据权利要求7所述的装置,其特征在于,所述处理器用于通过余弦相似度度量来确定所述向量表示是否与所述矩阵中的现有向量表示相似。
9.根据权利要求1至8任意一项所述的装置,其特征在于,所述装置包括用户界面,其中,所述处理器用于在所述用户界面的第一部分中呈现所述第一电子消息,并在所述用户界面的第二部分中呈现所述第二电子消息。
10.根据权利要求1至9任意一项所述的装置,其特征在于,所述第一电子消息包括电子通信应用的打开的电子消息。
11.根据权利要求10所述的装置,其特征在于,所述电子通信应用是电子邮件应用、聊天应用或社交媒体应用。
12.根据权利要求1至11所述的装置,其特征在于,所述第一电子消息是电子邮件、聊天消息、博客记录,或社交媒体记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680023542.8/1.html,转载请声明来源钻瓜专利网。