[发明专利]一种基于向量相似度的用户信息检索方法有效
申请号: | 201710820581.7 | 申请日: | 2017-09-13 |
公开(公告)号: | CN107679105B | 公开(公告)日: | 2018-07-17 |
发明(设计)人: | 许元斌;黄文思;章剑涛;罗义旺;李金湖;刘燕秋;陈坤 | 申请(专利权)人: | 国网信通亿力科技有限责任公司;国家电网公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/06 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 赵中璋 |
地址: | 361009 福建省厦门市思*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于向量相似度的用户信息检索方法,包括以下步骤:步骤S100,接收输入数据;步骤S200,获得第X个存储数据;步骤S300,获得输入数据和第X个存储数据的第一相似度S1;如果第一相似度S1大于或等于第一阈值D1,那么执行步骤S300;步骤S400,获得输入数据和第X个存储数据的第二相似度S2;如果第二相似度S2大于或等于第二阈值D2,那么执行步骤S500;步骤S500,将第X个存储数据作为用户信息检索结果;步骤S600,对第X+1个存储数据重复执行步骤S200。根据本发明的方法,能够有效获知与用户信息相似的已经存在的用户信息,提升电力调配的准确性和效率。 | ||
搜索关键词: | 存储数据 相似度 用户信息检索 向量相似度 用户信息 接收输入数据 电力调配 重复执行 获知 | ||
【主权项】:
1.一种基于向量相似度的用户信息检索方法,其特征在于,包括以下步骤:步骤S100,接收输入数据,所述输入数据为输入的用电用户信息,包括第一标志向量F1、第一参数向量P1;步骤S200,获得第X个存储数据,所述存储数据为已经存储的用户信息,每个存储数据均包括第二标志向量F2、第二参数向量P2;其中,F1={f11,f12,f13,......,f1m}、F2={f21,f22,f23,......,f2m};P1={p11,p12,p13,......,p1n}、P2={p21,p22,p23,......,p2n};步骤S300,根据第一标志向量和第X个存储数据的第二标志向量,获得输入数据和第X个存储数据的第一相似度
如果第一相似度S1大于或等于第一阈值D1,那么执行步骤S400;其中,f1i和f2i分别是第i个标志在F1和F2中的值;m为第一、二标志向量中的标志数量;当f1i=f2i时,fi的取值为1,当f1i≠f2i时,fi的取值为0;步骤S400,根据第一参数向量和第X个存储数据的第二参数向量,获得输入数据和第X个存储数据的第二相似度
如果第二相似度S2大于或等于第二阈值D2,那么执行步骤S500;其中,p1i和p2i分别是第i个参数在P1和P2中的值;n为第一、二参数向量中的参数数量;min(p1i,p2i)为p1i和p2i中的最小值,max(p1i,p2i)为p1i和p2i中的最大值;步骤S500,将第X个存储数据作为用户信息检索结果;步骤S600,对第X+1个存储数据重复执行步骤S200;其中,所述输入数据还包括第一用电向量E1={e11,e12,e13,......,e1k},所述存储数据还包括第二用电向量E2={e21,e22,e23,......,e2l};所述方法还包括以下步骤:步骤S700,根据第一用电向量和所述用户信息检索结果中的每个存储数据的第二用电向量,获得输入数据和每个存储数据的用电相似度ES=max(cs1,cs2,cs3,......,cs|k‑l|+1);如果k≤l,那么csj为E2的子向量{e2j,e22,e23,......,e2(j+k‑1)}和E1的余弦距离;如果k>l,那么csj为E1的子向量{e1j,e12,e13,......,e1(j+l‑1)}和E2的余弦距离;其中j的取值范围为1到|k‑l|+1;步骤S800,根据用电相似度,将所有用户信息检索结果进行排序;步骤S900,在显示界面中显示排序后的检索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网信通亿力科技有限责任公司;国家电网公司,未经国网信通亿力科技有限责任公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710820581.7/,转载请声明来源钻瓜专利网。