[发明专利]一种基于可重构大数据知识图谱技术的产权交易方法有效
申请号: | 201911038314.X | 申请日: | 2019-10-29 |
公开(公告)号: | CN110910243B | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 陈伟;王红宝;李丽;李维新;范作文;霍建建;王浥尘;刘豪;吴洋;李丽华 | 申请(专利权)人: | 山东佳联电子商务有限公司;佳联国际拍卖有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q50/18;G06F16/28;G06N3/04;G06N3/08 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 许德山 |
地址: | 250000 山东省济南市历下区高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 可重构大 数据 知识 图谱 技术 产权交易 方法 | ||
1.一种基于可重构大数据知识图谱技术的产权交易方法,其特征在于,包括步骤如下:
(1)采集各产权交易相关网站的产权交易行业的数据;产权交易行业的数据包括项目数据、企业数据、交易数据;项目数据是指各个项目类型的各种相关信息,项目类型包括房产、土地、车辆、设备、农村产权、债权、知识产权;企业数据是指每个企业的相关信息;交易数据是指项目与企业的交易历史数据,包括与该项目交易的企业的统一社会信用代码及评分,评分是反应该企业交易的成功率的数字;
(2)训练Bert-BiLSTM-CRF模型,包括:
A、使用开源的doccano工具对产权交易行业的数据进行数据标注,导出标注的关键词结果;
B、将步骤A获取的NER BIO格式的数据输入Bert-BiLSTM-CRF模型进行训练,得到训练好的模型;
(3)将当前需要分析的产权交易行业的数据输入步骤(2)得到的训练好的Bert-BiLSTM-CRF模型,得到抽取出的产权交易行业的数据的关键信息;关键信息包括实体、实体的属性、及实体间的关系;
(4)将步骤(3)抽取出的产权交易行业的数据的实体、实体的属性、及实体间的关系分别存储为知识图谱的节点、节点的属性以及节点间的关系,并将该知识图谱保存到neo4j数据库中;
(5)行业专家对步骤(4)获取neo4j数据库中的知识图谱进行手工修正、重构;由此,生成了项目数据、企业数据及交易数据对应的知识图谱;
(6)使用知识图谱+多层神经网络模型的方式进行项目匹配;
步骤(6)中,使用知识图谱+多层神经网络模型的方式进行项目匹配,是指:使用基于图遍历原理的算法进行项目与企业之间的关联性分析,包括步骤如下:
C、对于步骤(5)中每个项目数据生成的对应的知识图谱均进行如下操作:
设定空向量数组V,并加入项目id,设定空向量数组KeyProps,并加入项目id;从该知识图谱的根节点开始,根节点不参与计算,使用深度优先遍历算法进行遍历,对每一个节点Node,如果该节点是叶子节点,获取该节点的属性对应的值,将该值加入向量数组V,将该节点Node的节点间的关系加入向量数组KeyProps,遍历完整个知识图谱,向量数组V是该知识图谱的所有叶子节点的属性的值的向量集合,项目id是指项目的唯一标识;KeyProps是该知识图谱的所有叶子节点的节点间的关系的集合;
D、交易数据生成的对应的知识图谱中节点的属性包括企业的统一社会信用代码及评分,评分是指交易成功的概率;
从步骤(5)中所有交易数据生成的对应的知识图谱中匹配出项目id对应的交易数据生成的对应的知识图谱,并对该知识图谱中的每个叶子节点进行如下操作:
判断该叶子节点Node的属性对应的值是否为统一社会信用代码,如果是,则将该值添加到向量数组V,否则,不做任何处理;
并将该值对应的该节点Node的节点间的关系加入向量数组KeyProps;
对知识图谱中的每个叶子节点操作完成后,每个叶子节点生成一个V,如果该图谱叶子节点数为M,则生成M个V向量;
同时,从步骤(5)中所有交易数据生成的对应的知识图谱中匹配出项目id对应的交易数据生成的对应的知识图谱,并对该知识图谱中的每个叶子节点进行如下操作:
设定空向量列表Y;
判断该叶子节点Node的属性对应的值是否为评分,如果是,则将该值添加到向量数组Y,否则,不做任何处理;V向量与向量列表Y一一对应;
E、对步骤D生成的所有的向量数组V及向量列表Y进行归一化处理;向量数组V中的项目id不用进行归一化处理;
F、多层神经网络模型采用梯度下降算法来进行优化训练,包括:
①多层神经网络模型训练:
通过多层神经网络模型训练项目匹配的算法,将向量列表Y并入向量数组V,作为向量数组V中的最后一项,由项目各特征向量V=[X1,X2,X3…Xn]与特征向量权值W=[W1,W2,W3…Wn]的内积y1向量与偏移量B=[b1,b2,b3….bn]相加得到最终评分Y,匹配公式如下所示:
f(X)=[X1,X2,X3…Xn]*[W1,W2,W3…Wn]+[b1,b2,b3….bn]=Y
公式展开后,即:
X1*W1+b1+X2*W2+b2+X3*W3+b3+…+Xn*Wn+bn=Y;
使用多层神经网络模型使用归一化处理后的向量数组V及向量列表Y中的数据对W和B,进行训练;按7:2:1的比例分为训练集、测试集、验证集;
②使用训练好的多层神经网络模型进行匹配:
多层神经网络模型训练好后,输入项目的向量数组V,即得到一个返回值,即分数;对于一个项目,针对评分进行排序,取前m个,即获得该项目的潜在客户列表,从而完成项目与客户的匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东佳联电子商务有限公司;佳联国际拍卖有限公司,未经山东佳联电子商务有限公司;佳联国际拍卖有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911038314.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于双系统架构的通信方法及终端设备
- 下一篇:一种急诊内科用气胸排气装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置