[发明专利]一种基于可重构大数据知识图谱技术的产权交易方法有效

申请号：	201911038314.X	申请日：	2019-10-29
公开（公告）号：	CN110910243B	公开（公告）日：	2020-07-10
发明（设计）人：	陈伟;王红宝;李丽;李维新;范作文;霍建建;王浥尘;刘豪;吴洋;李丽华	申请（专利权）人：	山东佳联电子商务有限公司;佳联国际拍卖有限公司
主分类号：	G06Q40/04	分类号：	G06Q40/04;G06Q50/18;G06F16/28;G06N3/04;G06N3/08
代理公司：	济南金迪知识产权代理有限公司 37219	代理人：	许德山
地址：	250000 山东省济南市历下区高***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于可重构大数据知识图谱技术产权交易方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于可重构大数据知识图谱技术的产权交易方法，其特征在于，包括步骤如下：

(1)采集各产权交易相关网站的产权交易行业的数据；产权交易行业的数据包括项目数据、企业数据、交易数据；项目数据是指各个项目类型的各种相关信息，项目类型包括房产、土地、车辆、设备、农村产权、债权、知识产权；企业数据是指每个企业的相关信息；交易数据是指项目与企业的交易历史数据，包括与该项目交易的企业的统一社会信用代码及评分，评分是反应该企业交易的成功率的数字；

(2)训练Bert-BiLSTM-CRF模型，包括：

A、使用开源的doccano工具对产权交易行业的数据进行数据标注，导出标注的关键词结果；

B、将步骤A获取的NER BIO格式的数据输入Bert-BiLSTM-CRF模型进行训练，得到训练好的模型；

(3)将当前需要分析的产权交易行业的数据输入步骤(2)得到的训练好的Bert-BiLSTM-CRF模型，得到抽取出的产权交易行业的数据的关键信息；关键信息包括实体、实体的属性、及实体间的关系；

(4)将步骤(3)抽取出的产权交易行业的数据的实体、实体的属性、及实体间的关系分别存储为知识图谱的节点、节点的属性以及节点间的关系，并将该知识图谱保存到neo4j数据库中；

(5)行业专家对步骤(4)获取neo4j数据库中的知识图谱进行手工修正、重构；由此，生成了项目数据、企业数据及交易数据对应的知识图谱；

(6)使用知识图谱+多层神经网络模型的方式进行项目匹配；

步骤(6)中，使用知识图谱+多层神经网络模型的方式进行项目匹配，是指：使用基于图遍历原理的算法进行项目与企业之间的关联性分析，包括步骤如下：

C、对于步骤(5)中每个项目数据生成的对应的知识图谱均进行如下操作：

设定空向量数组V，并加入项目id，设定空向量数组KeyProps，并加入项目id；从该知识图谱的根节点开始，根节点不参与计算，使用深度优先遍历算法进行遍历，对每一个节点Node，如果该节点是叶子节点，获取该节点的属性对应的值，将该值加入向量数组V，将该节点Node的节点间的关系加入向量数组KeyProps，遍历完整个知识图谱，向量数组V是该知识图谱的所有叶子节点的属性的值的向量集合，项目id是指项目的唯一标识；KeyProps是该知识图谱的所有叶子节点的节点间的关系的集合；

D、交易数据生成的对应的知识图谱中节点的属性包括企业的统一社会信用代码及评分，评分是指交易成功的概率；

从步骤(5)中所有交易数据生成的对应的知识图谱中匹配出项目id对应的交易数据生成的对应的知识图谱，并对该知识图谱中的每个叶子节点进行如下操作：

判断该叶子节点Node的属性对应的值是否为统一社会信用代码，如果是，则将该值添加到向量数组V，否则，不做任何处理；

并将该值对应的该节点Node的节点间的关系加入向量数组KeyProps；

对知识图谱中的每个叶子节点操作完成后，每个叶子节点生成一个V，如果该图谱叶子节点数为M，则生成M个V向量；

同时，从步骤(5)中所有交易数据生成的对应的知识图谱中匹配出项目id对应的交易数据生成的对应的知识图谱，并对该知识图谱中的每个叶子节点进行如下操作：

设定空向量列表Y；

判断该叶子节点Node的属性对应的值是否为评分，如果是，则将该值添加到向量数组Y，否则，不做任何处理；V向量与向量列表Y一一对应；

E、对步骤D生成的所有的向量数组V及向量列表Y进行归一化处理；向量数组V中的项目id不用进行归一化处理；

F、多层神经网络模型采用梯度下降算法来进行优化训练，包括：

①多层神经网络模型训练：

通过多层神经网络模型训练项目匹配的算法，将向量列表Y并入向量数组V，作为向量数组V中的最后一项，由项目各特征向量V＝[X1,X2,X3…Xn]与特征向量权值W＝[W1,W2,W3…Wn]的内积y1向量与偏移量B＝[b1,b2,b3….bn]相加得到最终评分Y，匹配公式如下所示：