[发明专利]楼盘数据处理方法、装置、电子设备和存储介质在审
申请号: | 202010366703.1 | 申请日: | 2020-04-30 |
公开(公告)号: | CN111639490A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 李松 | 申请(专利权)人: | 瑞庭网络技术(上海)有限公司 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/194;G06F16/36;G06F16/28 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 吕俊秀 |
地址: | 200120 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 楼盘 数据处理 方法 装置 电子设备 存储 介质 | ||
1.一种楼盘数据处理方法,其特征在于,包括:
获取待处理楼盘数据;
将所述待处理楼盘数据拆分为预设层次结构的数据,得到所述待处理楼盘数据对应的层次结构数据;
将所述层次结构数据与中间楼盘字典的中间字典项进行匹配,确定所述中间楼盘字典中与所述层次结构数据相匹配的中间字典项;
根据相匹配的中间字典项与目标楼盘字典中的目标字典项的关联关系,建立所述待处理楼盘数据与所述目标字典项的关联关系。
2.根据权利要求1所述的方法,其特征在于,所述将所述层次结构数据与中间楼盘字典的中间字典项进行匹配,确定所述中间楼盘字典中与所述层次结构数据相匹配的中间字典项,包括:
按照所述层次结构数据中的层次从高到低的顺序,将所述层次结构数据中每一层次的数据依次与中间楼盘字典中相应层次的中间字典项进行匹配,确定所述中间楼盘字典中与所述层次结构数据每一层次相匹配的中间字典项。
3.根据权利要求2所述的方法,其特征在于,所述将所述层次结构数据与中间楼盘字典的字典项进行匹配,确定所述中间楼盘字典中与所述层次结构数据相匹配的中间字典项,还包括:
若所述层次结构数据中的一个层次的数据与所述中间楼盘字典中相应层次的中间字典项未匹配成功,则在所述中间楼盘字典中增加所述层次对应的中间字典项,作为新增中间字典项;
所述根据所述中间字典项与目标楼盘字典中的目标字典项的关联关系,建立所述待处理楼盘数据与所述目标字典项的关联关系,包括:
计算所述新增中间字典项与目标楼盘字典中相应层次的目标字典项的文本相似度,并确定文本相似度大于预设阈值的目标字典项;
建立并保存所述新增中间字典项与确定的目标字典项的关联关系;
根据新增中间字典项与目标字典项的关联关系,建立待处理楼盘数据与目标字典项的关联关系。
4.根据权利要求2所述的方法,其特征在于,所述预设层次结构包括城市、区域、小区、楼栋单元和房号。
5.根据权利要求1-4任一项所述的方法,其特征在于,还包括:
若无法建立待处理楼盘数据与目标字典项的关联关系,则进行提示;
获取与所述待处理楼盘数据对应的层次结构数据相匹配的新增中间字典项,并获取新增中间字典项与目标楼盘字典中的目标字典项的关联关系,获取待处理楼盘数据与目标楼盘字典中的目标字典项的关联关系;
将所述新增中间字典项保存到所述中间楼盘字典中,并保存新增中间字典项与目标楼盘字典中的目标字典项的关联关系,保存待处理楼盘数据与目标楼盘字典中的目标字典项的关联关系。
6.一种楼盘数据处理装置,其特征在于,包括:
数据获取模块,用于获取待处理楼盘数据;
层次拆分模块,用于将所述待处理楼盘数据拆分为预设层次结构的数据,得到所述待处理楼盘数据对应的层次结构数据;
中间匹配模块,用于将所述层次结构数据与中间楼盘字典的中间字典项进行匹配,确定所述中间楼盘字典中与所述层次结构数据相匹配的中间字典项;
目标关联模块,用于根据相匹配的中间字典项与目标楼盘字典中的目标字典项的关联关系,建立所述待处理楼盘数据与所述目标字典项的关联关系。
7.根据权利要求6所述的装置,其特征在于,所述中间匹配模块包括:
顺序匹配单元,用于按照所述层次结构数据中的层次从高到低的顺序,将所述层次结构数据中每一层次的数据依次与中间楼盘字典中相应层次的中间字典项进行匹配,确定所述中间楼盘字典中与所述层次结构数据每一层次相匹配的中间字典项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞庭网络技术(上海)有限公司,未经瑞庭网络技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010366703.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于视觉的铸件定位方法
- 下一篇:接近检测方法及电子设备