[发明专利]一种中文地址名词分层级的方法和装置有效
申请号: | 201811034393.2 | 申请日: | 2018-09-05 |
公开(公告)号: | CN109284358B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 党越 | 申请(专利权)人: | 普信恒业科技发展(北京)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/284;G06K9/62 |
代理公司: | 上海衡方知识产权代理有限公司 31234 | 代理人: | 朱穆峰 |
地址: | 100022 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种中文地址名词分层级的方法和装置,不依赖地址关键词词典,对大量地址名词进行前处理,采用HSMM方法建立训练模型,解码得到地址名词中每个地址段的层级,极大的提高了地址名词划分层级的效率,提高了中文地址的识别准确度,为地址相似度计算提供了精准的比对基础。相比现有基于规则的方法通过人工创建各个层级的地址关键词词典进行匹配切分地址段的方式,本发明省去整理地址关键词词典的工作,节省了人力、物力,并有效解决了地址关键词省略、出现地址关键词的集外词、切分歧义时分层错误的问题。 | ||
搜索关键词: | 一种 中文 地址 名词 层级 方法 装置 | ||
【主权项】:
1.一种中文地址名词分层级的方法,其特征在于,包括:收集多个地址名词,进行前处理,作为训练数据;模型训练,以K个隐状态的HSMM算法对前处理后的地址层级建模,每个状态表示层级的标签,其中K为正整数;解码,采用上一步骤中训练好的HSMM模型及参数,求解待分层的地址名词中每个词的层级。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普信恒业科技发展(北京)有限公司,未经普信恒业科技发展(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811034393.2/,转载请声明来源钻瓜专利网。