[发明专利]一种企业信息处理系统及方法在审
申请号: | 202211458882.7 | 申请日: | 2022-11-17 |
公开(公告)号: | CN116186234A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 黄旭江 | 申请(专利权)人: | 上海倍通医药科技咨询有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/338;G06F16/33;G06F40/284 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 任曼怡;张鑫 |
地址: | 200001 上海市黄浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 企业 信息处理 系统 方法 | ||
本发明公开了一种企业信息处理系统及方法。本发明提供了一种用于医药流向数据清洗的企业信息处理方法,该方法包括:接收来自其他系统或用户的企业信息集和指令输入,其中,企业信息集包含至少一条企业信息;确定指令输入是分词指令输入、匹配指令输入还是去重指令输入;以及响应于该确定,选择性地执行多维度分词过程、多维度匹配过程或去重过程。
技术领域
本发明总体上涉及医药流向数据清洗领域,并且具体地涉及一种企业信息处理系统及方法。
背景技术
目前,企业在为医药企业提供流向数据服务、清洗流向数据的过程中,需要人工首先从企业信息中提取关键信息,这依赖于对企业信息的预处理(诸如分词)和关键词提取;接着从企业主数据信息或互联网检索企业信息并识别是否相配,这依赖于企业信息的处理和匹配度的确定和计算;然后建立企业信息到目标企业信息的匹配关系,最后完成转换并最终实现流向数据的清洗。
但是,人工方法存在人力成本高、易出错的缺点;并且现有的企业信息处理、匹配方法依赖于单一的文本段划分和字符串比较,分词准确度不高、针对性不强,由此难以快速、准确地获得企业信息到目标企业信息的相应匹配关系。
发明内容
本发明提供了用于医药流向数据清洗的企业信息处理系统和方法。系统或用户通过向企业信息处理系统输入企业信息及不同指令(例如:分词、匹配、查重等),使得该企业信息处理系统能够自动地根据不同指令或输出企业信息维度词组集、或输出相配的企业信息与目标企业信息的映射集合、或输出目标企业信息集已移除相同企业信息的二者映射集合,满足用户用于企业信息互联网检索、企业信息匹配转换、企业信息查重等不同场景的应用需求。其中,企业信息处理系统基于预定义的词库及规则对企业信息集进行逐级拆分处理,实现企业信息到维度词组的转换,分词精准,极大的降低了企业信息分词人力成本。在此基础上,企业信息处理系统对分词模块拆分的企业信息维度词组集和从目标企业信息库获得的目标企业信息维度词组集进行对比计算,由此实现了企业信息到目标企业信息的匹配,匹配快速、准确、命中率高,并且极大地降低了企业信息匹配人力成本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海倍通医药科技咨询有限公司,未经上海倍通医药科技咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211458882.7/2.html,转载请声明来源钻瓜专利网。