[发明专利]一种基于最大熵的园区产业招商智能咨询方法及系统在审
申请号: | 202210209029.5 | 申请日: | 2022-03-03 |
公开(公告)号: | CN114580407A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 杜登伟;杜登斌;杜乐;杜小军 | 申请(专利权)人: | 武汉东湖大数据交易中心股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/247;G06N20/00;G06Q50/10;G06F16/35;G06F16/332 |
代理公司: | 武汉红观专利代理事务所(普通合伙) 42247 | 代理人: | 李季 |
地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 最大 产业 招商 智能 咨询 方法 系统 | ||
本发明提出了一种基于最大熵的园区产业招商智能咨询方法及系统,其方法包括:收集与园区产业招商相关的历史招商数据,对历史招商数据进行预处理,得到句子集合;将句子集合输入到信息抽取器中提取目标数据,将目标数据存储到招商信息库中;对招商信息库中的所有目标数据进行分词处理和词性识别,得到基本特征分词集合;建立最大熵模型,基于基本特征分词集合对最大熵模型进行训练,得到智能咨询模型,并根据智能咨询模型进行疑问点标注;获取当前用户提出的问题,并输入至智能咨询模型中进行问题分类和回答。本发明基于最大熵建立智能咨询模型,将触发词与对应的事件类型进行匹配,能够在用户咨询时迅速并准确地进行答复,具有较高的灵活性。
技术领域
本发明涉及信息处理技术领域,尤其是涉及一种基于最大熵的园区产业招商智能咨询方法及系统。
背景技术
经济的发展离不开产业园区的合理规划,近年来,越来越多的产业园区通过各种优惠政策吸引产业关联的大量企业入驻园区,使得企业集聚,最终形成产业集群,同时,园区内的企业之间相互竞争、合作,进而实现知识、信息的共享,从而实现生产力的快速发展,因此,园区产业招商尤其重要。
随着信息技术的发展,园区招商引资的信息量剧增,用户咨询业务的任务量繁重,咨询类型也逐渐增加,传统的计算机辅助招商软件在处理这些巨量信息咨询任务时,逐渐表现出时间长、智能化程度底的局限性,不能及时地对客户提出的问题进行答复,需要研究出一种灵活度更高的招商智能咨询方法。
发明内容
有鉴于此,本申请提出了一种基于最大熵的园区产业招商智能咨询方法及系统,用于解决传统的招商系统在处理大量信息咨询任务时反应时间长且智能化程度低的问题。
本发明的技术方案是这样实现的:
本发明提出了一种基于最大熵的园区产业招商智能咨询方法,所述方法包括:
S1,收集与园区产业招商相关的历史招商数据,对历史招商数据进行预处理,得到句子集合;
S2,建立招商信息库,将句子集合输入到信息抽取器中提取目标数据,将目标数据存储到招商信息库中;
S3,对招商信息库中的所有目标数据进行分词处理和词性识别,得到基本特征分词集合;
S4,建立最大熵模型,基于基本特征分词集合对最大熵模型进行训练,得到智能咨询模型,并根据智能咨询模型进行疑问点标注,生成问句库;
S5,获取当前用户提出的问题,并输入至智能咨询模型中进行问题分类和回答,完成园区产业招商的智能咨询。
在以上技术方案的基础上,优选的,步骤S1具体包括:
获取历史招商数据中的所有句子,所有句子中包括若干个相邻句子,判断两个相邻句子是否应当接续,若两个相邻句子应当接续,则进行接续操作,得到接续后的句子;反之不进行接续操作,得到原句子;
将所有接续后的句子和原句子汇集在一起构成句子集合。
在以上技术方案的基础上,优选的,判断两个相邻句子是否应当接续具体包括:
两个相邻句子包括第一句子和第二句子,第一句子在第二句子的前面,当第一句子的句末标点符号不为句号时,则其应与第二句子接续;
当第一句子中存在若干个标点符号对,标点符号对包括左半边与右半边,若第一句子中仅存在左半边且无右半边,则其应与第二句子接续;
当第二句子中存在若干个标点符号对,标点符号对包括左半边与右半边,若第二句子中仅存在右半边且无左半边,则其应与第一句子接续。
在以上技术方案的基础上,优选的,步骤S2具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉东湖大数据交易中心股份有限公司,未经武汉东湖大数据交易中心股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210209029.5/2.html,转载请声明来源钻瓜专利网。