[发明专利]一种基于电子投标文件比对的围串标行为检测方法及装置在审
申请号: | 202111612185.8 | 申请日: | 2021-12-27 |
公开(公告)号: | CN114492323A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 陈荣木;林傅荣;童晓婷;林妍;陈小雷;林镇勋;牛京杰;查道鹏 | 申请(专利权)人: | 博思数采科技发展有限公司 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F40/194;G06F40/289;G06F40/295;G06K9/62;G06Q30/02;G06Q30/08 |
代理公司: | 福州市鼓楼区京华专利事务所(普通合伙) 35212 | 代理人: | 王美花 |
地址: | 350005 福建省福州市长乐*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 电子 投标 文件 围串标 行为 检测 方法 装置 | ||
1.一种基于电子投标文件比对的围串标行为检测方法,其特征在于:包括:
步骤1、将投标文件转换为纯文本,将纯文本进行去噪,并将其中和招标的采购文件中信息一致的内容去除,得到有效文本文档;
步骤2、将所有的有效文本文档进行分句,筛选其中设定句子,并计算句子的simhash值,将不同有效文本文档的相似句子查找出来,并将其中连续的句子拼接,得到相似信息;
步骤3、将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;
步骤4、根据法规、步骤2中得到信息以及步骤3中得到信息进行对比判断投标人是否为围串标行为。
2.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法,其特征在于:还包括步骤5、根据设定需求将步骤2中的信息、步骤3中的信息以及步骤4中的结果进行显示。
3.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法,其特征在于:所述步骤2进一步具体为:根据设定的标点符号作为句子的分隔符将所有的有效文本文档进行分句;
筛选其中设定句子:首先将同一有效文本文档中相同的句子做去重处理,然后将选出长度大于预设定长度的句子;
计算每句选出句子的simhash值;
遍历取出一有效文本文档的所有simhash值,依次和另一有效文本文档的所有simhash值做海明距离计算;将海明距离小于预设值的两组simhash值所对应的句子标记为相似句子;若其中存在连续的句子,则进行拼接,得到相似信息。
4.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法,其特征在于:所述步骤3进一步具体为:将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;
所述基础关键信息包括:中文姓名、电话号码、地址、电子邮箱以及公司名称;
所述中文姓名提取:基于mmseg算法以及中文姓氏词库,将有效文本文档中的姓名信息识别并提取出来,并将提取出的姓名信息存储进数据库中;
所述电话号码提取:使用正则表达式提取出有效文本文档中的电话号码,并将提取出的电话号码信息存储进数据库中;
所述地址提取:基于mmseg算法、行政区划词库及地址词库,将有效文本文档中地址信息识别并提取出来,并将提取出的地址信息存储进数据库中;
所述电子邮箱提取:使用正则表达式提取出有效文本文档中的电子邮箱信息,并将提取出的电子邮箱信息存储进数据库中;
所述公司名称提取:基于mmseg算法以及公司名称词库,将有效文本文档中的公司名称信息识别并提取出来,并将提取出的公司名称信息存储进数据库中;
所述报价信息:根据供应商从数据库中获取对应的报价信息;
所述供应商电子投标文件制作信息:在供应商上传电子投标文件时,记录下该电子投标文件加密电脑以及上传电脑的mac地址和ip地址;
所述投标保证金缴交账户信息:在供应商缴交保证金时,记录下供应商的转出账户户号以及转入的唯一虚拟保证金户号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博思数采科技发展有限公司,未经博思数采科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111612185.8/1.html,转载请声明来源钻瓜专利网。