[发明专利]一种面向招标文本的信息抽取方法在审
申请号: | 201810513564.3 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108874771A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 刘漳辉;陈艺燕;陈星;郭晨皓 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种面向招标文本的信息抽取方法,包括:对招标文件进行规范化处理;根据所需要抽取的信息,建立对应的关键词列表;逐句读取招标文件的文本内容,使用jieba分词逐句对招标文件的文本进行分词与标注词性处理;将分词结果进行存储,作为后续抽取操作的输入数据,完成预处理;通过调用预设信息抽取模块,根据目标招标信息,对预处理过的文本采用对应匹配抽取方式进行对应的招标信息抽取操作,获取抽取结果。本发明提出的一种面向招标文本的信息抽取方法,利用自然语言处理领域的技术实现对招标文本中特定信息进行抽取并将获得的信息以结构化的形式给予描述。通过对招标文本的信息抽取为招标信息的提取提供更有力的获取工具。 | ||
搜索关键词: | 文本 抽取 信息抽取 招标文件 招标信息 招标 预处理 分词 自然语言处理 读取 抽取模块 词性处理 分词结果 技术实现 文本内容 预设信息 结构化 调用 标注 匹配 存储 规范化 | ||
【主权项】:
1.一种面向招标文本的信息抽取方法,其特征在于,包括如下步骤:步骤S1:对招标文件进行规范化处理;步骤S2:根据所需要抽取的信息,建立对应的关键词列表;步骤S3:逐句读取招标文件的文本内容,使用jieba分词逐句对招标文件的文本进行分词与标注词性处理;将分词结果进行存储,作为后续抽取操作的输入数据,完成预处理;步骤S4:通过调用预设信息抽取模块,根据目标招标信息,对预处理过的文本采用对应匹配抽取方式进行对应的招标信息抽取操作,获取抽取结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810513564.3/,转载请声明来源钻瓜专利网。