[发明专利]一种建筑工程质量验收规范问答系统及其构建方法在审
申请号: | 201911350236.7 | 申请日: | 2019-12-24 |
公开(公告)号: | CN111104503A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 钟波涛;骆汉宾;丁烈云;何万磊;黄子韦;潘杏 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/31;G06F16/35;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智;孔娜 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 建筑 工程质量 验收 规范 问答 系统 及其 构建 方法 | ||
1.一种建筑工程质量验收规范问答系统,其特征在于,包括问答数据库、预处理模块、问题分类模块和问题匹配模块,其中:
所述问答数据库为包含段落、问题、答案三元组的建筑工程质量验收规范数据集;
所述预处理模块用于对用户输入的问题进行预处理,以对其进行分词,并去除其中的停用词和特殊字符;
所述问题分类模块用于对预处理后的问题进行分类;
所述问题匹配模块用于根据分类后的问题,通过基于R-NET阅读理解的问答模型由所述问答数据库得到该问题对应的答案。
2.如权利要求1所述的建筑工程质量验收规范问答系统,其特征在于,所述基于R-NET阅读理解的问答模型包括编码层、问题集成层、段落匹配层和指针网络层,其中:
所述编码层用于将问题和问答数据库中的段落进行编码,得到问题和段落的向量表征;
所述问题集成层用于将问题向量表征集成到段落向量表征中;
所述段落匹配层用于将集成了问题向量表征的段落向量表征与段落自身进行匹配,对段落向量表征进行调整,从而确定问题对应的答案所在范围;
所述指针网络层用于在答案所在范围内预测答案的开始和结束位置,并提取答案。
3.如权利要求2所述的建筑工程质量验收规范问答系统,其特征在于,所述问题集成层通过门控注意力机制,将问题向量表征集成到段落向量表征中。
4.如权利要求2所述的建筑工程质量验收规范问答系统,其特征在于,所述段落匹配层通过自匹配注意力机制,对段落向量表征进行调整。
5.一种如权利要求1-4任一项所述的建筑工程质量验收规范问答系统的构建方法,其特征在于,包括如下步骤:
S1收集关于建筑工程质量验收规范的数据集,并将该数据集构建为段落、问题、答案三元组,得到问答数据库;
S2对问答数据库中的段落和问题进行分词,训练分词模型,并将该分词模型存入预处理模块,然后去除问答数据库中数据的停用词和特殊字符;
S3构建问题分类模型,并通过问答数据库中数据对该问题分类模型进行训练和测试,然后将该分类模型存入问题分类模块;
S4根据数据库中数据得到问题和答案的对应关系训练基于R-NET阅读理解的问答模型,然后将该问答模型存入问题匹配模块,完成问答系统的构建。
6.如权利要求5所述的建筑工程质量验收规范问答系统的构建方法,其特征在于,所述S1中得到问答数据库,具体包括如下步骤:
S11收集建筑工程质量验收规范中的条款,并去除其中的无效文本,得到关于建筑工程质量验收规范的数据集;
S12将数据集中带编号的条款视为段落,并从段落中提取出相应问题和答案,构建段落、问题、答案三元组,得到问答数据库。
7.如权利要求5所述的建筑工程质量验收规范问答系统的构建方法,其特征在于,所述S3中构建分类模型,具体包括如下步骤:
S31对问答数据库中的问题进行分类,将分类后的问题一部分标记为训练集,另一部分标记为测试集;
S32构建问题分类模型,并通过所述训练集对问题分类模型进行训练,通过所述测试集对问题分类模型进行测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911350236.7/1.html,转载请声明来源钻瓜专利网。