[发明专利]一种需求功能点智能识别系统在审
申请号: | 201811132214.9 | 申请日: | 2018-09-27 |
公开(公告)号: | CN109255127A | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 史建琦;李志辉;黄滟鸿;鲍钰;战云龙;孙文圣 | 申请(专利权)人: | 华东师范大学;上海博预网络科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 200062 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 功能点 句法分析结果 词法分析 句法分析 需求功能 词法分析模块 智能识别系统 自然语言处理 预处理模块 词性标注 命名实体 人工分析 识别系统 智能分析 分词 剔除 统计 | ||
1.一种需求功能点识别系统,其特征在于,包括:
需求规格书预处理模块,用于将需求规格书进行段落拆分,将所述需求规格书的多级标题剔除,得到初级规格书;
词法分析模块,用于将所述初级规格书进行分词、词性标注、命名实体识别,产生词法分析结果;
句法分析模块,用于将所述词法分析结果进行句法分析,产生句法分析结果;
功能点识别模块,用于根据所述句法分析结果进行功能点识别,并统计功能点类别和数量。
2.如权利要求1所述的识别系统,其特征在于,所述需求规格书为需要分析的中文版的需求规格书,所述需求规格书预处理模块利用Lucene框架将所述需求规格书进行段落拆分。
3.如权利要求1所述的识别系统,其特征在于,所述词法分析模块包括:
分词单元,采用基于最大熵分词方法,将字符串频率统计和字符串匹配结合;
词性标注单元,采用基于最大熵的词性标注方法,以高频词性为依据进行标注;
命名实体识别单元,采用条件随机场算法作为判别式概率模型。
4.如权利要求3所述的识别系统,其特征在于,所述词法分析模块采用神经网络模型,进行分词、词性标注、命名实体识别。
5.如权利要求4所述的识别系统,其特征在于,所述神经网络模型词法分析模块利用AC多模式匹配算法实现分词,或者利用基于所述需求规格书中的自定义词典进行分词,所述分词策略采用字典词汇最长匹配原则。
6.如权利要求1所述的识别系统,其特征在于,所述句法分析模块进行句法分析包括:句子中词语的依赖关系分析、搭配关系分析。
7.如权利要求6所述的识别系统,其特征在于,所述句法分析模块利用基于最大熵模型的最大生成树算法进行所述需求规格书的中文依存句法的分析,最大熵依存利用条件概率模型,将所有依存关系概率的累积作为目标函数的打分,取打分最大的依存关系树作为输出。
8.如权利要求1所述的识别系统,其特征在于,所述句法分析结果以CoNLL格式输出,所述句法分析结果包括:当前词语在句子中的序号、当前词的词性、当前词语的句法特征、前词语的中心词、当前词语与中心词语的依存关系。
9.如权利要求1所述的识别系统,其特征在于,所述功能点识别模块根据所述句法分析结果、自定义的功能点关键词、自定义的目标匹配关系,精细匹配功能点,最终统计并分类输出。
10.如权利要求9所述的识别系统,其特征在于,所述自定义的目标匹配关系包括:主谓关系、定中关系、动宾关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学;上海博预网络科技有限公司,未经华东师范大学;上海博预网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811132214.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文章推荐方法及装置
- 下一篇:多层级标签的生成方法、装置和存储介质