[发明专利]一种专有本体自动生成系统及方法在审
申请号: | 201710383135.4 | 申请日: | 2017-05-26 |
公开(公告)号: | CN108959240A | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 雷晓军;周京 | 申请(专利权)人: | 上海醇聚信息科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 上海信好专利代理事务所(普通合伙) 31249 | 代理人: | 朱成之 |
地址: | 200000 上海市杨浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 短语 句子 输入端连接 自然语言理解模块 自动生成系统 文本数据库 短语分析 建议模块 句法语义 存储文本数据 文本数据 输出端 放入 分割 分析 | ||
1.一种专有本体自动生成系统,其特征在于,包含:
文本数据库,用于存储文本数据;
自然语言理解模块,其输入端连接于文本数据库,用于对文本数据分割成若干个句子并分析所述的句子得到句子的句法语义结构;
短语分析模块,其输入端连接于自然语言理解模块输出端,用于根据所述的句子的句法语义结构得出对应的短语及短语关系;
识别建议模块、待建立专有本体库,所述的识别建议模块输入端连接短语分析模块,用于识别所述的短语和短语关系作为待建立专有本体的类别和属性并放入到待建立专有本体库中。
2.如权利要求1所述的专有本体自动生成系统,其特征在于,还包含一其他专有本体库,其与识别建议模块相连,用于预设存储已经被建立过的短语。
3.如权利要求1所述的专有本体自动生成系统,其特征在于,所述的自然语言理解模块包含:
句子分割单元,用于对文本进行句子的切割,成为若干个句子;
句子分析单元,用于对输入的若干个句子进行句法和语义进行分析,得到句子对应的句法语义结构。
4.如权利要求3所述的专有本体自动生成系统,其特征在于,所述的短语分析模块包含:
短语语义分析过滤单元,用于提取句法语义结构中的所有短语,并对之进行语义分析,过滤与其他专有本体库有对应的短语,留下没有与其他专有本体库有对应的短语;
短语之间关系分析单元,用于分析过滤留下短语具有的关系得到短语的关系。
5.一种专有本体自动生成方法,其特征在于,该方法包含如下步骤:
S1,存储文本数据;
S2,对文本数据分割成若干个句子并分析所述的句子得到句子的句法语义结构;
S3,根据所述的句子的句法语义结构得出对应的短语及短语关系;
S4,识别所述的短语和短语关系作为待建立专有本体的类别和属性并放入到待建立专有本体库中。
6.如权利要求5所述的专有本体自动生成方法,其特征在于,所述的步骤S2包含:
S2.1,对文本进行句子的切割,成为若干个句子;
S2.2,对输入的若干个句子进行句法和语义进行分析,得到句子对应的句法语义结构。
7.如权利要求6所述的专有本体自动生成方法,其特征在于,所述的步骤S3包含:
S3.1,提取句法语义结构中的所有短语,并对之进行语义分析,过滤与其他专有本体库有对应的短语,留下没有与其他专有本体库有对应的短语;
S3.2,分析过滤留下短语具有的关系得到短语的关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海醇聚信息科技有限公司,未经上海醇聚信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710383135.4/1.html,转载请声明来源钻瓜专利网。