[发明专利]基于本体CallCenter平台的智能知识整合与检索系统和方法在审
申请号: | 201811457319.1 | 申请日: | 2018-11-30 |
公开(公告)号: | CN109783067A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 徐竟祎;王亮;应奕彬;孙毅;刘百祥;周伟强;狄珂;扈婷;徐艺扬;郭琪;田鹏;张丽 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F8/20 | 分类号: | G06F8/20;G06F8/30;G06F16/21 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询转换 整合 检索系统 定制处理 智能知识 信息库 查询 运维 知识库 软件开发技术 用户界面输入 用户界面显示 文档处理器 查询结果 查询语句 服务平台 检索代理 检索模块 领域本体 模块处理 匹配检索 所得信息 用户界面 用户提供 人性化 匹配 查找 代理 潮流 服务 | ||
1. 一种基于本体的Call Center运维服务平台的智能知识整合与检索系统,其特征在于,包括:文档处理器、查询转换模块、代理检索模块、定制处理模块、用户界面,以及本体库和信息库;其中:
所述用户界面,用于用户输入查询语句;并显示查询结果;
所述文档处理器,用于对从数据源传来的数据进行处理,包括,对数据源给定运维及用户信息库中的每个信息点,首先,进行文本的词汇分析,即将文档中的文本转换为词,对数字、连字符、标点和字母的大小写进行处理;然后,利用禁用词表去掉运维及用户信息中的虚词,过滤掉那些对检索来说作用不大的词,仅取名词、动词有实际意义的词或词组;然后,对得到的词组进行词干抽取,去掉前后缀,使得查询项的语法变异词也能够被检索;接着,选择索引项,确定哪些词或词干、词组用作索引元素,获得能正确表达文献内容的概念性词或词组;根据领域的概念建立文本的词汇与概念之间的映射关系,从而将这些非结构化的运维信息与结构化的领域本体建立联系,利用本体的结构化的知识来协助检索非结构化的文本信息;最后,将分析结果存储至领域本体库和信息库中;
所述查询转换模块,根据上述结果到本体库中查找相应的概念,对得到的概念进行语义化处理;并根据领域本体中匹配的概念,按照所得信息对本次查询进行查询转换,根据用户界面传来的用户查询语句,按照信息对本次查询进行查询转换,包括:查询语义的判断和查询扩展,使查询具有相应的语义信息;并把这些信息交给检索代理模块;
所述代理检索模块,根据查询转换模块传来的信息,到信息库中进行查询,对不能确定语义信息的查询按照关键词匹配技术进行查询;查询所得的结果传到定制处理模块处理;
所述定制处理模块,按照检索词原词查询结果、检索词同义词查询结果、检索词上位词查询结果、检索词下位词查询结果进行排序,然后交由用户界面显示查询结果;
所述本体库,用于存放构建的运维信息本体,运维信息本体包括特定领域本体的相关知识,也包括提供的各种服务的信息;
所述信息库,与本体库一样,用于存放构建的运维信息本体;
用户通过用户界面输入的查询语句,获得能正确表达查询句语义的概念性词或词组,把结果传递给查询转换模块,并依据上述结果到本体库中查找相应的概念,对得到的概念进行语义化处理,对于领域本体中匹配的概念,查询转换模块按照所得信息对本次查询进行查询转换,然后交给检索代理模块到信息库中进行查询,对不能确定语义信息的查询按照关键词匹配技术进行查询;查询所得的结果经定制处理模块处理,按照检索词原词查询结果、检索词同义词查询结果、检索词上位词查询结果、检索词下位词查询结果进行排序,然后由用户界面显示查询结果。
2. 根据权利要求1所述的智能知识整合与检索系统,其特征在于,所述构建运维信息本体,基于以下规则:
(1)充分发挥Call Center运维服务平台的能力
充分发挥运维自身的构建能力,包括使用 UDDI 注册信息和 LDAP 信息来构建运维本体;
(2)充分复用
建立领域本体后,利用领域本体来构建运维信息本体,充分发挥运维领域本体的复用能力;
(3)本体大小适度
运维本体在充分表达语义信息的基础上,本体中包含的概念数目应该尽可能的最小化、尽可能将冗余去除。
3.根据权利要求1或2所述的智能知识整合与检索系统,其特征在于,所述构建运维信息本体,包括从数据源获取到数据,将数据传递至文档处理器;文档处理器对数据源给定运维及用户信息库中的每个信息点;首先,进行文本的词汇分析,即将文档中的文本转换为词,对数字、连字符、标点和字母的大小写进行处理,然后利用禁用词表去掉运维及用户信息中的虚词,过滤掉那些对检索来说作用不大的词,仅取名词、动词有实际意义的词或词组;然后对得到的词组进行词干抽取,去掉前后缀,使得查询项的语法变异词也能够被检索;接着选择索引项,确定哪些词或词干、词组用作索引元素,获得能正确表达文献内容的概念性词或词组;最后将分析结果存储至领域本体库和信息库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811457319.1/1.html,转载请声明来源钻瓜专利网。