[发明专利]一种医疗领域的SPARQL查询语句的生成系统和方法在审
申请号: | 202010472760.8 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111639254A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 李瑞轩;辜希武;胡仁;李玉华 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06F16/332;G06F16/33;G06N3/08 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 医疗 领域 sparql 查询 语句 生成 系统 方法 | ||
本发明公开一种医疗领域的SPARQL查询语句的生成系统和方法,属于机器翻译领域。包括:生成器,将查询模板库和知识库作为输入,用于从知识库中提取实体与属性,填充至中文问句模板和SPARQL查询模板中,生成训练集;分词模块,用于对训练集中中文问句进行分词处理,将分词结果转发给学习器;对目标中文问句进行分词处理,将分词结果转发给解释器;学习器,用于根据分词后的中文训练集对神经网络模型进行训练,得到训练好的模型;解释器,用于利用训练好的神经网络模型对分词后的目标中文问句进行预测,得到预测的SPARQL查询语句,从而不再使用复杂的统计和手工模型,实现直接将医疗健康查询中文问句转换为SPARQL查询语句。
技术领域
本发明属于深度学习和机器翻译领域,更具体地,涉及一种医疗领域的SPARQL查询语句的生成系统和方法。
背景技术
在互联网的世界中,信息量也随着技术的迭代而飞快地增长。对于普通用户而言,如何精准地从海量的网络数据中获得自己需要的信息成为一个不小的问题。为了解决这个问题从而出现了搜索引擎,搜索引擎现在成为了用户从互联网上获取信息的最重要的途径之一。搜索引擎可以概括为两种实现方式一是传统的基于关键词匹配模式另一种可以归为未来的基于语义查询图的模式。不管使用什么技术,搜索引擎的目的都是在互联网上收集整理数据,给使用者提供搜索查询服务。从搜索引擎问世以来,它一直处于统治级地位,而随着时代的发展,新的技术不断出现,传统的搜索引擎在给用户提供服务的同时已经出现了瓶颈,也出现一些方面的不足;比如搜索引擎不能直接理解用户输入的语句,只能根据用户提供的关键词返回一组与关键词相关性由高到低的网页链接,这就需要用户自己去大量的网页链接中寻找他们想要的知识,而不是让搜索引擎去理解用户提出的问题。在1998年,互联网之父Tim Berners-Lee提出了语义网来处理以上问题,该语义网络将结构化数据组织成计算机可以识别和推理的格式,从而给予计算机代替用户理解问题,筛选答案的能力。语义网技术由RDF、SPARQL、JSON-LD、OWL、RDFS、RIF等技术组成,其中SPARQL是官方推荐的用于语义网查询语言。
由于日益增长的互联网信息,网络上已经存在着巨量的语义信息,基于这些语义信息知识,已经存在有数百万的网站支持语义网技术。但是用户在如此海量的数据中直接搜索自己需要的信息依旧是非常困难的。换句话说,对于普通用户来说,由于他们不了解SPARQL等语义网查询语言的语法结构,普通用户想要搜索自己需要的信息几乎成为了不可能的事。
自动问答系统的发展有相当长的历史,自动问答系统的早期发展主要依赖于搜索引擎技术,该技术主要是首先从文本源中查询相关的文档,然后在查询到的目标文档中提取与问题相关性最高的答案。后来发展出基于协同的智能问答系统,该类系统会在系统的后台维护一个问题和答案的数据集合,返回的答案就是在后台的所有问题之中找到匹配度最高的问题,然后返回该问题所对应答案。当前自动问答系统的主流技术变成了基于知识库的结构化查询。该类技术首先在理解普通用户提出的问题的情况下,将自然语言问句转化成结构化查询语句,例如常见的SQL查询语句,或者是后来出现的面向语义网的SPARQL查询语句,系统通过查询语句在知识库中进行准确查询然后返回结果。
知识问答系统的首要步骤就是理解用户提出的问题,该步骤在知识问答系统中起着至关重要的作用,系统只有正确地理解了问题的语义信息,才能准确地生成对应的查询语句并返回给用户。对于问答系统来说,由于自然语言的表达存在多样性和多义性,问句的语义理解不正确导致返回结果不符合用户的需求。在浏览互联网时,人们有时也希望通过互联网来获得医疗健康相关的信息,甚至是进行自我诊断。但是根据本文统计国内多个相关的医疗健康网站的数据来看,这些网站所提供的自动问答服务系统仍旧在使用基于传统搜索引擎技术的系统,网站都是通过提取用户关键词来索引相关网页,这使得用户仍然需要花大量的时间来筛选信息。对于健康医疗这个与人们日常生活息息相关的领域,国内基于医疗知识库的智能问答系统还不够成熟。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010472760.8/2.html,转载请声明来源钻瓜专利网。