[发明专利]一种获取用户语料中词语之间的关联关系的方法和系统有效
申请号: | 201910125067.0 | 申请日: | 2019-02-19 |
公开(公告)号: | CN109885835B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/211;G06F40/30;G06F40/216 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 用户 语料 词语 之间 关联 关系 方法 系统 | ||
本发明涉及辅助学习技术领域,提供一种获取用户语料中词语之间的关联关系的方法和系统,包括:通过训练获取句法树模型,所述句法树模型包含多个语义槽,以及所述语义槽之间的连接关系;接收用户输入的词语,调取所述句法树模型,将所述词语匹配到所述语义槽中,形成实体语义槽;根据所述语义槽之间的连接关系,获取所述实体语义槽之间的连接关系,进而获取所述词语之间的关联关系。通过使用句法树模型,对用户输入的词语进行语义匹配,可以实现对用户输入的一些特殊词语之间关联关系的识别,使得计算机在理解用户使用自然语言输入的交互信息时更准确。
技术领域
本发明涉及辅助学习技术领域,尤指一种获取用户语料中词语之间的关联关系的方法和系统。
背景技术
随着计算机技术的发展,人类与计算机进行交互的方式在不断变化,开始以计算机语言进行交互,只有少数掌握计算机语言的程序员才可以顺利的向计算机传达指令。这样的语言复杂,不符合人类的使用习惯,计算机语言通过不断改进,越来越趋向于人类语言的使用习惯。
传统用户使用计算机进行辅助学习时,无法绕开与计算机进行及时交互的需求,但是受限于计算机语言的复杂,交互的效率很低,只能通过选择由程序员编写好的选项进行指令输出,如何使计算机理解用户的自然语言,使用户通过自然语言进行计算机辅助学习,成为新的需要。
现有技术通过对人类自然语言进行语法约束,让用户使用标准的语法进行意义表述,通过收录语法结构,将用户在标准语法框架下的语句进行语义理解。但一般人都习惯使用自然语言进行表述,自然语言中,由于表达习惯的差异,往往很少人使用标准的书面语法进行语义表达,在其表达过程中,存在着很多省略、指代、倒装等现象,用户在表述时根据上下文很可能省略大量的句子成分后,只剩下少数单词,那么如何理解用户在这种情况下表达的意思,怎样获取用户零散词语之间的关联关系成为新的问题。
发明内容
本发明提供一种获取用户语料中词语之间的关联关系的方法和系统。具体的技术方案如下,本发明包括:
一种获取用户语料中词语之间的关联关系的方法,包括:
通过训练获取句法树模型,所述句法树模型包含多个语义槽,以及所述语义槽之间的连接关系;
接收用户输入的词语,调取所述句法树模型,将所述词语匹配到所述语义槽中,形成实体语义槽;
根据所述语义槽之间的连接关系,获取所述实体语义槽之间的连接关系,进而获取所述词语之间的关联关系。
进一步地,本发明中一种获取用户语料中词语之间的关联关系的方法还包括:
所述句法树模型还包含词库,所述词库对应所述语义槽;
形成所述实体语义槽后,当所述词语未收录到所述词库中时,将所述词语收录到所述词库中。
进一步地,本发明中一种获取用户语料中词语之间的关联关系的方法中,通过训练获取句法树模型具体包括:
接收用户的原始语料,根据其原始句式规则生成原始句法树,所述原始句法树包含多个原始语义槽,以及所述原始语义槽之间的连接关系,所述原始句法树为所述句法树模型的初始形态;
接收所述用户的训练语料,根据所述训练语料对所述原始句法树进行训练,得到所述句法树模型。
进一步地,本发明中一种获取用户语料中词语之间的关联关系的方法中,根据所述训练语料对所述原始句法树进行训练,得到所述句法树模型具体包括:
分析获得所述训练语料的训练句式规则和训练词,根据所述训练句式规则将所述训练语料与所述原始句法树进行匹配,并记录匹配成功次数;
当匹配成功时,根据所述训练词的词性将其匹配到所述原始语义槽中,记录与所述原始语义槽匹配成功的所述训练词,建立所述原始语义槽对应的原始词库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910125067.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用户年龄性别的预测方法及装置
- 下一篇:一种精准分词的方法