[发明专利]一种词义消歧方法和装置在审
申请号: | 202110829532.6 | 申请日: | 2021-07-22 |
公开(公告)号: | CN113449520A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 李琦;石忠德;杨恺;周永猛 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/30;G06F40/211;G06K9/62;G06N20/00 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 赵平;董骁毅 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 词义 方法 装置 | ||
本发明实施例提供了一种词义消歧方法和装置,可用于人工智能技术领域,所述方法包括:通过指定机器学习算法,对训练语句和训练语句中训练目标单词的词义列表进行分类训练,生成初步消歧结果;对初步消歧结果和词义列表进行迁移学习,生成词义消歧分类器;通过词义消歧分类器,根据获取的待测试语句和待测试语句中的待测试目标单词的词义列表,生成词义消歧结果,能够提高词义消歧的准确性,达到较高的词义消歧效果。
技术领域
本发明涉及自然语言处理技术领域,特别涉及人工智能技术领域,尤其涉及一种词义消歧方法和装置。
背景技术
自然语言中存在大量的一词多义现象,在实际应用中,词义识别对于提升计算机系统的最终的准确率具有十分重要的作用。目前,相关技术中的词义消歧模型主要是对上下文句子和目标单词的词义句子进行表征学习后,对于特征向量进行相似度计算,但是这种方式仅能够对目标单词进行粗分类,准确率较低,词义消歧效果较差。
发明内容
本发明的一个目的在于提供一种词义消歧方法,能够提高词义消歧的准确性,达到较高的词义消歧效果。本发明的另一个目的在于提供一种词义消歧装置。本发明的再一个目的在于提供一种计算机可读介质。本发明的还一个目的在于提供一种计算机设备。
为了达到以上目的,本发明一方面公开了一种词义消歧方法,包括:
通过指定机器学习算法,对训练语句和训练语句中训练目标单词的词义列表进行分类训练,生成初步消歧结果;
对初步消歧结果和词义列表进行迁移学习,生成词义消歧分类器;
通过词义消歧分类器,根据获取的待测试语句和待测试语句中的待测试目标单词的词义列表,生成词义消歧结果。
优选的,通过指定机器学习算法,对训练语句和训练语句中训练目标单词的词义列表进行分类训练,生成初步消歧结果,包括:
对训练语句进行编码,生成训练目标单词对应的词向量表征;
对训练目标单词的词义列表进行编码,生成训练目标单词对应的词义表征;
通过指定机器学习算法,对词向量表征和词义表征进行分类训练,生成初步消歧结果。
优选的,对训练语句进行编码,生成训练目标单词对应的词向量表征,包括:
通过第一编码算法,对训练语句进行编码,生成训练目标单词对应的词向量表征。
优选的,对训练目标单词的词义列表进行编码,生成训练目标单词对应的词义表征,包括:
通过第二编码算法,对训练目标单词的词义列表进行编码,生成训练目标单词对应的词义表征。
优选的,通过指定机器学习算法,对词向量表征和词义表征进行分类训练,生成初步消歧结果,包括:
将词向量表征通过预设的参数向量映射至训练目标单词的词义空间,得到映射结果;
通过指定机器学习算法,对映射结果和词义表征进行分类训练,生成初步消歧结果。
优选的,对初步消歧结果和词义列表进行迁移学习,生成词义消歧分类器,包括:
通过指定机器学习算法,对初步消歧结果和词义列表进行迁移学习,生成词义消歧分类器。
优选的,通过指定机器学习算法,对初步消歧结果和词义列表进行迁移学习,生成词义消歧分类器,包括:
对初步消歧结果和词义表征进行加权求和,生成训练目标单词对应的更新词向量表征;
通过指定机器学习算法,根据更新词向量表征和词义表征,生成更新消歧结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110829532.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种现代农业用育苗设备
- 下一篇:一种集成双向驱动的微动台及运动装置