[发明专利]一种将深度学习应用于中文分词的方法在审
申请号: | 202010000500.0 | 申请日: | 2020-01-02 |
公开(公告)号: | CN111209749A | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | 曾诚;张敏;温超东;任俊伟;谭道强;盛潇 | 申请(专利权)人: | 湖北大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/242;G06F40/126;G06N3/04 |
代理公司: | 武汉帅丞知识产权代理有限公司 42220 | 代理人: | 朱必武 |
地址: | 430000 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于计算机语言处理技术领域,尤其是一种将深度学习应用于中文分词的方法,针对循环神经网络进行中文分词时复杂性高,分词速度慢且容易出现长期依赖的问题,现提出以下方案,包括如下步骤,先进行数据预处理,再构建用于模型输入的字典,最后使用模型进行训练,数据预处理包括借助文中原有的标点符号,段落分隔符等具有分割作用的符号对文档进行切分,提取句子的字特征。本发明通过Universal‑Transformer和条件随机场的分词方法,运用了BPEmd、Universal‑Transformer和条件随机场结合的方式进行中文分词,在充分利用多种不同算法各自的优势,并且通过庞大的训练语料数据集合不断更新迭代模型的参数,依赖于模型的强大学习能力,使得中文分词结果能够更加的准确。 | ||
搜索关键词: | 一种 深度 学习 应用于 中文 分词 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北大学,未经湖北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010000500.0/,转载请声明来源钻瓜专利网。