[发明专利]基于笔画和字形的形态学双通道中文词嵌入方法有效
申请号: | 201910881062.0 | 申请日: | 2019-09-18 |
公开(公告)号: | CN110610006B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 陈恩红;刘淇;徐童;童世炜;陶汉卿 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/36 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;郑哲 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于笔画和字形的形态学双通道中文词嵌入方法,包括:获取中文文本,并通过预处理得到相应的词序列;将词序列中的每个单词拆分为若干个汉字,再根据汉字的笔顺信息与字形图片信息,针对字级形态学特征、字级特征与词级特征的提取过程进行建模,从而获得适用于汉语自身特点的词嵌入表达。上述方法可以增强词嵌入的效果,为汉语自然语言处理、文本挖掘等领域的实践提供一定的技术支持。 | ||
搜索关键词: | 基于 笔画 字形 形态学 双通道 文词 嵌入 方法 | ||
【主权项】:
1.一种基于笔画和字形的形态学双通道中文词嵌入方法,其特征在于,包括:/n获取中文文本,并通过预处理得到相应的词序列;/n将词序列中的每个单词拆分为若干个汉字,再根据汉字的笔顺信息与字形图片信息,针对字级形态学特征、字级特征与词级特征的提取过程进行建模,从而获得适用于汉语自身特点的词嵌入表达。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910881062.0/,转载请声明来源钻瓜专利网。