[发明专利]机器学习组件的训练方法及装置、中文分词方法及装置有效
申请号: | 201811510092.2 | 申请日: | 2018-12-11 |
公开(公告)号: | CN111310459B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 王潇斌;徐光伟;李林琳;司罗 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06N3/088;G06N3/084 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;王天尧 |
地址: | 英属开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种机器学习组件的训练方法及装置、中文分词方法及装置,机器学习组件的训练方法包括:将有标记的句子转化为字向量,对无标记的句子进行无监督分词,获得无监督分词结果,将无监督分词结果转化为标签序列,标签序列中每一标签对应句子中每一字,标签表明字在分词中的位置,将标签序列转化为标签向量,将标签向量和字向量输入机器学习组件进行训练。无监督分词无需人工标注数据,不受训练语料的限制,可以从存在的海量文本中不断学习,识别出不断出现的新词。本发明结合了无监督分词和机器学习组件有监督分词的优势,提高机器学习组件对于新词的识别能力。 | ||
搜索关键词: | 机器 学习 组件 训练 方法 装置 中文 分词 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811510092.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种一体化碱性膜电极及其制备
- 下一篇:智能测试工位管理系统及其方法