[发明专利]一种基于深度神经网络与多标记分类的病句检测方法在审
申请号: | 201510408379.4 | 申请日: | 2015-07-13 |
公开(公告)号: | CN105045779A | 公开(公告)日: | 2015-11-11 |
发明(设计)人: | 王厚峰;张龙凯 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京万象新悦知识产权代理事务所(普通合伙) 11360 | 代理人: | 贾晓玲 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 神经网络 标记 分类 病句 检测 方法 | ||
1.一种病句检测方法,其特征在于,包括如下步骤:
步骤一:对于一个输入的句子,表示为一个实例;然后根据词法、句法分析提取特征,将实例转换为特征向量;
步骤二:将步骤一得到的特征向量作为深度神经网络的输入,通过深度神经网络的计算,逐层获得压缩表示;
步骤三:将最后一层神经网络的压缩表示作为多标记分类层的输入,计算得到最终确定的语病类型。
2.如权利要求1所述的病句检测方法,其特征在于,步骤一包括:对实例进行预处理,包括汉语词切分和词性标注以及依存分析。
3.如权利要求1所述的病句检测方法,其特征在于,步骤一包括:以出现的词、词性、词与词之间的依存关系作为特征。
4.如权利要求1所述的病句检测方法,其特征在于,步骤三包括:计算获得各种语病对应的概率值,设定阈值,若针对某一种语病的概率输出超过该阈值,则认为该句子包含这种错误。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510408379.4/1.html,转载请声明来源钻瓜专利网。