[发明专利]分词处理方法及装置、电子设备在审
申请号: | 201611263885.X | 申请日: | 2016-12-30 |
公开(公告)号: | CN106802887A | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 焦增涛 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分词 处理 方法 装置 电子设备 | ||
1.一种分词处理方法,其特征在于,包括:
在已进行分词处理后的文本中,确定反映评论内容的词;
在确定所述反映评论内容的词与邻近所述反映评论内容的词的词之间满足预定关系的情况下,将所述反映评论内容的词与所述邻近所述反映评论内容的词的词合并。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在确定所述反映评论内容的词之后,如果所述反映评论内容的词与所述邻近所述反映评论内容的词的词之间存在虚词,则删除所述虚词。
3.根据权利要求1或2所述的方法,其特征在于,所述满足预定关系包括符合预定句法依存关系和/或预定词性模式。
4.根据权利要求3所述的方法,其特征在于,所述确定反映评论内容的词包括:确定反映评论内容的基本属性词。
5.根据权利要求4所述的方法,其特征在于,所述基本属性词对应的所述预定句法依存关系包括:
所述基本属性词与位于所述基本属性词之前且相邻的词具有修饰关系。
6.根据权利要求4所述的方法,其特征在于,所述基本属性词对应的所述预定词性模式包括:
所述位于所述基本属性词之前且相邻的词与所述基本属性词构成动词加名词模式或名词加名词模式。
7.根据权利要求3所述的方法,其特征在于,所述确定反映评论内容的词包括:确定反映用户观点的评价词。
8.根据权利要求7所述的方法,其特征在于,所述评价词对应的所述预定句法依存关系包括:
所述评价词与位于所述评价词之前且相邻的词具有动宾结构关系或兼语加动宾关系。
9.根据权利要求7所述的方法,其特征在于,所述评价词对应的词性模式包括:所述位于所述评价词之前且相邻的词与所述评价词构成能愿动词加动词模式;或者
所述位于所述评价词之前且相邻的词与所述评价词构成使令动词加兼语名词加动词模式。
10.根据权利要求1所述的方法,其特征在于,所述进行分词处理包括:
对所述文本进行切词;
对切词后的文本中的词进行词性标注以及依存句法标注。
11.一种分词处理装置,其特征在于,包括:
词确定模块,用于在已进行分词处理后的文本中确定反映评论内容的词;
合并模块,用于在所述反映评论内容的词与邻近所述反映评论内容的词的词之间满足预定关系的情况下,将所述反映评论内容的词与所述邻近所述反映评论内容的词的词合并。
12.一种电子设备,包括:
处理器;以及
存储器,其上存储有可在所述处理器上运行的计算机程序;
其特征在于,所述处理器执行所述计算机程序以实现如权利要求1-10任一项所述的方法的步骤。
13.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-10任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611263885.X/1.html,转载请声明来源钻瓜专利网。