[发明专利]分词处理方法及装置、电子设备在审
申请号: | 201611263885.X | 申请日: | 2016-12-30 |
公开(公告)号: | CN106802887A | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 焦增涛 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分词 处理 方法 装置 电子设备 | ||
技术领域
本发明涉及自然语言处理技术领域,具体而言,涉及一种分词处理方法及装置、电子设备。
背景技术
在汉语中,词是最小的能够独立活动的、有意义的语言成分。而在汉语中由于词与词之间不存在分隔符,词本身也缺乏明显的形态标记,因此在对中文文本进行分析时,中文分词是一项基本技术,是后续其他各项分析的基础。而由于不同的分词粒度,其表意能力不一样,因此针对不同的中文文本分析,分词粒度对分析的准确性起到了关键作用。
目前,随着电子商务的蓬勃发展,各电商平台的商品评论信息越来越多。在对评论进行分析时,同样需要进行分词,而不同的分词粒度则会影响对例如评论属性词、评论词等的分析能力。
目前的分词处理技术较依赖人工,不够智能和灵活,有些自动处理的准确度较低,难以实现预期的分词粒度。
发明内容
有鉴于此,本发明提供一种分词处理方法及装置、电子设备,适用于评论信息分析,能够达到更大的分词粒度,有效提升对反映评论内容的词(例如基本属性词、评论词等)的分析能力,具备智能性和灵活性。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明的一方面,提供一种分词处理方法,包括:
在已进行分词处理后的文本中,确定反映评论内容的词;
在确定所述反映评论内容的词与邻近所述反映评论内容的词的词之间满足预定关系的情况下,将所述反映评论内容的词与所述邻近所述反 映评论内容的词的词合并反映评论内容反映评论内容反映评论内容反映评论内容。
另外,本发明还提供一种分词处理装置,其包括:
词确定模块,用于在已进行分词处理后的文本中确定反映评论内容的词;
合并模块,用于在所述反映评论内容的词与邻近所述反映评论内容的词的词之间满足预定关系的情况下,将所述反映评论内容的词与所述邻近所述反映评论内容的词的词合并反映评论内容反映评论内容反映评论内容反映评论内容。
此外,本发明还提供一种电子设备,包括:
处理器;以及
存储器,其上存储有可在所述处理器上运行的计算机程序;
所述处理器执行所述计算机程序以实现如上文所述的方法的步骤。
本发明还提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如上文所述方法的步骤。
根据本发明实施方式的分词处理方法及装置以及电子设备,可自动确定反映评论内容的词,并在此基础上通过预定关系的校验,来自动判断是否将该词与邻近的词合并,使得进行合并处理之后的文本能够达到更大的分词粒度,具备智能性和灵活性,能够达到较高的准确度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。
附图说明
通过参照附图详细描述其示例实施例,本发明的上述和其它目标、特征及优点将变得更加显而易见。
图1是根据一示例性实施方式示出的一种分词处理方法的流程图。
图2是根据一示例性实施方式示出的一种分词处理方法的流程图。
图3是根据一示例性实施方式示出的一种分词处理方法的流程图。
图4是根据一示例性实施方式示出的一种分词处理方法的原理示意图。
图5A是根据一示例性实施方式示出的一种分词处理方法的流程图。
图5B是根据一示例性实施方式示出的一种分词处理方法的流程图。
图6A是根据一示例性实施方式示出的一种分词处理方法的流程图。
图6B是根据一示例性实施方式示出的一种分词处理方法的流程图。
图6C是根据一示例性实施方式示出的一种分词处理方法的原理示意图。
图7A是根据一示例性实施方式示出的一种分词处理方法的流程图。
图7B是根据一示例性实施方式示出的一种分词处理方法的流程图。
图7C及图7D是根据一示例性实施方式示出的一种分词处理方法的原理示意图。
图8A是根据一示例性实施方式示出的一种分词处理方法的流程图。
图8B是根据一示例性实施方式示出的一种分词处理方法的流程图。
图9是根据一示例性实施方式示出的一种分词处理装置的框图。
图10是根据一示例性实施方式示出的一种分词处理装置的框图。
图11是根据一示例性实施方式示出的一种分词处理装置的框图。
图12A是根据一示例性实施方式示出的一种分词处理装置的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611263885.X/2.html,转载请声明来源钻瓜专利网。