[发明专利]用于实时识别短文本类别信息的方法、装置及计算机设备无效
申请号: | 201010616565.4 | 申请日: | 2010-12-22 |
公开(公告)号: | CN102073707A | 公开(公告)日: | 2011-05-25 |
发明(设计)人: | 冼健 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汉昊知识产权代理事务所(普通合伙) 11370 | 代理人: | 罗朋 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 实时 识别 文本 类别 信息 方法 装置 计算机 设备 | ||
技术领域
本发明涉及计算机网络技术,尤其涉及一种用于实时识别短文本类别信息的方法、设备及计算机设备。
背景技术
现有技术中,主要通过对短文本信息进行专有名词及术语匹配,或者,通过对短文本信息进行信息扩展后,再根据预设的分类器对其进行分类。其中,前者存在召回率低的问题,而后者存在计算量大,无法满足实时应用需求的问题。
因此,如何提供一种实时识别短文本类别信息的方案,已成为本领域技术人员需要解决的问题。
发明内容
本发明的目的是提供一种用于实时识别短文本类别信息的方法、设备及计算机设备。
根据本发明的一个方面,提供一种计算机实现的用于实时识别短文本类别信息的方法,其中,该方法包括以下步骤:
a获取待分类的短文本信息;
b将所述待分类短文本信息与已分类信息单元库中的信息单元进行匹配,以获取能够成功匹配的一个或多个已分类信息单元及其所对应的单元相关信息;
c基于第一预定规则,根据所述能够成功匹配的一个或多个已分类信息单元及其对应的单元相关信息,获得所述待分类短文本信息的类别信息。
根据本发明的另一个方面,还提供了一种用于实时识别短文本类别信息的短文本处理装置,其中,该短文本处理装置包括:
第一获取装置、用于获取待分类的短文本信息;
匹配装置、用于将所述待分类短文本信息与已分类信息单元库中的信息单元进行匹配,以获取能够成功匹配的一个或多个已分类信息单元及其所对应的单元相关信息;
分类装置、用于基于第一预定规则,根据所述能够成功匹配的一个或多个已分类信息单元及其对应的单元相关信息,获得所述待分类短文本信息的类别信息。
根据本发明的再一个方面,还提供了一种计算机设备,其中,该计算机设备前述短文本处理装置。
与现有技术相比,本发明具有以下优点:1)本发明通过将待分类短文本信息与已分类的信息单元进行匹配,能够达到较佳的召回率;2)由于待分类短文本信息的确定主要通过能够成功匹配的信息单元及其相关信息来确定,因此,其处理速度快,每秒能够达到识别大量,例如数万至数十万个,短文本信息类别的速度,完全能够满足线上的实时识别需求。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一个方面的用于实施识别短文本类别信息的方法流程图;
图2为本发明一个优选实施例的用于实施识别短文本类别信息的方法流程图;
图3为本发明另一优选实施例的用于实施识别短文本类别信息的方法流程图;
图4为本发明再一优选实施例的用于实施识别短文本类别信息的方法流程图;
图5为本发明一个方面的用于实施识别短文本类别信息的短文本处理装置结构示意图;
图6为本发明一个优选实施例的用于实施识别短文本类别信息的短文本处理装置结构示意图;
图7为本发明另一优选实施例的用于实施识别短文本类别信息的短文本处理装置结构示意图;
图8为本发明再一优选实施例的用于实施识别短文本类别信息的短文本处理装置结构示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1为本发明一个方面的用于实施识别短文本类别信息的方法流程图。其中,根据本发明的方法可通过计算机设备中的操作系统或处理控制芯片来完成,为简明起见,以下将所述操作系统或处理控制芯片统称为短文本处理装置。其中,该计算机设备包括但不限于:1)用户设备;2)网络设备。其中,所述用户设备包括但不限于:个人电脑、智能手机、PDA等;所述网络设备包括但不限于:单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在步骤S1中,短文本处理装置获取待分类的短文本信息。其中,所述短文本信息包括但不限于:1)来自用户的输入序列;2)计算机设备当前需要处理的信息等。该短文本处理装置获取该待分类短文本信息的方法包括但不限于:1)实时获取用户直接输入或经由其他设备或装置输入的输入序列,或者,实时获取计算机设备当前需要处理的信息;2)获取预存储在所述计算机设备或其他设备中的需要进行分类处理的短文本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010616565.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:AMOLED像素驱动电路
- 下一篇:一种LED显示屏