[发明专利]基于文本分类的推广触发方法和装置有效
申请号: | 201310113608.0 | 申请日: | 2013-04-02 |
公开(公告)号: | CN104102639B | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 杨攀 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 张驰;宋志强 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 分类 推广 触发 方法 装置 | ||
1.一种基于文本分类的推广触发方法,其特征在于,该方法包括:
接收网页文本和推广文本,分别对网页文本和推广文本进行词法分析;
从词法分析后的网页文本和推广文本中分别提取出包含流量特征的特征,并基于预先训练的层次分类模型分别对网页文本和推广文本中提取的特征进行层次分类;
根据网页文本和推广文本提取特征的层次分类结果,计算网页文本和推广文本的相似度,并基于该相似度计算结果触发推广操作;
该方法进一步包括:
接收用户文本,对用户文本进行词法分析,从词法分析后的用户文本中提取出包含流量特征的特征,并基于该预先训练的层次分类模型对用户文本中提取的特征进行层次分类;
根据针对网页文本和用户文本提取特征的层次分类结果,计算网页文本和用户文本的相似度;
所述根据针对网页文本和推广文本提取特征的层次分类结果,计算网页文本和推广文本的相似度,并基于该相似度计算结果触发推广操作包括:
对网页文本与用户文本的相似度以及网页文本与推广文本的相似度,进行加权求和,并根据该加权求和结果触发推广操作。
3.根据权利要求1所述的基于文本分类的推广触发方法,其特征在于,所述接收用户文本包括:
接收该用户的历史搜索查询请求项query、该用户的微博标签或该用户所浏览的网页标题。
4.根据权利要求1所述的基于文本分类的推广触发方法,其特征在于,所述从词法分析后的网页文本和推广文本中分别提取出包含流量特征的特征包括:
从词法分析后的网页文本和推广文本中分别提取出流量特征、标记Token特征、关键字特征、主题特征、通用关键字特征、扩展关键字特征或命名实体NamedEntity特征。
5.一种基于文本分类的推广触发装置,其特征在于,包括词法分析单元、层次分类单元和推广触发单元,其中:
词法分析单元,用于接收网页文本和推广文本,分别对网页文本和推广文本进行词法分析;
层次分类单元,用于从词法分析后的网页文本和推广文本中分别提取出包含流量特征的特征,并基于预先训练的层次分类模型分别对网页文本和推广文本中提取的特征进行层次分类;
推广触发单元,用于根据网页文本和推广文本提取特征的层次分类结果,计算网页文本和推广文本的相似度,并基于该相似度计算结果触发推广操作;
词法分析单元,进一步用于接收用户文本,对用户文本进行词法分析,从词法分析后的用户文本中提取出包含流量特征的特征,并基于该预先训练的层次分类模型对用户文本中提取的特征进行层次分类;
层次分类单元,进一步用于根据针对网页文本和用户文本提取特征的层次分类结果,计算网页文本和用户文本的相似度;
推广触发单元,用于对网页文本与用户文本的相似度以及网页文本与推广文本的相似度,进行加权求和,并根据该加权求和结果触发推广操作。
6.根据权利要求5所述的基于文本分类的推广触发装置,其特征在于,
层次分类单元,用于解析该网页文本的域名;根据网页文本的域名确定网页文本的流量特征。
7.根据权利要求5所述的基于文本分类的推广触发装置,其特征在于,词法分析单元,用于接收该用户的历史搜索查询请求项query、该用户的微博标签或该用户所浏览的网页标题。
8.根据权利要求5所述的基于文本分类的推广触发装置,其特征在于,
层次分类单元,用于从词法分析后的网页文本和推广文本中分别提取出流量特征、标记Token特征、关键字特征、主题特征、通用关键字特征、扩展关键字特征或命名实体NamedEntity特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310113608.0/1.html,转载请声明来源钻瓜专利网。