[发明专利]基于人工智能的信息处理方法和装置有效
申请号: | 201710470407.4 | 申请日: | 2017-06-20 |
公开(公告)号: | CN107273508B | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 罗锦文;郭伟东;陈一乐;池剑锋;吕雅娟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N5/00 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 信息处理 方法 装置 | ||
1.一种基于人工智能的信息处理方法,其特征在于,所述方法包括:
获取在预定时间段内记录的搜索点击信息,其中,所述搜索点击信息包括在所述预定时间段所包含的每个单位时间段内被搜索的词条和各所述词条在该单位时间段内的点击量;
从所述搜索点击信息中选取在预设单位时间段内点击量超出点击量阈值的词条生成候选词条集合;
对于所述候选词条集合中的每个候选词条,将该候选词条在所述预定时间段内所对应的各个点击量按照时间先后顺序形成点击量序列;
基于各所述点击量序列,确定与各所述点击量序列分别对应的候选词条的类别,其中,所述类别用于表征候选词条在所述预定时间段内被用户关注的程度;
将类别为预设类别的候选词条作为兴趣点并生成兴趣点集合。
2.根据权利要求1所述的方法,其特征在于,所述基于各所述点击量序列,确定与各所述点击量序列分别对应的候选词条的类别,包括:
对于每个所述点击量序列,基于所述点击量序列中的各分量的值随时间变化的变化趋势,将所述点击量序列分割成多个子序列;
生成针对所述多个子序列中的每个子序列的趋势描述信息;
将所述多个子序列和所述多个子序列分别对应的趋势描述信息输入预先训练的分类模型,以使所述分类模型对所述点击量序列所对应的候选词条的类别进行预测;
其中,所述分类模型用于表征第一信息和类别的对应关系,所述第一信息包括点击量序列所分割成的各个子序列和所述各个子序列分别对应的趋势描述信息。
3.根据权利要求2所述的方法,其特征在于,所述基于所述点击量序列中的各分量的值随时间变化的变化趋势,将所述点击量序列分割成多个子序列,包括:
对于所述点击量序列中的任意两个相邻分量,若预置数值范围集合中存在包括所述相邻分量的值的目标数值范围,并且所述相邻分量的值之差的绝对值大于所述目标数值范围所对应的阈值,则将所述相邻分量划分到不同的子序列,其中,所述预置数值范围集合中的每个预置数值范围具有与之对应的阈值。
4.根据权利要求2所述的方法,其特征在于,所述基于所述点击量序列中的各分量的值随时间变化的变化趋势,将所述点击量序列分割成多个子序列,包括:
基于所述点击量序列中的各分量的值随时间变化的变化趋势,将所述点击量序列划分成点击量组序列;
确定所述点击量组序列中的每个点击量组中的各分量的值的平均值和方差;
基于所确定的平均值和方差,在所述点击量组序列所包括的点击量组中确定分割点;
从所确定的分割点处对所述点击量序列进行分割,得到与所述点击量序列对应的多个子序列。
5.根据权利要求4所述的方法,其特征在于,所述基于所述点击量序列中的各分量的值随时间变化的变化趋势,将所述点击量序列划分成点击量组序列,包括:
从所述点击量序列中查找出各个极值点,基于查找出的极值点将所述点击量序列划分成点击量组序列,其中,所述极值点是所述点击量序列中的值同时大于或小于左右相邻分量的值的分量。
6.根据权利要求4所述的方法,其特征在于,所述基于所确定的平均值和方差,在所述点击量组序列所包括的点击量组中确定分割点,包括:
对于所述点击量组序列中的任意两个相邻点击量组,若第一预置数值范围集合中存在目标第一预置数值范围、所述相邻点击量组中的位置靠后的点击量组所对应的平均值除以位置靠前的点击量组所对应的平均值所得的商大于所述目标第一预置数值范围所对应的第一预设值、并且所述相邻点击量组中的每个点击量组所对应的方差除以所对应的平均值所得的商大于所述目标第一预置数值范围所对应的第二预设值,则将所述位置靠前的点击量组中的最后一个分量作为分割点,其中,所述目标第一预置数值范围是包括所述相邻点击量组分别对应的平均值之差的绝对值的数值范围,所述第一预置数值范围集合中的每个第一预置数值范围具有与之对应的第一预设值和第二预设值。
7.根据权利要求1-6之一所述的方法,其特征在于,所述方法还包括:
计算所述兴趣点集合中的任意两个兴趣点之间的相似度,将相似度高于相似度阈值的兴趣点进行合并以生成第一兴趣点集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710470407.4/1.html,转载请声明来源钻瓜专利网。