[发明专利]用于输出信息的方法和装置有效
申请号: | 202010196797.2 | 申请日: | 2020-03-19 |
公开(公告)号: | CN111382262B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 蔡远俊;郑烨翰;盛广智;陈奇石 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/36;G06F40/30 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 输出 信息 方法 装置 | ||
1.一种用于输出信息的方法,包括:
响应于接收到用户输入的问题,从历史评论信息中筛选出与所述问题相关的评论集合;
对所述评论集合进行质量过滤,得到合格评论集合;
基于所述合格评论集合的特征、所述合格评论集合与所述问题的语义相关性,对所述合格评论集合中的各合格评论进行价值度打分,其中,所述合格评论集合的特征,包括以下至少一项:评论窗口的用户行为数据、评论窗口点击率、评论事件概率得分、评论所在文章窗口的用户行为数据、评论所在文章与所述问题的主题匹配概率、评论内容与所述问题的主题匹配概率;
按照价值度分数由高到低的顺序输出合格评论集合;
其中,所述从历史评论信息中筛选出与所述问题相关的评论集合,包括:
从每条历史评论信息中通过预先训练的主题判别模型提取评论主题;
将问题与各评论主题进行匹配,匹配度达到预定阈值就认为该评论主题对应的评论信息是相关的评论,添加到评论信息集合中。
2.根据权利要求1所述的方法,其中,在按照价值度分数由高到低的顺序输出合格评论集合之前,所述方法还包括:
按照价值度分数由高到低的顺序开始去重,从所述合格评论集合过滤掉主要内容重复的合格评论。
3.根据权利要求1或2所述的方法,其中,所述方法还包括:
对所述合格评论集合进行观点识别以聚合相同观点,输出热门观点。
4.根据权利要求1或2所述的方法,其中,所述方法还包括:
对所述合格评论集合进行情感识别,输出评论情感分布信息。
5.根据权利要求1或2所述的方法,其中,所述从历史评论信息中筛选出与所述问题相关的评论集合,包括:
通过搜索点击泛化和语义泛化,将所述问题映射到主题图谱中的至少一个节点的主题上;
通过标题匹配、评论内容匹配的方法,从历史评论信息中筛选出与所述问题相关的候选评论集合;
对所述候选评论集合进行资讯主题判别和评论主题判别,过滤出评论所在资讯主题或评论主题与节点中的主题一致的相关评论。
6.根据权利要求1或2所述的方法,其中,所述对所述评论集合进行质量过滤,得到合格评论集合,包括:
通过分类器识别出以下至少一种类别的信息,并过滤掉:
偏激的评论、色情评论、涉政评论。
7.一种用于输出信息的装置,包括:
筛选单元,被配置成响应于接收到用户输入的问题,从历史评论信息中筛选出与所述问题相关的评论集合;
过滤单元,被配置成对所述评论集合进行质量过滤,得到合格评论集合,其中,所述合格评论集合的特征,包括以下至少一项:评论窗口的用户行为数据、评论窗口点击率、评论事件概率得分、评论所在文章窗口的用户行为数据、评论所在文章与所述问题的主题匹配概率、评论内容与所述问题的主题匹配概率;
打分单元,被配置成基于所述合格评论集合的特征、所述合格评论集合与所述问题的语义相关性,对所述合格评论集合中的各合格评论进行价值度打分;
输出单元,被配置成按照价值度分数由高到低的顺序输出合格评论集合;
所述筛选单元进一步被配置成:
从每条历史评论信息中通过预先训练的主题判别模型提取评论主题;
将问题与各评论主题进行匹配,匹配度达到预定阈值就认为该评论主题对应的评论信息是相关的评论,添加到评论信息集合中。
8.根据权利要求7所述的装置,其中,所述装置还包括去重单元,被配置成:
在按照价值度分数由高到低的顺序输出合格评论集合之前,按照价值度分数由高到低的顺序开始去重,从所述合格评论集合过滤掉主要内容重复的合格评论。
9.根据权利要求7或8所述的装置,其中,所述装置还包括观点识别单元,被配置成:
对所述合格评论集合进行观点识别以聚合相同观点,输出热门观点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010196797.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种微生物培养装置
- 下一篇:一种基于Flink的实时计算方法及系统
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置