[发明专利]基于人工智能的信息格调识别方法和装置有效
申请号: | 201711432665.X | 申请日: | 2017-12-26 |
公开(公告)号: | CN108170673B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 陈亮宇;何伯磊;肖欣延;吕雅娟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/20;G06N3/04;G06N3/08 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 信息 格调 识别 方法 装置 | ||
本申请实施例公开了基于人工智能的信息格调识别方法和装置。该方法的一具体实施方式包括:获取待识别文本信息;对待识别文本信息进行分析,确定待识别文本信息所包括的命名实体信息和待识别文本信息所归属的主题;基于命名实体信息和主题,对待识别文本信息进行格调识别;生成用于表征待识别文本信息与识别出的格调之间的对应关系的对应关系信息。该实施方式有效地实现了对待识别文本信息的格调的识别。
技术领域
本申请实施例涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及基于人工智能的信息格调识别方法和装置。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
目前,网络上的文章,特别是资讯文章存在很多不同的格调,比如文艺清新、理性严肃、低俗等等。具有相同的格调的文章往往包含了相似的文字风格和内容题材。通过对文章进行格调识别,可以依据用户的格调偏好向用户推送准确的文章,还可以刻画用户画像等等。
发明内容
本申请实施例提出了基于人工智能的信息格调识别方法和装置。
第一方面,本申请实施例提供了一种基于人工智能的信息格调识别方法,该方法包括:获取待识别文本信息;对上述待识别文本信息进行分析,确定上述待识别文本信息所包括的命名实体信息和上述待识别文本信息所归属的主题;基于上述命名实体信息和上述主题,对上述待识别文本信息进行格调识别;生成用于表征上述待识别文本信息与识别出的格调之间的对应关系的对应关系信息。
在一些实施例中,上述识别出的格调具有对应的格调标识,上述格调标识包含在预设的格调标识集合中,上述格调标识集合中的每个格调标识关联有概率计算模型,上述概率计算模型用于计算输入信息的格调是所关联的格调标识所指示的格调的概率。
在一些实施例中,上述基于上述命名实体信息和上述主题,对上述待识别文本信息进行格调识别,包括:利用上述格调标识集合中的格调标识所关联的概率计算模型,基于上述命名实体信息和上述主题,对上述待识别文本信息进行格调识别。
在一些实施例中,上述主题具有对应的主题标识,上述格调标识集合中的至少一个格调标识关联有第一关键词集合;以及上述利用上述格调标识集合中的格调标识所关联的概率计算模型,基于上述命名实体信息和上述主题,对上述待识别文本信息进行格调识别,包括:对于上述格调标识集合中的每个格调标识,将该格调标识作为待处理格调标识,若上述待处理格调标识关联有第一关键词集合,则确定该第一关键词集合中是否存在与上述待识别文本信息匹配的关键词,若是,则将上述命名实体信息和上述主题标识输入上述待处理格调标识所关联的概率计算模型,得到上述待识别文本信息的格调是上述待处理格调标识所指示的格调的概率,并基于所得的概率,确定上述待识别文本信息的格调是否包括上述待处理格调标识所指示的格调。
在一些实施例中,上述利用上述格调标识集合中的格调标识所关联的概率计算模型,基于上述命名实体信息和上述主题,对上述待识别文本信息进行格调识别,还包括:响应于确定上述待处理格调标识所关联的第一关键词集合中不存在与上述待识别文本信息匹配的关键词,则确定上述待识别文本信息的格调不包括上述待处理格调标识所指示的格调。
在一些实施例中,上述利用上述格调标识集合中的格调标识所关联的概率计算模型,基于上述命名实体信息和上述主题,对上述待识别文本信息进行格调识别,还包括:若上述待处理格调标识没有关联第一关键词集合,则将上述命名实体信息和上述主题标识输入上述待处理格调标识所关联的概率计算模型,得到上述待识别文本信息的格调是上述待处理格调标识所指示的格调的概率,并基于所得的概率,确定上述待识别文本信息的格调是否包括上述待处理格调标识所指示的格调。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711432665.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种跨小区切换的方法及系统
- 下一篇:高铁用户识别方法、装置、设备及介质
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置