[发明专利]一种获取聊天回复内容的方法及装置有效
申请号: | 201510742339.3 | 申请日: | 2015-11-04 |
公开(公告)号: | CN106649410B | 公开(公告)日: | 2020-05-01 |
发明(设计)人: | 陈包容 | 申请(专利权)人: | 陈包容 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 合肥左心专利代理事务所(普通合伙) 34152 | 代理人: | 周翠娟 |
地址: | 410000 湖南省长沙市高新开发*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 聊天 回复 内容 方法 装置 | ||
本发明公开了一种获取聊天回复内容的方法及装置,该方法通过预先设立至少由一个场景信息项构成的场景信息项集;建立以场景信息项为聊天主题的场景数据库;对聊天发起句进行预处理,获得分词文本;在场景信息项集中获取与分词文本关联的场景信息项,得到关联场景信息项;采用与关联场景信息项对应的场景数据库对聊天发起句进行匹配,获得与聊天发起句匹配的聊天回复内容,解决了现有获取聊天回复内容只采用单一数据库中进行数据匹配,使得获取的聊天回复内容不准确或不全面的技术问题,且采用多个关联场景信息项对应的场景数据库对聊天发起句进行数据匹配,使得匹配获得的聊天回复内容更丰富,提升了用户体验。
技术领域
本发明涉及通讯技术领域,具体涉及一种获取聊天回复内容的方法及装置。
背景技术
目前,不管是智能聊天机器人系统提供的智能聊天回复内容、还是移动通讯终端提供给通讯双方用于选择或智能回复的聊天回复内容,大多是通过数据库匹配的方式获取。这种通过数据库匹配方法获取聊天回复内容的方法主要分为二个步骤,即首先对聊天发起句进行预处理,获得分词文本,然后将获得的分词文本与预先建立的数据库进行匹配,从而获得聊天回复内容。但这种匹配方式往往只采用单一数据库进行数据匹配,从而使得获取的聊天回复内容可能不准确或不全面,从而导致聊天的智能化水平低以及用户体验不佳。
例如针对聊天发起句“一起去旅游吗?”,其回答可通过匹配与“旅游”话题对应的数据库获得与之对应的回复结果(例如“好呀,我喜欢旅游。”),然而,针对同一个聊天发起句(例如“一起去旅游吗?”)在现实生活中往往需要有不同的回复结果(例如“天气不好,下次再去,怎么样?”、“我比较喜欢宅在家,不喜欢旅游。”、“最近工作太忙了,抽不出时间去旅游。”等等)。
发明内容
本发明提供了一种获取聊天回复内容的方法及装置,以解决现有获取聊天回复内容只采用单一数据库进行数据匹配,从而使得获取的聊天回复内容不准确或不全面的技术问题。
根据本发明的一方面,提供了一种获取聊天回复内容的方法,包括:
预先设立至少由一个场景信息项构成的场景信息项集;
建立以场景信息项为聊天主题的场景数据库;
对聊天发起句进行预处理,获得分词文本,预处理包括分词、语义消歧、去除停用词;
在场景信息项集中获取与分词文本关联的场景信息项,得到关联场景信息项;
采用与关联场景信息项对应的场景数据库对聊天发起句进行匹配,获得与聊天发起句匹配的聊天回复内容。
进一步地,建立以场景信息项为主题的场景数据库包括:
建立与场景信息项对应的初始数据库,初始数据库包括至少一个以场景信息项为聊天主题的初始聊天对,初始聊天对以二元句对的形式进行保存;
获取与初始聊天对语义关联的初始数据库,作为初始聊天对的关联数据库;
在关联数据库中创建以关联数据库对应的场景信息项为聊天主题且与初始聊天对中的聊天发起句对应的关联答复句,并将聊天发起句以及关联答复句作为初始聊天对的关联聊天对;
将场景信息项对应的初始数据库中的初始聊天对,以及以初始数据库作为关联数据库时在其中创建的关联聊天对,作为场景信息项的场景数据库。
进一步地,获取与初始聊天对语义关联的初始数据库,作为初始聊天对的关联数据库包括:
选取预先设定的与初始聊天对语义关联度大于预设关联阈值的场景信息项对应的初始数据库作为初始聊天对的关联数据库。
进一步地,获取与初始聊天对语义关联的初始数据库,作为初始聊天对的关联数据库包括:
采集初始聊天对所属的初始数据库中的所有初始聊天对作为样本聊天对;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陈包容,未经陈包容许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510742339.3/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法