[发明专利]一种基于共享语料库获得智能会话回复内容的方法在审
申请号: | 201710076115.2 | 申请日: | 2017-02-13 |
公开(公告)号: | CN106709072A | 公开(公告)日: | 2017-05-24 |
发明(设计)人: | 陈包容 | 申请(专利权)人: | 长沙军鸽软件有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410000 湖南省长沙市高新开发*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 共享 语料库 获得 智能 会话 回复 内容 方法 | ||
1.一种基于共享语料库获得智能会话回复内容的方法,其特征在于,包括:
建立与通讯方对应的个人语料库,其中,所述通讯方的数目大于一;
将多个所述通讯方的个人语料库进行合并,获得共享语料库;
在所述共享语料库中匹配与当前会话内容匹配的回复内容,并将所述回复内容作为与所述当前会话内容对应的会话回复内容。
2.根据权利要求1所述的基于共享语料库获得智能会话回复内容的方法,其特征在于,建立与通讯方对应的个人语料库包括:
采集通讯方的会话内容;
获取所述会话内容中的会话对;
根据预设的场景标签,采集获得所述会话对与所述场景标签对应的场景标签值;
将所述会话对、所述场景标签以及与所述场景标签对应的场景标签值进行匹配组合,从而生成与所述通讯方对应的个人语料库。
3.根据权利要求2所述的基于共享语料库获得智能会话回复内容的方法,其特征在于,获取所述会话内容中的会话对包括:
根据所述会话内容中会话句的语义,确定所述会话内容中的发起句和回复句;
根据预设的类型判断规则,确定所述发起句和所述回复句的类型;
根据所述发起句以及所述发起句与下一条发起句之间的回复句提取基础会话对;
根据所述基础会话对、所述基础会话对中发起句和回复句的类型,提取至少一个会话对。
4.根据权利要求3所述的基于共享语料库获得智能会话回复内容的方法,其特征在于,根据所述会话内容中会话句的语义,确定所述会话内容中的发起句和回复句包括:
判断所述会话内容中的会话句在预设时间区间内是否有通讯对方发送的上文,若无,则将所述会话句确定为发起句;
若有,则判断所述会话句是否与所述通讯对方发送的上文无语义关联,若是,则将所述会话句确定为发起句,否则将所述会话句确定为回复句。
5.根据权利要求4所述的基于共享语料库获得智能会话回复内容的方法,其特征在于,根据预设的类型判断规则,确定所述发起句的类型包括:
判断所述发起句是否为具有完整独立语义的语句,若是,则判断所述发起句是否由多个具有完整独立语义的单句组成,若是,则将所述发起句的类型确定为复句发起句类型,否则为单句发起句类型;若否,则判断所述发起句是否包含具有完整独立语义的单句,若包含,则将所述发起句的类型确定为非标准复句发起句类型,若不包含,则为非标准单句发起句类型;
搜索非标准单句发起句类型的所述发起句是否有自己的上文和下文连续会话句,若无,则不进行衍生扩展,若有,则进一步判断非标准单句发起句类型的所述发起句是否可与所述自己的上文和下文连续会话句合并成具有完整独立语义的语句,若能,则将非标准单句发起句类型的所述发起句的类型衍生扩展为非标准句群发起句类型,若不能,则不进行衍生扩展;
搜索非标准复句发起句类型的所述发起句是否有自己的上文和下文连续会话句,若无,则不进行衍生扩展,若有,则进一步判断非标准复句发起句类型的所述发起句是否可与所述自己的上文和下文连续会话句合并成具有完整独立语义的语句,若能,则将非标准复句发起句类型的所述发起句的类型衍生扩展为非标准句群发起句类型,若不能,则不进行衍生扩展;
判断单句、复句、非标准单句、非标准复句以及非标准句群类型的所述发起句是否有自己的上文和下文连续会话句,若有,则进一步判断所述发起句是否可与自己的上文和下文连续会话句合并成语义关联的句群,若是,则将所述发起句的类型衍生扩展为句群发起句类型,否则不进行衍生扩展。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙军鸽软件有限公司,未经长沙军鸽软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710076115.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:网络交易处理方法及装置
- 下一篇:一种在线数字中药平台系统