[发明专利]一种基于图到序列的中文韵律边界预测的方法在审
申请号: | 202010845400.8 | 申请日: | 2020-08-20 |
公开(公告)号: | CN111951781A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 陈帅婷;王龙标;本多清志 | 申请(专利权)人: | 天津大学 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G10L25/30 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程小艳 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 序列 中文 韵律 边界 预测 方法 | ||
1.一种基于图到序列的中文韵律边界预测的方法,其特征在于,具体步骤包括以下四部分:
(1)字嵌入表示特征:
将特征转换为数字表示,因此将字映射为实数域向量的技术称之为字嵌入;
(2)文本时序特征提取模型:
韵律边界的标注为在时间维度上的序列标注;
(3)文本空间信息:
输入文本序列处理为图形结构,通过添加空间信息来处理韵律边界之间的依赖关系;
(4)时空特征结合:
捕捉到时间上的信息和空间信息,进行递归聚合,学习节点的高级表示,GAT注意机制用于捕获空间上的相关性,并将上下文信息到嵌入空间中。
2.根据权利要求1所述的一种基于图到序列的中文韵律边界预测的方法,其特征在于,所述步骤(3)的具体策略是:将输入的文本序列转化成为图,文本序列中的字作为节点,字与字之间的关系作为边,从而通过图边界信息来表示语法和语义信息。
3.根据权利要求1所述的一种基于图到序列的中文韵律边界预测的方法,其特征在于,所述步骤(4)的具体步骤,将Bilstm提取到的时间序列特征和含有空间信息的图形结构,输入到基于图的注意力网络中,从空间上捕获序列内部的语法和语义信息和时间序列上的信息进行融合。
4.根据权利要求1所述的一种基于图到序列的中文韵律边界预测的方法,其特征在于,对于韵律界预测任务,连续标记之间存在依赖关系,对每句进行联合建模和解码。
5.根据权利要求4所述的一种基于图到序列的中文韵律边界预测的方法,其特征在于,在模型结构的输出端添加了一个随机条件域CRF层,在给定一组输入序列的条件下利用句子级信息进行韵律边界预测,允许网络在所有可能的序列中寻找最优路径作为最后预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010845400.8/1.html,转载请声明来源钻瓜专利网。