[发明专利]规则语言模型的生成方法及装置在审
申请号: | 202011605389.4 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112820280A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 陈孝良;冯大航;焦伟;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/06;G10L15/16;G06F40/30;G06K9/62;G06N3/02;G10L15/22;G06F40/211;G06F40/284 |
代理公司: | 北京竹辰知识产权代理事务所(普通合伙) 11706 | 代理人: | 聂鹏 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 规则 语言 模型 生成 方法 装置 | ||
1.一种规则语言模型的生成方法,其特征在于,包括:
获取原始规则语言模型并将所述原始规则语言模型转换成加权有限状态转换器结构的第一图;
获取统计语言模型并将所述统计语言模型转换成加权有限状态转换器结构的第二图;
将所述第一图和所述第二图合并得到规则语言模型的加权有限状态转换器结构的第三图;其中所述第三图中的边的权重根据所述第一图和所述第二图中的对应边的权重得到。
2.如权利要求1所述的规则语言模型的生成方法,其特征在于,所述原始规则语言模型通过预设的规则生成;所述第一图中包括多个第一状态节点以及所述第一状态节点之间的第一边,所述第一边包括输入字符和输出字符以及所述第一边的第一权重;多个所述第一边所形成的路径表示所述原始规则语言模型所能识别的字符串。
3.如权利要求1所述的规则语言模型的生成方法,其特征在于,所述统计语言模型通过通用语料生成;所述第二图中包括多个第二状态节点以及所述第二状态节点之间的第二边,所述第二边包括输入字符和输出字符以及所述第二边的第二权重;多个所述第二边所形成的路径表示所述统计语言模型所能识别的字符串。
4.如权利要求2或3中任一项所述的规则语言模型的生成方法,其特征在于,所述将所述第一图和所述第二图合并得到规则语言模型的加权有限状态转换器结构的第三图,包括:
获取所述第一图的初始第一状态节点和所述第二图的初始第二状态节点以形成当前状态节点对;
获取离开所述当前状态节点对中的第一状态节点的所有第一边;
获取离开所述当前状态节点对中的第二状态节点的所有第二边;
将符合合并规则的第一边和第二边合并为第三边;其中所述第三边的起始点为所述当前状态节点对,所述第三边的目标状态节点为生成所述第三边的第一边的目标状态节点和生成所述第三边的第二边的目标状态节点所形成的目标状态节点对;
将所述目标状态节点对作为当前状态节点对迭代执行上述合并操作直至没有符合合并规则的第一边和第二边或者所述当前状态节点对由第一图和第二图的终点状态节点形成。
5.如权利要求4所述的规则语言模型的生成方法,其特征在于,所述合并规则包括:所述第一边的输出字符与所述第二边的输入字符相同。
6.如权利要求4所述的规则语言模型的生成方法,其特征在于,所述合并规则包括:所述第一边的输入或输出字符与所述第二边的输入或输出字符中的任一个相同。
7.如权利要求4中任一项所述的规则语言模型的生成方法,其特征在于,所述将符合合并规则的第一边和第二边合并为第三边,包括:
将当前状态节点对作为第三边的起始状态节点;
根据所述第一边和所述第二边的目标状态节点生成所述第三边的目标状态节点;
将所述第一边的输入字符作为所述第三边的输入字符;
将所述第二边的输出字符作为所述第三边的输出字符。
8.如权利要求4中的规则语言模型的生成方法,其特征在于,所述方法还包括:
获取第三图中以同一个状态节点为起始状态节点的第三边;
将输入字符相同的所述第三边进行合并。
9.如权利要求4中的规则语言模型的生成方法,其特征在于,所述方法还包括:
去除所述第三图中的空边。
10.一种规则语言模型的生成装置,其特征在于,包括:
第一构图模块,用于获取原始规则语言模型并将所述原始规则语言模型转换成加权有限状态转换器结构的第一图;
第二构图模块,用于获取统计语言模型并将所述统计语言模型转换成加权有限状态转换器结构的第二图;
合并模块,用于将所述第一图和所述第二图合并得到规则语言模型的加权有限状态转换器结构的第三图;其中所述第三图中的边的权重根据所述第一图和所述第二图中的对应边的权重得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011605389.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种报文转发方法及装置
- 下一篇:一种气体快速采样处理气室