[发明专利]一种文本编辑方法及系统有效

申请号：	202110540630.8	申请日：	2021-05-18
公开（公告）号：	CN113139368B	公开（公告）日：	2023-04-11
发明（设计）人：	喻纯;史元春;杨欢	申请（专利权）人：	清华大学
主分类号：	G06F40/166	分类号：	G06F40/166;G06F40/284;G06N3/08
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	周初冬
地址：	10008***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本编辑方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种文本编辑方法及系统，该方法为：将用户用于编辑目标文本的语音内容转换为待处理文本，并对待处理文本进行分词处理得到相应的分词结果；将分词结果作为预设的意图识别模型的输入进行意图识别，得到待处理文本对应的意图识别结果；基于预设的序列标注模型对分词结果进行处理，得到与意图识别结果对应的关键信息；利用意图识别结果和与其对应的关键信息，对目标文本进行文本编辑处理。结合意图识别模型和序列标注模型，确定得到用户的语音内容中的意图识别结果和与其对应的关键信息，并基于意图识别结果和关键信息对目标文本进行文本编辑处理，提高对自然语言的处理准确率，以实现将语音交互应用于文本编辑。

技术领域

本发明涉及自然语言处理技术领域，具体涉及一种文本编辑方法及系统。

背景技术

随着科学技术的发展，智能手机和平板电脑等智能终端逐渐被广泛应用。由于语言的信息传递效率较高，语音交互在诸如文本编辑等复杂任务的处理上有较大的优势。

但是，目前由于对自然语言进行处理的方式的准确性较低，用户与智能终端的交互方式主要以手势交互为主，而语音交互仅限于智能终端的语音助手这一场景，因此如何将语音交互应用于文本编辑任务是目前亟需待解决的问题。

发明内容

有鉴于此，本发明实施例提供一种文本编辑方法及系统，以实现将语音交互应用于文本编辑任务这一目的。

为实现上述目的，本发明实施例提供如下技术方案：

本发明实施例第一方面公开一种文本编辑方法，所述方法包括：

将用户用于编辑目标文本的语音内容转换为待处理文本，并对所述待处理文本进行分词处理得到相应的分词结果；

将所述分词结果作为预设的意图识别模型的输入进行意图识别，得到所述待处理文本对应的意图识别结果，所述意图识别结果为插入意图、删除意图、替换意图或文本输入意图，所述意图识别模型由基于多条第一样本数据训练第一指定模型得到，每条所述第一样本数据为经过分词处理和意图标注后的样本数据；

基于预设的序列标注模型对所述分词结果进行处理，得到与所述意图识别结果对应的关键信息，所述序列标注模型由基于多条第二样本数据训练第二指定模型得到，每条所述第二样本数据为经过分词处理和标签标注处理后的样本数据；