[发明专利]文本上下文处理方法、装置、电子设备和存储介质在审
申请号: | 202210107962.1 | 申请日: | 2022-01-28 |
公开(公告)号: | CN114417827A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 顾军;张志强 | 申请(专利权)人: | 北京弗罗达教育科技有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/253;G06F40/216;G06F40/289;G06F16/35 |
代理公司: | 北京法胜知识产权代理有限公司 11922 | 代理人: | 戎郑华 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 上下文 处理 方法 装置 电子设备 存储 介质 | ||
本公开关于一种文本上下文处理方法、装置、电子设备和存储介质,涉及计算机技术领域。该方法包括:获取待处理文本,响应于用户精简文本的下文操作,将待处理文本输入语法分析树统计模型,匹配过滤规则,删除低权重的文本单元,生成精简文本;其中,待处理文本中包括多个文本单元,文本单元为词语或短语,响应于用户新增文本的上文操作,获取新增文本单元,确定新增文本单元对应的在待处理文本中的目标位置,将新增文本单元添加至目标位置,生成新增文本。由此,用户可交替进行上下文操作获取文本的语境信息,上下文操作实现了文本从繁入简、由简入繁的双向操作,方便用户建立全局观、训练语感,达到快速掌握语言的目的。
技术领域
本公开涉及计算机技术领域,尤其涉及一种文本上下文处理方法、装置、电子设备和存储介质。
背景技术
自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
相关技术中,用户通过阅读文章训练语感进行语言学习,但是文章中通常采用较长的语句以表达丰富的含义,对于用户来说,过长的语句很难抓住重点,使得语言学习的难度增加。
发明内容
本公开提供一种文本上下文处理方法、装置、电子设备和存储介质,以至少解决相关技术中过长的语句用户难以抓住重点,语言学习的难度较高的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种文本上下文处理方法,包括:获取待处理文本;响应于用户精简文本的下文操作,将所述待处理文本输入至语法分析树统计模型,获取目标文本单元,删除所述待处理文本中的目标文本单元,生成精简文本;其中,所述待处理文本中包括多个文本单元,所述文本单元为词语或短语;响应于用户新增文本的上文操作,获取新增文本单元,确定所述新增文本单元对应的在所述待处理文本中的目标位置,将所述新增文本单元添加至所述目标位置,生成新增文本。
在一些实施例中,所述响应于用户精简文本的下文操作,将所述待处理文本输入至语法分析树统计模型,获取目标文本单元,删除所述待处理文本中的目标文本单元,生成精简文本下文操作,包括:将所述待处理文本输入至语法分析树统计模型,获取与所述待处理文本匹配的目标语法规则;根据所述目标语法规则,获取所述待处理文本对应的多个文本单元,以及所述文本单元对应的权重等级;在根据所述权重等级,确定存在所述目标文本单元的情况下,响应于用户精简文本的下文操作,删除所述待处理文本中的所述目标文本单元,生成所述精简文本。
在一些实施例中,所述在根据所述权重等级,确定存在所述目标文本单元的情况下,响应于用户精简文本的下文操作,删除所述待处理文本中的所述目标文本单元,生成所述精简文本,包括:
在根据所述权重等级,确定存在N个等级的文本单元的情况下,响应于用户第一次精简文本的下文操作,根据所述权重等级,确定所述待处理文本中的所述权重等级为第一等级的文本单元为目标文本单元,删除目标文本单元,生成第一精简文本;其中,N为大于3的整数;响应于用户第二次精简文本的下文操作,根据所述权重等级,确定所述第一精简文本中所述权重等级为第二等级的文本单元为目标文本单元,删除目标文本单元,生成第二精简文本;以此类推,直至响应于用户第N-1次精简文本的下文操作,根据所述权重等级,确定所述第N-2精简文本中所述权重等级为第N-1等级的文本单元为目标文本单元,删除目标文本单元,生成所述精简文本。
在一些实施例中,所述方法,还包括:在根据所述权重等级,确定不存在所述目标文本单元的情况下,提示所述待处理文本为精简文本并退出。
在一些实施例中,所述方法,还包括:将所述精简文本输入至所述语法分析树统计模型,在存在匹配的语法规则的情况下,向用户提供所述精简文本;在不存在匹配的语法规则的情况下,提示精简文本错误并退出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京弗罗达教育科技有限公司,未经北京弗罗达教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210107962.1/2.html,转载请声明来源钻瓜专利网。