[发明专利]在自然语言文本上进行标记的方法有效
申请号: | 202010595674.6 | 申请日: | 2020-06-28 |
公开(公告)号: | CN113297826B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 马振文;王若愚;谭淳;沙群皓;李国强 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F40/117 | 分类号: | G06F40/117;G06F40/189;G06F40/289 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 文本 进行 标记 方法 | ||
1.一种在自然语言文本上进行标记的方法,其特征在于,通过人机交互设备在文本中触发标记工具可识别事件,通过标记工具判断该事件所属的标记元素结构并将带标记的文本内容整体划分成若干文本块,依照文本顺序依次排布并根据显示要素区分为标题或段落,将文本对应的排版成特定的文档结构,经解析并绘制实现自动适应各种元素的间距,保证排版的统一;
所述的文本块包括分词、文本补全、实体、关系元素;
所述的标记工具包括:用于构建、嵌套和绘制词元素的词模块、用于构建、嵌套和绘制文本补全元素的文本补全模块、用于构建、嵌套和绘制实体元素的实体模块、用于构建、嵌套和绘制关系元素的关系模块、用于排版绘制词元素、实体元素和/或关系元素的行模块、用于排版绘制行模块的段模块以及用于排版绘制段模块并进行段落布局的布局排版模块;
所述的标记元素结构包括:分词元素结构、文本补全结构、实体元素结构、关系元素结构;
所述的对应的排版包括:分词标记、合词标记、补全文本标记、补全文本删除、补全文本修改、实体标记、实体删除、实体修改、关系标记、关系删除、关系修改;
所述的分词标记是指:在标记分词时,光标移至需要分词的分词元素结构中的分词范围标识符范围内;然后用户通过人机交互设备在特定位置触发标记工具可识别事件;标记工具判断该事件是否是分词标记事件以及该分词元素结构能否分开,当该事件是分词事件且能够分开,则标记工具将该分词元素结构拆分成个新的分词元素结构并按照顺序排列;
所述的合词标记是指:光标移至分词元素结构中的分词范围标识符范围内,然后用户通过人机交互设备在特定位置触发标记工具可识别事件;标记工具判断该事件是否是合词事件以及光标所在的分词元素结构相邻区域内是否有可以合并的分词元素结构,当合词事件且光标所在的分词元素结构相邻区域内有可以合并的分词元素结构,则标记工具就将光标所在的分词元素结构和可以合并的分词元素结构合成一个新的分词元素结构;
所述的补全文本标记是指:用户首先通过人机交互设备将光标移动至需要增加文本补全元素的位置,然后触发标记工具可识别事件;标记工具判断该事件是否是补全文本标记事件,当该事件是补全文本标记事件则标记工具在文本对应的位置创建一个新的补全文本元素结构;接下来用户编辑该元素的直到编辑完成;最后标记工具根据编辑好的更新补全文本元素结构;
所述的补全文本删除是指:在删除补全文本元素时,用户首先通过人机交互设备选中需要删除的补全文本元素结构,随后用户通过人机交互设备触发标记工具可识别的事件;标记工具判断是否是删除补全文本事件,当该事件是删除补全文本事件,则标记工具将删除选中的补全文本元素结构;
所述的补全文本修改是指:在修改补全文本元素时,用户首先通过人机交互设备选中需要修改的补全文本元素结构,随后用户通过人机交互设备触发一个标记工具可识别的事件;标记工具判断是否是修改补全文本事件,当该事件是修改补全文本事件,则用户将可以修改选中的补全文本元素结构中的;用户编辑完成后,标记工具根据编辑好的更新该选中的补全文本元素结构;
所述的实体标记是指:在标记实体时,用户首先通过人机交互设备设置需要的实体标签,然后选中一个或多个分词元素结构、补全文本元素结构或实体元素结构;接下来用户通过人机交互设备触发标记工具可识别事件;标记工具判断该事件是否是实体标记事件以及选中的元素能否用于新建实体元素,当该事件是实体标记事件且选中的元素能够用于新建实体元素,则标记工具将根据选中的元素创建一个新的实体元素结构;
所述的实体删除是指:在删除实体时,用户首先通过人机交互设备选中需要删除的实体元素结构;接下来用户通过人机交互设备触发标记工具可识别事件;标记工具判断该事件是否是实体删除事件以及选中的实体元素结构能否被删除,当该事件是实体删除事件且选中的元素能够被删除,则标记工具将删除该选中的实体元素结构,恢复该实体元素结构创建之前的状态;
所述的实体修改是指:在修改实体时,用户首先通过人机交互设备选中需要修改的实体元素结构,然后设置该实体元素结构中子结构的修改方案;接下来用户通过人机交互设备触发标记工具可识别事件;标记工具判断该事件是否是实体修改事件,当该事件是实体修改事件,则标记工具将根据设置的实体修改方案更新选中的实体元素结构;
所述的关系标记是指:在标记关系时,用户首先通过人机交互设备设置需要的关系标签,然后选中两个元素分别作为和;接下来用户通过人机交互设备触发标记工具可识别事件;标记工具判断该事件是否是关系标记事件以及选中的元素能否用于新建关系元素,当该事件是关系标记事件且选中的元素能够用于新建关系元素,则标记工具将根据选中的元素创建一个新的;
所述的关系删除和/或关系修改是指:在删除关系时,用户首先通过人机交互设备选中需要删除的关系元素结构;接下来用户通过人机交互设备触发标记工具可识别事件;标记工具判断该事件是否是关系删除事件以及选中的关系元素结构能否被删除,当该事件是关系删除事件且选中的元素能够被删除,则标记工具将删除该选中的关系元素结构,恢复该关系元素结构创建之前的状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010595674.6/1.html,转载请声明来源钻瓜专利网。