[发明专利]一种辅助人工文本标注的方法和系统在审
申请号: | 202010676187.2 | 申请日: | 2020-07-14 |
公开(公告)号: | CN113935284A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 王雨萱;徐昀 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06F40/117 | 分类号: | G06F40/117 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 张云珠;苏银虹 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 辅助 人工 文本 标注 方法 系统 | ||
提供一种辅助人工文本标注的方法和系统,方法包括:检测针对标注文本的标注操作;响应于检测到针对标注文本的标注操作,如果标注文本为重复标注文本,以提示有标注文本为重复标注文本的方式,显示将标注结果切换为当前标注结果的标注文本;检测针对重复标注文本显示覆盖标注结果的操作,其中,覆盖标注结果包括重复标注文本的标注结果中除了当前标注结果之外的标注结果;以及响应于检测到针对重复标注文本显示覆盖标注结果的操作,在重复标注文本附近显示覆盖标注结果的列表。
技术领域
本申请涉及文本标注技术,更具体地讲,涉及一种辅助人工文本标注的方法和系统。
背景技术
人工标注过程可概括为人工提取文本中的实体,并对每个实体进行分类或打标签。对于有监督的机器学习,需要有标注的数据来作为先验经验,标注的数量和质量,一定程度上决定着机器学习的最终效果。
标注从整体上可分为为标注文本标注节点类型和关系类型两类。以知识图谱为例,文本标注主要集中在冷启动阶段(机器尚未开始学习),假如需要让机器学会什么是“公司”,需要人工在多篇文本中将符合“公司”语义的内容标注出来,然后模型以此为输入逐渐掌握“公司”的文本特征,以实现自动检测,自动识别,这就称为标注节点。同理,若需要让机器学会“创始人-建立-公司”这样的完整关系,需要先指明当前正在标注的关系类型(“创始人-建立-公司”),并依次标出前置节点(“创始人”)、与后置节点(“公司”),这就称为标注关系。
在对文本标注过程中,每对一个标注文本进行一次标注,可以生成针对该标注文本的一种标注结果,当对一个标注文本进行了多种不同的标注时,可以生成针对该标注文本的至少多种标注结果。标注文本的可能具有多种标注结果,然而在现有技术中,用户无法直观地获知标注文本是否具有多种标注结果。通常在文本标注页面的文本区中,用户往往只能看见该标注文本一个的标注结果,用户无法直观看见该标注文本的其他标注结果,信息显示较为有限,导致用户的使用体验较差。
发明内容
本发明示例性实施例可至少解决上述问题,也可不解决上述问题。
根据本发明的一方面,一种辅助人工文本标注的方法,包括:检测针对标注文本的标注操作;响应于检测到针对标注文本的标注操作,如果标注文本为重复标注文本,以提示有标注文本为重复标注文本的方式,显示将标注结果切换为当前标注结果的标注文本;检测针对重复标注文本显示覆盖标注结果的操作,其中,覆盖标注结果包括重复标注文本的标注结果中除了当前标注结果之外的标注结果;以及响应于检测到针对重复标注文本显示覆盖标注结果的操作,在重复标注文本附近显示覆盖标注结果的列表。
可选地,以提示有标注文本为重复标注文本的方式,显示将标注结果切换为当前标注结果的标注文本包括:将标注文本显示为选框选中状态,并且选框内添加有当前标注结果,其中,选框的预定位置还设置有重复标注提示符,用于提示选框内的标注文本为重复标注文本。
可选地,针对重复标注文本显示覆盖标注结果的操作,包括:选择重复标注标识符,并且,响应于检测到针对重复标注文本显示覆盖标注结果的操作,在重复标注文本附近显示覆盖标注结果的列表,包括:
响应于检测到选择重复标注标识符的操作,在重复标记标识符被选中的期间,在重复标注文本附近显示覆盖标注结果的列表。
可选地,通过点击重复标注标识符或者将鼠标指针悬停在重复标注标识符选择重复标注标识符。
可选地,重复标注标识符包括设置在选框的右上角的角标。
可选地,方法还包括:检测针对重复标注文本重设当前标注结果的操作;以及响应于检测到针对重复标注文本重设当前标注结果的操作,显示重设后的重复标注文本的标注结果。
可选地,针对重复标注文本重设当前标注结果的操作包括:在显示的覆盖标注结果的列表中选择一标注结果作为重设的标注结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010676187.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据报文纠错方法和数据报文纠错装置
- 下一篇:一种面齿轮蜗杆砂轮磨齿加工方法