[发明专利]一种文本标注方法及装置在审

专利信息
申请号: 201910960330.8 申请日: 2019-10-10
公开(公告)号: CN110717312A 公开(公告)日: 2020-01-21
发明(设计)人: 徐安华;廉雨薇;马瑞璇;路德龙 申请(专利权)人: 北京明略软件系统有限公司
主分类号: G06F40/117 分类号: G06F40/117;G06F16/38;G06F16/35
代理公司: 11240 北京康信知识产权代理有限责任公司 代理人: 张秀英
地址: 100086 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 标签 目标文本 标注 拖动 多个目标 文本分类 触发指令 文本标注 指令 选中 标签分类 目标标签 目标选择 人工标注 文本标签 显示目标 预定位置 触发 文本 拓展
【说明书】:

发明提供了一种文本标注方法及装置,其中,该方法包括:接收触发对待标注的目标文本进行标注的触发指令;根据该触发指令在该目标文本所在页面的第一预定位置显示目标标签列表;接收选中该标签列表中的一个或多个目标标签的目标选择指令,并接收将选中的该一个或多个目标标签拖动到该目标文本中的拖动指令;根据该拖动指令为该目标文本标注该一个或多个目标标签。可以解决相关技术中人工为文本标注标签较为繁琐的问题,通过直接从标签列表中选中目标标签的方式,便可完成文本标签的标注,简化了人工标注的方式,且不同于常见的单标签分类文本,将文本分类拓展为支持多标签的文本分类标注,让多标签的文本分类更加快捷。

技术领域

本发明涉及信息技术领域,具体而言,涉及一种文本标注方法及装置。

背景技术

机器了解人类的语言,一直以来是各界学者努力解决的问题。如果机器可以完全了解人类语言,并根据不同的情况给出合适的反馈,那么人工智能也将成为现实。人工智能作为一个广为人知的概念使大家对于机器解决各类问题抱有无限期待,然而,被多数人所不知的是,机器之所以智能都是源自于人工的信息输入,是大量的人工信息输入才使机器变得智能。

自然语言处理是人工智能的一个主要问题,自然语言处理通俗来讲就是让机器可以理解人类的文字、语音等各种表现形式的语言的含义。同样的,自然语言处理依旧需要大量的人工的信息输入作为机器学习的基础。

人工的信息输入并不是任何信息都可以,对文本领域来讲,人工的信息输入必须是标注过的信息,只有经过标注的数据对于机器来说才是有价值的人工的信息输入——也就是人们所常说的训练集,机器学习必须有一定量的训练集作为学习来源。

数据的标注其实就是按照人类的已具备的知识将数据进行标记、分类等操作。相当于做一份专属于机器的学习资料,让机器进行学习。

在由人工标注数据时,一般是由人工标注文本对应的标签,但是相关技术中的人工标注较为繁琐。

针对相关技术中人工为文本标注标签较为繁琐的问题,尚未提出解决方案。

发明内容

本发明实施例提供了一种文本标注方法及装置,以至少解决相关技术中人工为文本标注标签较为繁琐的问题。

根据本发明的一个实施例,提供了一种文本标注方法,包括:

接收触发对待标注的目标文本进行标注的触发指令;

根据所述触发指令在所述目标文本所在页面的第一预定位置显示目标标签列表;

接收选中所述标签列表中的一个或多个目标标签的目标选择指令,并接收将选中的所述一个或多个目标标签拖动到所述目标文本中的拖动指令;

根据所述拖动指令为所述目标文本标注所述一个或多个目标标签。

可选地,根据所述触发指令在所述目标文本所在页面的第一预定位置显示目标标签列表包括以下至少之一:

在所述第一预定位置以预定透明度并覆盖所述目标文本的部分区域的方式显示包含根据使用频率确定的预定数量的标签的第一标签列表;

在所述第一预定位置以所述预定透明度并覆盖所述目标文本的部分区域的方式显示包含预定时间段内使用过的标签的第二标签列表;

在所述第一预定位置以所述预定透明度并覆盖所述目标文本的部分区域的方式显示包含多个标签类别和所述多个标签类别对应的标签的第三标签列表,其中,每个所述标签类别对应多个标签,每个所述标签类别与对应的多个标签通过相同的标识标记,所述目标标签列表包括以下至少之一:所述第一标签列表、所述第二标签列表、所述第三标签列表。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910960330.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top