[发明专利]一种文本词性标注的方法及装置有效
申请号: | 201910817945.5 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110532391B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 李金锋;杨绳春;洪文龙 | 申请(专利权)人: | 网宿科技股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/31;G06F40/289;G06N20/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 张怀阳 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 词性 标注 方法 装置 | ||
1.一种文本词性标注的方法,其特征在于,包括:
确定用户设置的词性;
获取用户从语句中选中的第一类词;
依据所述选中的第一类词将所述语句分为多个语段进行存储,并将所述选中的第一类词的词性标注为所述用户设置的词性并进行显示;
在将所述选中的第一类词的词性标注为所述用户设置的词性并进行显示之后,还包括:
获取用户修改的词性以及用户选中的第二类词;所述用户修改的词性为所述用户针对所述用户设置的词性进行变换所设置的词性;
依据所述第二类词将所述第二类词所在的语段分为多个语段进行存储,并将所述第二类词的词性标注为所述用户修改的词性。
2.如权利要求1所述的方法,其特征在于,所述依据所述选中的第一类词将所述语句分为多个语段进行存储,并将所述选中的第一类词的词性标注为所述用户设置的词性并进行显示,包括:
以所述选中的第一类词为分割线,将所述语句分为多个语段并进行排序存储;
将选中的第一类词的词性标注为所述用户设置的词性,并将标注的词性显示在所述语句中。
3.如权利要求1所述的方法,其特征在于,在将所述选中的第一类词的词性标注为所述用户设置的词性并进行显示之后,还包括:
将标注为所述用户设置的词性的词设置为相同的背景色;
其中,不同词性的词对应的背景色不同。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
获取用户点击的已标注词性的词;
将所述已标注词性的词的词性修改为未分类,确定词性修改为未分类的词的相邻的词的词性是否为未分类,若是,则将所述词性修改为未分类的词语与相邻的词性为未分类的词进行合并存储。
5.如权利要求1至4任一项所述的方法,其特征在于,所述词性包括分类、动词、名称、代词、形容词、数词、量词或停用词;
其中,词性为未分类的词不显示词性。
6.一种文本词性标注的装置,其特征在于,包括:
确定单元,用于确定用户设置的词性;
获取单元,用于获取用户从语句中选中的第一类词;
处理单元,用于依据所述选中的第一类词将所述语句分为多个语段进行存储,并将所述选中的第一类词的词性标注为所述用户设置的词性并进行显示;
所述处理单元还用于:
在将所述选中的第一类词的词性标注为所述用户设置的词性并进行显示之后,控制所述获取单元获取用户修改的词性以及用户选中的第二类词;所述用户修改的词性为所述用户针对所述用户设置的词性进行变换所设置的词性;
依据所述第二类词将所述第二类词所在的语段分为多个语段进行存储,并将所述第二类词的词性标注为所述用户修改的词性。
7.一种计算设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行权利要求1至5任一项所述的方法。
8.一种计算机可读非易失性存储介质,其特征在于,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行如权利要求1至5任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网宿科技股份有限公司,未经网宿科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910817945.5/1.html,转载请声明来源钻瓜专利网。