[发明专利]一种非结构化文本的处理方法及装置在审
申请号: | 201711339979.5 | 申请日: | 2017-12-14 |
公开(公告)号: | CN108228542A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 邰亚琦;张娴;魏静如 | 申请(专利权)人: | 浪潮软件股份有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/30 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象类型 标注 非结构化文本 自定义指令 对象标注 接收用户 目标对象 预先设置 可选的 自定义 指令 | ||
本发明提供了一种非结构化文本的处理方法及装置,该方法,包括:预先设置至少一个对象类型;接收用户输入的对象自定义指令;根据所述对象自定义指令,生成用户自定义的至少一个对象类型;将用户自定义的至少一个对象类型和预先设置的至少一个对象类型作为至少一个可选的对象类型;确定用户选择的位于非结构化文本中的待标注内容;将所述待标注内容作为待标注的对象;接收用户输入的针对所述待标注的对象的对象标注指令;根据所述对象标注指令,从所述至少一个可选的对象类型中,确定目标对象类型;利用所述目标对象类型对所述待标注的对象进行标注。本发明能够更方便地从非结构化文本中获取所需要的数据。
技术领域
本发明涉及计算机技术领域,特别涉及一种非结构化文本的处理方法及装置。
背景技术
随着计算机、互联网和数字媒体等的进一步普及、人工智能的急剧发展,以文本、图形、图像、音频、视频等非结构化数据为主的信息急剧增加,面对如此巨大的信息海洋,特别是非结构化数据信息,如何存储、查询、分析、挖掘和利用这些海量信息资源就显得尤为关键。
现有技术中对于非结构化文本这种非结构化数据的处理还是简单的保存到数据库中。当用户需要从非结构化文本中获取需要的数据时,需要对整个非结构化文本进行逐字搜索,效率很低。
总之,现有技术中对非结构化文本的处理不便于从非结构化文本中获取需要的数据。
发明内容
本发明实施例提供了一种非结构化文本的处理方法及装置,能够更方便地从非结构化文本中获取所需要的数据。
一方面,本发明实施例提供了一种非结构化文本的处理方法,包括:
预先设置至少一个对象类型;
接收用户输入的对象自定义指令;
根据所述对象自定义指令,生成用户自定义的至少一个对象类型;
将用户自定义的至少一个对象类型和预先设置的至少一个对象类型作为至少一个可选的对象类型;
包括:
确定用户选择的位于非结构化文本中的待标注内容;
将所述待标注内容作为待标注的对象;
接收用户输入的针对所述待标注的对象的对象标注指令;
根据所述对象标注指令,从所述至少一个可选的对象类型中,确定目标对象类型;
利用所述目标对象类型对所述待标注的对象进行标注。
进一步地,
该方法进一步包括:
预先设置至少一个属性类型;
接收用户输入的属性自定义指令;
根据所述属性自定义指令,生成用户自定义的至少一个属性类型;
将用户自定义的至少一个属性类型和预先设置的至少一个属性类型作为至少一个可选的属性类型;
进一步包括:
接收用户输入的针对所述待标注的对象的属性标注指令;
根据所述属性标注指令,从所述至少一个可选的属性类型中,确定目标属性类型;
利用所述目标属性类型对所述待标注的对象进行标注。
进一步地,
该方法进一步包括:
预先设置至少一个关联类型,以及至少一个关联方向;
接收用户输入的关联自定义指令;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件股份有限公司,未经浪潮软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711339979.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:生成文档摘要的方法和装置
- 下一篇:一种法院庭审笔录标注系统、方法及存储介质