[发明专利]一种文本描写类型识别方法及装置有效
申请号: | 201610836053.6 | 申请日: | 2016-09-20 |
公开(公告)号: | CN107844471B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 宋巍;付瑞吉;胡国平;秦兵;刘挺 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/289;G06F40/211;G06F16/35 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 230088 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 描写 类型 识别 方法 装置 | ||
本发明提供了一种文本描写类型识别方法及装置,其中方法包括:获取目标描写类型及所述目标描写类型的描写搭配种子集合,其中每个描写搭配由描写对象及描写词组成;根据第一预设规则及预先构建的无类型描写搭配集合对所述描写搭配种子集合进行增长,以得到描写搭配扩展集合;获取待识别的文本数据,并根据所述描写搭配扩展集合识别所述文本数据是否包含所述目标描写类型。本发明从目标描写类型的描写搭配种子集合出发,得到描写搭配扩展集合,然后据此识别所述文本数据是否包含所述目标描写类型,从而实现了目标描写类型识别的自动化,大大减少了人工工作量,提高了识别的效率,同时避免了人工主观识别的负面影响,从而也提高了识别的准确性。
技术领域
本发明涉及自然语言处理领域,尤其涉及一种文本描写类型识别方法及装置。
背景技术
写作是人们日常生活和学习中必不可少的实用技能,也是学校教育中要求学生重点掌握的必备能力。如果要写出文字规范、文笔优美、结构清晰的高质量的作品,需要写作人员能够掌握较好的写作能力与技巧,尤其是需要能够熟练使用常用的表达方式,如“记叙”、“议论”、“描写”、“说明”等。其中,“描写”就是用生动形象的语言,把人物或景物的状态具体地描绘出来,其作用是再现自然景色中的事物形状,描绘人物的形貌及内心世界,使用人物活动的环境具体化。进一步的,“描写”按照描写目标的不同又可以细分为多种描写类型,如景物描写、肖像描写、心理描写、神态描写,等等。
识别出文学作品或其它文本中的描写表达方式的类型,或者说是判断文本数据中是否包含某种指定的描写类型(即目标描写类型),对于自动作文评分、写作助手、写作例句搜索等应用具有重要意义。例如,对学生语文作文进行描写类型识别可判断一篇作文的写作质量,如以风景描写为题的作文中,应该包含大量景物描写类型的内容。在现有技术中,识别文本数据中是否包含目标描写类型时,一般需要人工查看相应文本内容,然后根据人工对文本内容的理解,主观给出当前文本数据中是否包含目标描写类型。例如当目标描写类型为景物描写类型时,需要人工查看待识别文本数据后,根据文本内容,判断出当前文本数据中是否包含景物描写类型。
然而发明人在实现本发明的过程中发现,随着信息技术的发展,文本数据量变得非常庞大,例如当面对成千上万篇学生考试作文时,如果由人工一篇篇查看作文内容再给出目标描写类型识别结果,则工作量太大,识别效率非常低。另外,现有方法一般是由人工根据对文本内容的理解后给出的识别结果,然而不同人对同一文本内容的理解经常会存在差异,导致给出的识别结果可能也存在较大差异,从而影响目标描写类型识别结果的准确度,尤其对于学生考试的作文识别,如果出现识别错误,则会造成较大的负面影响。
发明内容
本发明提供一种文本描写类型识别方法及装置,以解决当前对文本描写类型进行识别时效率不高且准确度较低的技术问题。
根据本发明实施例的第一方面,提供一种文本描写类型识别方法,所述方法包括:
获取目标描写类型及所述目标描写类型的描写搭配种子集合,其中每个描写搭配由描写对象及描写词组成;
根据第一预设规则及预先构建的无类型描写搭配集合对所述描写搭配种子集合进行增长,以得到描写搭配扩展集合;
获取待识别的文本数据,并根据所述描写搭配扩展集合识别所述文本数据是否包含所述目标描写类型。
可选的,根据第一预设规则及预先构建的无类型描写搭配集合对所述描写搭配种子集合进行增长,包括:
i、在所述描写搭配种子集合中对描写对象进行聚类,以得到一个或多个聚类后的描写对象子集;
ii、根据第二预设规则及所述无类型描写搭配集合,对每个所述子集进行扩展,以实现所述种子集合的增长;
iii、判断所述描写搭配种子集合中增加的描写搭配的数量是否超过第一阈值,如果超过第一阈值,则继续执行步骤i以对所述描写搭配种子集合继续进行增长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610836053.6/2.html,转载请声明来源钻瓜专利网。