[发明专利]一种语言分析系统及方法在审
申请号: | 201910162323.3 | 申请日: | 2019-03-05 |
公开(公告)号: | CN109918683A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 黄练;林培煜;钟君柳;邓江海;苏兆南 | 申请(专利权)人: | 广东机电职业技术学院 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京华仲龙腾专利代理事务所(普通合伙) 11548 | 代理人: | 李静 |
地址: | 510080 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理单元 语种 比较选择单元 语言分析系统 数据库单元 输入单元 翻译 语句 语言 人工智能领域 分析过程 输出单元 形式转化 选择处理 语句输入 语言分析 语言数据 语种确定 分析 取用 存储 | ||
本发明涉及人工智能领域,具体的公开了一种语言分析系统及方法,包括输入单元、处理单元、数据库单元和输出单元;输入单元,接收初始语种的语句输入;处理单元,用于将初始语种语句根据不同的中间语种进行翻译,处理单元还包括有比较选择单元对翻译后的标准语种语句比较选择处理;数据库单元,用于存储大量的分析后的语言数据,供处理单元中的比较选择单元直接取用。本发明将需要分析的语言通过翻译的形式转化为其他语种,通过多个语种确定整句的表述内容,克服了单个词或句单独分析的缺点;在对语言的分析过程中通过相同内容进行比较,用数据真实的反应语言的表述内容,使得语言分析更加准确。
技术领域
本发明涉及人工智能领域,具体是一种语言分析系统及方法。
背景技术
自然语言处理是人工智能和语言学领域的分支学科,是利用计算机工具对人类特有的书面形式和口头形式的自然语言信息进行各种处理和加工的技术。自然语言处理大致分为两个层面,一个是浅层分析,如分词,词性标注。这种技术只需对句子的局部范围进行分析处理,已经属于成熟技术。另一个层面是对语言进行深层的处理,需要对句子的句法、语义、语用进行全局分析。
中国专利(公布号:CN 107544955 A)公开的一种自然语言句法分析方法及系统,将长句分隔成若干分词,在进行逐一分析生成树,最后格式化输出,但是对语句的分析要结合不同的使用环境,尤其是中国文字,相同的字、词具有不同的意思,需要结合语境的情况才能够准确的分析出语言的真实意思,因此,需要提出一种新的语言分析系统及方法。
发明内容
本发明的目的在于提供一种语言分析系统及方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种语言分析系统,包括输入单元、处理单元、数据库单元和输出单元;
输入单元,接收初始语种的语句输入;
处理单元,用于将初始语种语句根据不同的中间语种进行翻译,其中包括对初始语种的翻译和对不同中间语种的结果再次进行标准语种翻译;处理单元还包括有比较选择单元对翻译后的标准语种语句比较选择处理;
数据库单元,用于存储大量的分析后的语言数据,供处理单元中的比较选择单元直接取用;
输出单元,用于输出比较选择单元的输出结果对应的初始语种的内容数据。
进一步的:所述的初始语种与处理单元中的语种不同。
进一步的:所述处理单元的中间语种设置有至少五种。
进一步的:所述标准语种为国际通用语种。
进一步的:所述数据库单元为云数据库。
一种语言分析方法,包括以下步骤:
S1:输入初始语种语句,将其输入语种的语句分别独立预设的至少五种中间语种语句,根据不同中间语种与初始语种的语言环境,准确翻译输出语句,将初始语种语句以多种语种的形式并存;
S2:对所有的翻译后的中间语种语句再次独立进行翻译,翻译为不同于中间语种的另外一种标准语种的语句,判断翻译后的多个标准语种的语句一致性,选取一致性较多的标准语种语句作为初始语种要表述的意思内容,其中再结合数据库单元中存储的初始语种的语句表述意思内容人工校对;
S3:校对选取后的标准语种语句再次翻译成初始语种语句,输出初始语种语句表述的意思内容。
进一步的:所述中间语种数量为奇数个。
进一步的:选取一致性较多的标准语种语句为选取数量大于一半中间语种的数量的标准语种语句。
进一步的:人工校对是通过人工对输入单元的初始语种语句表述意思内容进行确认。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东机电职业技术学院,未经广东机电职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910162323.3/2.html,转载请声明来源钻瓜专利网。