[发明专利]一种混合型语句输入方法与装置有效
申请号: | 201110288020.X | 申请日: | 2011-09-26 |
公开(公告)号: | CN103019401A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 魏娜;尹方鸣;王晖 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 逯长明;王宝筠 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 混合 语句 输入 方法 装置 | ||
技术领域
本发明涉及语言输入技术领域,尤其涉及一种混合型语句输入方法与相应的装置。
背景技术
随着信息化处理技术的发展,通过终端设备的键盘(触笔)采集信息的场景和机会逐渐增多,对信息输入的速度和便捷性的要求越来越高。通过终端设备对单一语言形式的信息进行录入能较好地满足人们需求。但是,由于自然语言的网络化、外国语的本土化等因素导致输入终端的信息通常以混合语言形式呈现,传统的信息输入方式受到挑战。常见的混合语言形式有中文、英文两种语言混合,如:晚上去吃KFC、上网用WIFI。面对这种混合型语句的输入,现有输入法的操作流程通常是(参见附图1):在当前输入模式下输入混合型语句的一种语言类型对应的字串;将输入模式切换到另一种语言类型的输入模式;在切换后的输入模式下输入另一种语言类型对应的字串,该语言类型的字串输入完毕后又切换回原来的输入模式进行后续输入。这种方式将一个完整语句的输入过程分割成多种模式下的多次片段输入,破坏了输入过程的连贯性,且需要录入者反复切换输入模式,给输入工作带来极大不方便,降低了输入效率,尤其当输入信息较长、包含的语言类型较多时,其输入效率更低、便捷性更差。
发明内容
有鉴于此,本发明的发明目的在于提供一种混合型语句的输入方法和装置,该方法和装置通过启动混合型语句检索串的自动检索过程,在多种输入模式对应的字词库中完成检索,并将检索结果呈现到输出终端,进而解决在多种输入模式间进行多次切换带来的不便和效率低下问题。
本发明的实施例提供的一种混合型语句输入方法包括:
在当前输入模式下接收混合型语句的符号序列,所述符号序列包括至少一个检索串,所述混合型语句输出至少两种语言类型;
以检索串为处理对象,查找当前输入模式对应的字词库是否存在该检索串对应的字词,如果不存在,则转到下一种输入模式对应的字词库进行查找,直至查找到该检索串对应的字词,将查找到的字词作为该检索串的检索结果;
将检索结果呈现到输出终端。
优选地,所述混合型语句的检索串在输入混合型语句的符号序列过程中识别得到。
进一步优选地,在输入混合型语句的符号序列过程中识别检索串包括:
接收符号串,所述符号串至少包括一个符号;
判断所述符号串是否符合当前输入模式对应语言的语法,如果所述符号串符合,则:接收下一个符号,将所述符号串与该符号组合成符号序列,判断该符号序列是否符合当前输入模式对应语言的语法,若该符号序列不符合,则将所述符号串作为检索串,并执行接收下一个符号串的步骤;若该符号序列符合,则执行接收下一个符号的步骤;如果所述符号串不符合,则将所述符号串作为检索串。
优选地,所述混合型语句的一个检索串按下述方式识别得到:
将在当前输入模式下接收的混合型语句的所述符号序列进行拆分,得到混合型语句的各检索串。
进一步优选地,所述混合型语句的符号序列还包括数字时,则:从所述符号序列中提取出数字后执行检索串拆分步骤;将检索结果进行呈现时,根据数字在符号序列中的位置,将数字与检索结果一并呈现到输出终端。
进一步优选地,所述混合型语句还包括控制符时,则:将所述混合型语句的符号序列按照所述控制符进行初步拆分;对初步拆分后的各符号序列按照当前输入模式对应语言的语法进行拆分。
优选地,执行所述转到下一种输入模式对应的字词库进行查找的步骤时,如果输入模式发生切换,则:在将检索结果呈现到输出终端后,将输入模式切换回接收混合型语句的符号序列时的输入模式。
优选地,从字词库中查找到检索串对应的字词包括至少两个以上时,根据字词频率和/或根据该检索串的上下文选择一个字词作为检索串的检索结果,所述检索串的上下文包括与该检索串相邻的检索串的检索结果。
优选地,所述方法还包括检索串合并的步骤,该步骤包括:
计算相邻检索串的相关度,判断所述相关度是否超过预设阀值,如果是,则将所述相邻检索串合并为一个检索串。
本发明的实施例还提供了一种混合型语句输入装置,该装置包括:接收单元、处理单元和输出单元,其中:
所述接收单元,用于在当前输入模式下接收混合型语句的符号序列,所述符号序列包括至少一个检索串,所述混合型语句输出至少两种语言类型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110288020.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种微张力分条整经机控制系统
- 下一篇:一种台式机电源