[发明专利]用于输入和搜索非罗马字母表字符的计算机实现的方法和系统以及相关搜索系统有效
申请号: | 200580043755.9 | 申请日: | 2005-05-10 |
公开(公告)号: | CN101084500A | 公开(公告)日: | 2007-12-05 |
发明(设计)人: | 理查德·C·约翰逊 | 申请(专利权)人: | 甲骨文国际公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/28 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 | 代理人: | 王怡 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 输入 搜索 罗马 字母表 字符 计算机 实现 方法 系统 以及 相关 | ||
技术领域
本发明涉及针对文档和网络的用于输入汉语和日语字符的计算机实现的方法和系统以及其它数据对象、图像和符号对象或概念的搜索。
背景技术
与输入日语和汉语字符到计算机中相关的基本问题仅仅是不能使键盘足够大以便容纳一个性将会在日语报纸中发现的数千个字符,更不用说正式的汉语技术文档或者政府文档所需要的大约40,00O个字符了。相同的问题也出现在其它语言中。另外,基于字符的(汉语的、日语的和一些朝鲜语的)网站的数目上的增长使得在没有足够的方法来输入这样的字符的情况下很难搜索它们。此外,甚至连获得字符并对其进行搜索也不意味着进行搜索的字符的具体实例被分离出来了。诸如阿拉伯语或者希伯来语之类的其它语言具有不适于通过当前方法手动输入的字符或句法和书写风格。虽然存在次优的(suboptimal)方案,但是没有一个能够很好地起作用。虽然传统的搜索系统可以返回需要的结果,但是它们所返回的无用的结果总是它们所返回的需要的结果的很多倍。
日语支持语音输入,但是存在关于语音缺陷或者结巴、口音、发音、错误(一个词或字符替代另一个)、方言、第二种或非母语语言的问题。大多数当前的语音识别系统需要很长的训练期以使得机器能够精确地转录用户的语音。而且,经常需要训练用户来练习合适的措辞以使得机器能够工作在可接受的识别水平。
首先来看日语的书面形式,最古老的普通方法涉及用户输入需要的字符(或者短语,意思是一串字符)的通过键盘输入的(罗马字或者使用罗马字母表或假名(日语语音字符)的日语字符的语音音译(phonetictransliteration))语音表示。所有相似发音的字符将显示在屏幕上,然后要求用户从出现在显示器上的相似发音的字符中进行选择。该过程很慢、很乏味,而且不是总能产生需要的字符。
新近的方案要求用户口述日语或汉语口语,用软件/机器将口语词翻译成字符。然后用户必须编辑结果或者重复语音或者确认结果。然而,使用语音的当前方法被认为缺少足够的速度、精度和对于所有可能的用户的适合性。同样,单独依赖键盘方法来输入罗马字发音的传统方法被认为很慢、麻烦并且反直觉。最后,这些传统方法经常通过要求在很多候选字符之中选择一个或者通过要求用户重复他或她的语音而打断用户的思路。经常,用户可能未识别出候选字符,因此不能从候选字符中选择合适的字符。而且,这些方法经常不能使用户以及时的方式可靠地选择需要的字符。
在想要输入非罗马字母表字符到网络搜索引擎中以搜索包含这样的字符的网站时也出现这些缺点。因此,也需要使得用户能够容易地输入非罗马字母表字符到搜索引擎中并且对所输入的字符进行搜索的系统和方法。
发明内容
根据一实施例,本发明是一种计算机实现的方法,用于从一组非罗马字符中选择需要的非罗马字母表字符。词“关联项(association)”的以下使用都是指本发明的特定用户头脑中的关联项。所述方法可以包括下列步骤:提供关联项数据库,该关联项数据库对于所述组中的每个非罗马字母表字符都包括与所述每个非罗马字母表字符相关联的罗马字母表语音音译和与所述每个非罗马字母表字符相关联的多个条目;接收需要的非罗马字母表字符的语音音译和至少一个与需要的非罗马字母表字符相关联的相关条目;访问关联项数据库并且将所述组中那些与所接收的语音音译和至少一个所接收的相关条目相关联的字符识别为候选字符;如果候选字符的数目大于1,则接收另外的相关条目并且重复访问和识别步骤,直到多个候选字符被缩小为单个候选字符;以及提供所述单个候选字符作为需要的非罗马字母表字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于甲骨文国际公司,未经甲骨文国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200580043755.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种聚酰胺双苯并咪唑化合物及其制备方法和应用
- 下一篇:一种葡萄球菌抑制剂