[发明专利]储存有解析程序的记录介质、解析方法以及解析装置有效
申请号: | 201880032030.7 | 申请日: | 2018-03-19 |
公开(公告)号: | CN110709830B | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 片冈正弘;出内将夫;尾上聪 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/36 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 金雪梅;王海奇 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 储存 解析 程序 记录 介质 方法 以及 装置 | ||
1.一种储存有解析程序的记录介质,所述解析程序使计算机执行以下处理:
基于用于词素解析的词典,通过对字符数据与登记于所述词典的各个词素进行比较生成排列有所述字符数据所包含的词素的数组数据,并按照每个字符生成设置有表示所述数组数据的字符的偏移量的标志的位图,来生成索引;
对所述索引设定前端位图和末尾位图,在所述前端位图中设置有表示所述数组数据的字符中的前端的字符的偏移量的标志,在所述末尾位图中设置有表示所述数组数据的字符中的末尾的字符的偏移量的标志;以及
通过对与所述字符数据所包含的各字符的组合对应的位图与所述前端位图及所述末尾位图进行AND运算,来判定能够拆分的单词的前端位置以及末尾位置,并且基于判定结果,提取多个能够拆分的单词。
2.一种解析方法,是由计算机执行的解析方法,在所述解析方法中执行以下处理:
基于用于词素解析的词典,通过对字符数据与登记于所述词典的各个词素进行比较生成排列有所述字符数据所包含的词素的数组数据,并按照每个字符生成设置有表示所述数组数据的字符的偏移量的标志的位图,来生成索引;
对所述索引设定前端位图和末尾位图,在所述前端位图中设置有表示所述数组数据的字符中的前端的字符的偏移量的标志,在所述末尾位图中设置有表示所述数组数据的字符中的末尾的字符的偏移量的标志;以及
通过对与所述字符数据所包含的各字符的组合对应的位图与所述前端位图及所述末尾位图进行AND运算,来判定能够拆分的单词的前端位置以及末尾位置,并且基于判定结果,提取多个能够拆分的单词。
3.一种解析装置,具有:
设定部,基于用于词素解析的词典,通过对字符数据与登记于所述词典的各个词素进行比较生成排列有所述字符数据所包含的词素的数组数据,并按照每个字符生成设置有表示所述数组数据的字符的偏移量的标志的位图,来生成索引,并且对所述索引设定前端位图和末尾位图,在所述前端位图中设置有表示所述数组数据的字符中的前端的字符的偏移量的标志,在所述末尾位图中设置有表示所述数组数据的字符中的末尾的字符的偏移量的标志;以及
提取部,通过对与所述字符数据所包含的各字符的组合对应的位图与所述前端位图及所述末尾位图进行AND运算,来判定能够拆分的单词的前端位置以及末尾位置,并且基于判定结果,提取多个能够拆分的单词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880032030.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理的系统和方法
- 下一篇:用于智能辅导的增强型视觉诊断系统