[发明专利]解析装置、解析方法及存储介质在审
申请号: | 202010122489.5 | 申请日: | 2020-02-27 |
公开(公告)号: | CN112463934A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 小林优佳;藤村浩司;岩田宪治;吉田尚水 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 林娜;段承恩 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解析 装置 方法 存储 介质 | ||
一种解析装置、解析方法及存储介质,能够更容易地掌握与类别关联的词汇。实施方式的解析装置具备算出部、决定部、适用部、决定部以及显示控制部。算出部算出表示类别的第1词汇与第2词汇的第1相似度。适用部将所述第1相似度比第1阈值大的一个以上的第2词汇适用于一个以上的模板语句。决定部对包含所述第2词汇的模板语句进行解析,将所述第2词汇分类为一个以上的第1类别。显示控制部将在所述第1类别的分类中使用过的所述第2词汇按每个所述第1类别显示于显示部。
技术领域
本发明的实施方式涉及解析装置、解析方法及存储介质。
背景技术
在通过输入自然语句进行的检索中,需要事先收罗用户会输入的词汇(检索关键字)。以往,开发人员对各内容手动赋予对应的检索关键字。因此,必须考虑对每个内容使用怎样的检索关键字,生成数据库会花费成本。虽然能够使用同义词词典等对一个关键字进行扩展,但除此以外的近义词等需要手动赋予。近年来使用了相似度计算器的技术,该相似度计算器使用大量的文书对词汇间的相似度模型进行学习而算出词汇间的含义的相似度。
发明内容
然而,在以往的技术中,无法事先确认将怎样的关键字分配给各类别。通过使用大量的文书进行机器学习而生成的相似度计算器有时会给出不希望的结果来作为含义上的相似度,有时将开发人员不想要的词汇(关键字)分配给类别。本发明所要解决的课题是提供一种能够更容易地掌握与类别关联的词汇的解析装置、解析方法及程序。
实施方式的解析装置具备算出部、适用部、决定部以及显示控制部。算出部算出表示类别的第1词汇、与第2词汇的第1相似度。适用部将所述第1相似度比第1阈值大的一个以上的第2词汇适用于一个以上的模板语句。决定部对包含所述第2词汇的模板语句进行解析,将所述第2词汇分类为一个以上的第1类别。显示控制部将在所述第1类别的分类中使用过的所述第2词汇按每个所述第1类别显示于显示部。
根据上述推定装置,能够更容易地掌握与类别关联的词汇。
附图说明
图1是示出第1实施方式的解析装置的功能构成的例子的框图。
图2是示出第1实施方式的对话系统的功能构成的例子的框图。
图3是示出第1实施方式的语音对话处理的例子的流程图。
图4A是示出第1实施方式的词汇与类别的关联度的算出例1的图。
图4B是示出第1实施方式的词汇与类别的关联度的算出例2的图。
图5是示出表示第1实施方式的词汇与类别的关联的显示信息的例1的图。
图6是示出表示第1实施方式的词汇与类别的关联的显示信息的例2的图。
图7是示出第1实施方式的词汇与类别的关联度的算出方法的例子的流程图。
图8是示出第2实施方式的受理类别的变更的显示信息的例子的图。
图9是示出第2实施方式的受理类别的删除的显示信息的例子的图。
图10是示出第2实施方式的受理类别的追加的显示信息的例子的图。
图11是示出第3实施方式的受理词汇与类别的关联度的变更的显示信息的例子的图。
图12是示出第5实施方式的表示词汇与类别的关联的显示信息的例子的图。
图13是示出第1至第5实施方式的解析装置的硬件构成的例子的图。
标号说明
1:算出部;
2:适用部;
3:决定部;
4:显示控制部;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010122489.5/2.html,转载请声明来源钻瓜专利网。