[发明专利]一种基于概率主题模型的相似中药检索方法有效
申请号: | 201310074221.9 | 申请日: | 2013-03-08 |
公开(公告)号: | CN103177087A | 公开(公告)日: | 2013-06-26 |
发明(设计)人: | 张引;魏宝刚;庄越挺;申晨;王李东;凌超 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 张法高 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于概率主题模型的相似中草药检索方法。首先通过光学字符识别工具将“中华药典”、“中华本草”中的中草药信息转成数字文本。使用正则表达式方法将中草药的功效、性味、归经等信息提取出来,建立中草药信息库。分别根据中草药的功效、性味、归经属性生成对应的向量空间,并通过概率主题模型对功效的向量空间进行调整。最后根据余弦系数计算中草药间功效、性味、归经属性的相似度,产生中草药相似性数据库。用户输入一味中草药的名称,系统通过查找相应的中草药药对相似性信息库,将该味中草药及其相似中草药以关系图的方式直观的展示出来。本发明可以根据属性相似度检索相关中草药,对于中草药学习,促进中草药信息化意义重大。 | ||
搜索关键词: | 一种 基于 概率 主题 模型 相似 中药 检索 方法 | ||
【主权项】:
一种基于概率主题模型的相似中药检索方法,其特征在于包括以下步骤:1)应用光学字符识别工具对DjVu格式的“中华人民共和国药典”、“中华本草”进行光学字符识别处理,将纸质资料转换成数字化文本资料,然后运用正则表达式对数字化文本进行信息抽取,将不同中草药的信息、相同中草药的不同信息分离开来,建立中草药信息库;2)应用中草药分词系统对中草药信息库的中草药性味、中草药归经、中草药功效属性进行分词,去停用词,根据分词结果对中草药性味、中草药归经、中草药功效属性进行量化;3)针对中草药功效属性应用概率主题模型方法,结合中草药性味、中草药归经的属性量化数据,对中草药从性味、归经、功效进行属性间相似度计算,得到中草药相似性数据库;4)用户先输入待查询的中草药名称,然后根据需要勾选相似属性选项,根据所输入的中草药名称和勾选的属性去查询相应的中草药相似性数据库表,检索出与输入中草药所需属性相似的中草药,并将检索结果通过Flex技术以关系图的方式展示给用户,点击连线可以查询中草药信息库,获得相似中草药性味、中草药归经、中草药功效属性详细信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310074221.9/,转载请声明来源钻瓜专利网。