[发明专利]一种机器智能辅助的扎根理论编码优化方法有效
申请号: | 202010178957.0 | 申请日: | 2020-03-15 |
公开(公告)号: | CN111488725B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 卢暾;蒋特;顾宁 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/289 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器 智能 辅助 扎根 理论 编码 优化 方法 | ||
本发明属于定性研究技术领域,具体为一种机器智能辅助的扎根理论编码优化方法。本父母优化方法的核心体现在两个环节:特征提取及自动编码分类:特征提取是根据同编码分类中,文本在信息上具有较高的特征一致性设计,提取同分类下的文本信息特征,作为后续自动分类环节的分类依据;自动编码是根据在特征提取环节中提取的分类特征,计算新文本与各分类语料的相似度,将其归类到相似度最高的分类中;在整个编码过程中,会结合人为调整、特征再提取等过程,以获取更精确的编码结果。本发明是在经典的扎根理论编码过程中融合了机器智能技术,以优化编码过程,提高研究人员对数据处理和编码的效率。
技术领域
本发明属于定性研究技术领域,具体涉及一种扎根理论编码优化方法。
背景技术
在定性研究中,扎根理论是一种被广泛采用的定性研究方法。扎根理论是由格拉泽和施特劳斯于1967年提出的一种从资料中建立理论的特殊方法论。研究者可以从传记、日记、录音、手稿、报告等材料,或者通过补充采访和田野观察记录的方式进一步补充相关材料,进而在这些材料的基础上,深入分析某一现象或问题的本质。
其中,补充采访获取信息材料的方式,是现阶段研究者采用对社会现象展开研究的一种常用方法。该方法强调,从没有理论假设出发,从实际观察入手,研究者通过招募符合研究现象特征,有过相关经历的受访者。在从与他们的交流中,获取一手的信息材料,通过深入访谈的方式,分析挖掘现象背后深层次的原因,归纳出经验模式,随后发展为一定高度的理论。
访谈的方式,对原始资料的收集,必然会涉及到对受众的访谈,而访谈又会产生大量的访谈数据。而研究者则需要在这些大量的访谈数据中,整理形成编码框架。而这样的整理工作,通常会耗费研究人员大量的精力,而实际这个编码的过程,存在一定量的重复性工作,有一定的规律可循,部分工作可由机器替代。
发明内容
为了更好地协助定性研究者开展对访谈资料的整理分析工作,本发明设计了一种机器辅助的扎根理论编码优化方法。
通常,在大部分场景下,原始资料的收集,会涉及对受众的访谈,而访谈又会产生大量的访谈数据。研究者需要在这些大量的访谈数据中,整理形成编码框架。而这样的整理工作,通常会耗费研究人员大量的精力,而实际这个编码的过程,按照一定的逻辑步骤进行,有一定的规律可循,机器可以替代一部分的整理、分类工作。故而,本方面提出一种对编码过程的优化方法。其中,编码的流程如附图1所示。以下介绍本发明方法的具体步骤。
(1)数据预处理
在得到访谈录音数据后,研究人员可利用转录软件或平台,对录音数据进行转录,并通过人工梳理的方式,得到相应的文字材料。
随后,通过分句分段工具,将访谈记录切割成一个个语句块;并通过人工核对检查的方式,将分句分段结果进行适当的调整,得到语料集,作为编码的原始材料。
(2)人工预编码
对步骤(1)得到的对语料集进行人工预编码,形成初步的编码方案。预编码算法中,通过循环编码、随机选取数据的方式,对选取的原始材料进行概念层次和主题层次的编码,并不断调整编码框架,直至达到初步的信息饱和,或当前数据集数据已全部编码;此外,算法还支持在原有编码的基础上,继续编码新的数据,具备较高的灵活性。因此,当未达到信息饱和,或当用户认为未编码完成时,都可继续编码新的数据。该预编码算法参见附录1,其流程为:
每次编码过程,可以在上次编码的结果集合上继续进行,也可以在空的编码结果上进行。每次编码过程是在新的数据集中,随机选取未编码的数据PD(算法第4-11行)。通过人工编码的方式,为该条数据生成其对应的概念CN(算法第12行);然后,在当前编码结果CT中,逐个在主题集合TS中,查找是否已存在对应的概念(算法第13-22行);如果,已存在该概念,则将该概念添加对应的主题,对应的概念集合中(算法第23-29行)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010178957.0/2.html,转载请声明来源钻瓜专利网。