[发明专利]针对媒体的准确性确定在审
申请号: | 201880085597.0 | 申请日: | 2018-12-14 |
公开(公告)号: | CN111557000A | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | V·康纳 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 李光颖 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 媒体 准确性 确定 | ||
公开了用于确定针对媒体的准确性的方法和系统。在一个方面中,一种方法包括:识别正在对包括第一断言的一个或多个断言进行编码的电子数据对象的数据段;基于所述一个或多个断言来编译搜索查询;通过使用所述搜索查询进行第一信息搜索来生成搜索结果;识别与所述搜索结果中的和所述第一断言相关的搜索结果相关联的最近时间;基于搜索结果来生成针对所述第一断言的准确性加权;以及基于所述准确性加权来注释所述第一断言以指示断言的准确性。
背景技术
在企业内部在不断地创建电子内容。随着时间的推移,当连续地创建电子内容时,组织可能积累大量的电子内容。这种电子内容对许多组织而言是有价值的资产,因为其经常记录技术、业务和对企业运营重要的其他内容。例如,现代会议系统提供对会议的轻松记录,导致更多的雇员使用这些特征。结果,可以将大量记录的会议保存在组织的电子库中。遗憾的是,这些记录会有些模糊,限制组织针对内容进行索引和搜索这些会议的能力。例如,尽管会议的日期、时间、长度以及可能的主题都可以以元数据形式轻松获得,但是这些记录的会议经常包括关于会议的真实内容的很少的额外细节。这可能会降低组织利用这些记录中的内容的能力。类似地,其他形式的电子内容,诸如来自文字处理应用的文档,电子表格,演示文稿和图表,可能类似地模糊。因此,组织面临挑战以充分利用其内容库的价值。因此,需要表征、组织和利用电子内容库的经改进的方法。
附图说明
在不一定按比例绘制的附图中,相似的数字可以在不同的视图中描述相似的部件。具有不同字母后缀的相似数字可以表示相似部件的不同实例。附图通过示例而非限制的方式大体上图示了本文档中讨论的各种实施例。
图1示出了用于媒体准确性确定的示例性系统。
图2是可以在至少一些所公开的实施例中实现的示例性数据流。
图3是图2的数据流的继续。
图4是上面相对于图1所讨论的媒体准确性引擎130和媒体注释引擎的高级视图。
图5是用于确定针对媒体的准确性分数的示例性方法的流程图。
图6是用于确定语句是有效还是无效的方法的示例性流程图。
图7是用于确定新断言是否验证另一断言的方法的示例性流程图。
图8图示了示例性机器800的框图,在机器800上可以执行在本文中所讨论的任何一种或多种技术(例如方法)。
图9是更新针对媒体的准确性分数的流程图。
图10示出了根据本公开的一些示例的示例性机器学习模块。
图11是用于对电子数据对象进行注释的方法的示例性流程图。
具体实施方式
如上文所讨论的,组织可以积累相对较大的电子内容或媒体的库。利用这个大型库具有许多挑战,包括了解随着时间的流逝,哪种电子内容或媒体仍然是相关的。在一些情况中,用户可能不适当地舍弃超过一定年限的电子内容,而其中一些内容可能仍然是非常相关的。一些用户可能依赖于最近创建的内容。然而,在一些情况下,尽管该内容相对年轻,但是该内容尤其在参考快速发展的技术领域时可能已经过时。因此,具有技术内容的大型库的组织面临如何识别库内的每个电子内容或媒体的相关性的技术问题。此外,一些电子内容可以包括包含相关内容的部分,以及包含过期、过时或者以其他方式对组织没有特殊价值的内容的另一部分。由于在电子库中包含的内容的相关性或准确性方面的不确定性,因此组织可能无法充分利用该内容。因此,其技术问题阻止了对其电子内容库所体现的资产的适当使用。此外,这些电子内容库可能消耗大量的存储资源。这不仅在对物理地存储该库所必需的存储硬件成本方面,而且也在与维护该电子内容库相关联的数据中心空间、利用度和人员成本方面,都可能给组织带来可观的成本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880085597.0/2.html,转载请声明来源钻瓜专利网。