大数据挑战:不要加入人的判断
在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!!
这一论断听上去好像异端邪说,不是吗?现在的管理教育大都是对人们判断力的培养——也就是培养未来领导者“模式匹配”(pattern-matching)的能力,采用的手段通常是让他们接触大量的案例研究和其他类型的例证,以便让他们充满信心地游走在商界江湖。无论是否在商学院,人们总是告诉我们,要相信自己的本能和直觉,尤其在身经百战之后,我们完全可以靠本能和直觉在一眨眼的功夫就做出精准的判断。oracle数据库教程
但在当今的商业世界中(或许在其他领域也一样),这却是最有害的错误观念。正如我在以前的文章中写到的,人类的直觉很重要不假,但也是有缺陷的。就决定让哪些囚犯回家而言,假释裁决委员会的判断远不如简单的规则。在诊断乳腺癌方面,训练有素的病理学家的结论也比不上影像分析软件的结果。采购专业人员对哪些供应商将来表现出色的判断,远不如一种简单算法的预测更准确。美国顶尖级的法律学者对某一年最高法院判决投票结果的预测,也远远不如数据驱动型的决策规则更精准。
这样的名录我可以一直罗列下去,不过,我还是把最后一句话留给心理学家保罗·米尔(Paul Meehl)吧。早在近60年前,他就开始研究“专家”与算法孰优孰劣的问题了。他在职业生涯即将结束的时候曾总结说:“无可争议的是,社会科学的研究表明,数量众多的各种研究结果均指向了同一个方向,那就是:在从足球比赛的结果到肝病诊断的诸多预测中,你很难找出几个预测的结果是对专家和临床医生有利的,我们就此完全可以得出切合实际的结论。”oracle视频教程
这个结论就是,我们应该将我们的很多决策、预测、诊断和判断交给算法,无论是无关紧要还是至关重要的事情。就算法是否能给我们提供更好的结果而言,已经是毫无争议的问题了。
当我们为专家呈上这样的事实时,他们的典型回应往往是“我知道数据和分析很重要,这也是我做出决策时要考虑它们的原因所在”。这种说法听上去很有道理,但实际上却大错特错了。研究同样清楚地表明:当专家把自己的判断添加到数据驱动型的算法或数学模型的结果中时(换句话说,当他们做出事后评价时。),最终结果往往比只用算法本身得出的结果糟糕。正如社会学家克里斯·斯尼德斯(Chris Snijders)所说的:“你看的结果往往是,专家参与的判断会介于模型单独判断和专家单独判断的结果之间。所以说,如果给他们提供模型,专家的判断结果会更好些,但依然不如模型独自判断的表现。”
而当我们把这个次序倒转过来的时候,也就是让专家为模型提供信息而不是相反的时候,结果则会好得多。如果专家的主观意见被量化,并添加到某一算法之中,其结果往往会得到提升。所以,病理学家对癌症病程的估计可以添加到影响分析软件的分析过程中,法律学者对最高法院对案件投票的预测也可以改善模型的预测能力。伊恩·艾瑞斯(Ian Ayres)在其卓越的著作《超级数字天才》(Supercrunchers)中曾写道:“不是让统计数据充当专家的仆人,而要让专家成为统计机器的侍从。”oracle视频
经李克强总理签批,2015年9月,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署大数据发展工作。
《纲要》明确,推动大数据发展和应用,在未来5至10年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。
《纲要》部署三方面主要任务。一要加快政府数据开放共享,推动资源整合,提升治理能力。大力推动政府部门数据共享,稳步推动公共数据资源开放,统筹规划大数据基础设施建设,支持宏观调控科学化,推动政府治理精准化,推进商事服务便捷化,促进安全保障高效化,加快民生服务普惠化。二要推动产业创新发展,培育新兴业态,助力经济转型。发展大数据在工业、新兴产业、农业农村等行业领域应用,推动大数据发展与科研创新有机结合,推进基础研究和核心技术攻关,形成大数据产品体系,完善大数据产业链。三要强化安全保障,提高管理水平,促进健康发展。健全大数据安全保障体系,强化安全支撑。[8]
#p#分页标题#e#
2015年9月18日贵州省启动我国首个大数据综合试验区的建设工作,力争通过3至5年的努力,将贵州大数据综合试验区建设成为全国数据汇聚应用新高地、综合治理示范区、产业发展聚集区、创业创新首选地、政策创新先行区。
围绕这一目标,贵州省将重点构建“三大体系”,重点打造“七大平台”,实施“十大工程”。
“三大体系”是指构建先行先试的政策法规体系、跨界融合的产业生态体系、防控一体的安全保障体系;“七大平台”则是指打造大数据示范平台、大数据集聚平台、大数据应用平台、大数据交易平台、大数据金融服务平台、大数据交流合作平台和大数据创业创新平台;“十大工程”即实施数据资源汇聚工程、政府数据共享开放工程、综合治理示范提升工程、大数据便民惠民工程、大数据三大业态培育工程、传统产业改造升级工程、信息基础设施提升工程、人才培养引进工程、大数据安全保障工程和大数据区域试点统筹发展工程。
Oracle培训
当然,大多数组织都无法轻松完成这一转变。现如今,大部分决策者都确信自己很擅长此道,自己的决策毫无疑问要比没有灵魂、简单朴素的算法做出的决策更好,此外,他们还认为,拿走他们的决策权会削弱自己的权威、降低自己的价值。但显而易见的是,第一种观念是错误的,第二种认识也同样谬之千里。
那么,如何实现专家与算法之间角色的大逆转呢?倚重数据驱动型的决策过程,会让我们的组织、经济和社会因此而得到更好的结果吗?达到这样的目标需要透明、时间和对结果的认识,在这里,透明是指清楚说明“专家”的判断有多么糟糕,时间是指让这种理念广泛传播并得到充分理解,对结果的认识则能让我们为了得到更好的决策而愿意忍受这一艰难的转变。
在假释裁决委员会的例证中,我们能看到所有这三个因素的存在。正如艾瑞斯谈到的:“在最近25年中,18个州用量刑指南(sentencing guidelines)取代了假释制度。这些州在评估再犯的风险时已越来越倚重算法评估模型。
对投票者来说,糟糕的假释决定会产生严重的后果,所以,人为把握判断原则的假释裁决委员会乐得将投票权拱手相让。而在商业世界中,竞争,尤其是来自数据驱动型竞争对手的压力,会让略逊一筹的决策者举步维艰。我不知道多久会出现这种结果,但我可以信心十足地说,数据驱动型的企业,会从依然过度倚重专家的企业那里夺走更多的市场份额、客户和利润。
更多视频课程文章的课程,可到课课家官网查看。我在等你哟!!