大数据告诉你今年会不会感冒
在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!!
“叮叮”手机响了,你拿起来一看,屏幕上红色的打字闪烁着“该地区已经有35人患有流感,请谨慎前往,做好必要防护措施!”如此智能的预测可能不再是梦。想知道今年冬天会不会感冒,什么时候得感冒吗?TwitterHealth可以告诉你!
TwitterHealth是纽约罗彻斯特大学发起的一个研究项目,可以通过分析用户的Twitter微博内容来预测用户会不会感冒。注意,他们仅仅分析微博内容!Oracle培训
这一项目原来只是给研究人员用作数据挖掘和机器学习系统用的,后来开发出了这一功能。罗彻斯特大学计算机科学系主任Henry Kautz说:“TwitterHealth是一个专门研究分析不同地理位置信息的项目,比如智能手机的GPS信息。”
Kautz说:“我们发现越来越多的社交媒体开始加入地理位置定位这一功能,人们在发Twitter微博的时候就会顺带上自己的地理位置信息。我们的研究小组就从网站上下载并研究此类信息。”
Kautz的学生建立起一个计算机网络,专门用来下载地理位置坐标为大城市的Twitter微博。然后他们开始从海量的大数据资源中挑选可用数据。
趋势一:数据的资源化oracle视频教程
何为资源化,是指大数据成为企业和社会关注的重要战略资源,并已成为大家争相抢夺的新焦点。因而,企业必须要提前制定大数据营销战略计划,抢占市场先机。
趋势二:与云计算的深度结合
大数据离不开云处理,云处理为大数据提供了弹性可拓展的基础设备,是产生大数据的平台之一。自2013年开始,大数据技术已开始和云计算技术紧密结合,预计未来两者关系将更为密切。除此之外,物联网、移动互联网等新兴计算形态,也将一齐助力大数据革命,让大数据营销发挥出更大的影响力。
趋势三:科学理论的突破
随着大数据的快速发展,就像计算机和互联网一样,大数据很有可能是新一轮的技术革命。随之兴起的数据挖掘、机器学习和人工智能等相关技术,可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破。
趋势四:数据科学和数据联盟的成立
未来,数据科学将成为一门专门的学科,被越来越多的人所认知。各大高校将设立专门的数据科学类专业,也会催生一批与之相关的新的就业岗位。与此同时,基于数据这个基础平台,也将建立起跨领域的数据共享平台,之后,数据共享将扩展到企业层面,并且成为未来产业的核心一环。
趋势五:数据泄露泛滥oracle教程
未来几年数据泄露事件的增长率也许会达到100%,除非数据在其源头就能够得到安全保障。可以说,在未来,每个财富500强企业都会面临数据攻击,无论他们是否已经做好安全防范。而所有企业,无论规模大小,都需要重新审视今天的安全定义。在财富500强企业中,超过50%将会设置首席信息安全官这一职位。企业需要从新的角度来确保自身以及客户数据,所有数据在创建之初便需要获得安全保障,而并非在数据保存的最后一个环节,仅仅加强后者的安全措施已被证明于事无补。
趋势六:数据管理成为核心竞争力
数据管理成为核心竞争力,直接影响财务表现。当“数据资产是企业核心资产”的概念深入人心之后,企业对于数据管理便有了更清晰的界定,将数据管理作为企业核心竞争力,持续发展,战略性规划与运用数据资产,成为企业数据管理的核心。数据资产管理效率与主营业务收入增长率、销售收入增长率显著正相关;此外,对于具有互联网思维的企业而言,数据资产竞争力所占比重为36.8%,数据资产的管理效果将直接影响企业的财务表现。
“我们发现,人们经常在Twitter微博中提到自己的健康状况。比如说‘我流鼻子了’、‘我感冒了’、‘我感觉不舒服’等。我们就设想,是否可以根据这些词句来跟踪季节性流感?”
于是研究团队开始拙手写机器学习算法,在几百条实验微博中挑选“感冒微博”。oracle数据库教程
最后团队的算法在挑选“感冒微博”时已经可以达到99%的准确率,几乎与人脑分析文本一致,而且“感冒”分析速度要快于美国本土最大的疾病控制中心。
“从大数据中,我们可以发现季节性流感的分布和传播,我们测量和预测的精度完全不输疾病控制中心。”Kautz说道。
TwitterHealth的极大成功也促使不少学生开始从事大数据和数据挖掘方面的创业。除了疾病传播趋势,他们想跟踪更多趋势。
Kautz说:“除了用于健康预测,还可以做更多有关商业的应用,比如说追踪最近的时尚潮流,追踪最火的网络歌手、网络段子等。”
但是Kautz还是重点提到了大数据在医疗卫生行业中的巨大潜力。“以往通过问卷收集医疗卫生数据又慢又贵。”他还提到了TwitterHealth对于抗击抑郁和**有一定帮助,可以在有**事件发生之前就提前预警。
Kautz说道:“通过分析大数据资源,我们可以发现用户是否会经过某一疾病多发街区,是否在流感病人吃过饭的餐馆就餐,因为在这些地方都有可能会增加得流感的机会。”
Twitter 微博的内容是做大数据分析的良好数据来源,但是Facebook等社交网站可以看到更多隐私内容,但是也因为隐私设置的问题让数据获取成了问题。如果可以说服Facebook也使用TwitterHealth这样的服务,或者能够获得Facebook用户的状态、文章,这样TwitterHealth就可以服务更多人,减少疾病的发生。
TECH2IPO:这种方法完全可以移植到中国来。许多中国人都喜欢把自己的故事发到网上,比如“我今天吃了3两饭”、“我感冒了,好孤单”、“居然怀孕了”、“LV的包包不如Gucci的好”、“一师是个好学校”、“七颗石头换心愿”之类的内容,可以做饮食、健康、人口、消费、教育、情感类的分析,潜力还是非常大。但是也要考虑到很多虚假内容,比如说一个女孩子在别人的车中发微博说“还是凯迪拉克坐着舒服”这类的话,就会对数据分析造成很大的干扰。
更多视频课程文章的课程,可到课课家官网查看。我在等你哟!!!