大数据教程
大数据-大数据(Big Data)又称为巨量资料 ...
-
数据分析发挥了什么作用? 很多人都拥有很强的商业分析能力,而这个很强的商业分析能力之所以强大是因为他们拥有足够强大的数据分析能力,学会分析数据不仅有助于增强商业领域的分析能力,也将有助于其它领域的分析能力。那数据分析到底拥有哪些作用呢? 一、可以提高工作效率 当在工作中碰到几千个甚至几万个数据的时候,不仅需要耗费大量的时间以及精力对其进行分类归纳,还需要分类归纳的数据中找出数据与... 继续阅读数据分析发挥了什么作用?
:2018-05-18
-
教你认识几个常用的Docker项目应用场景 Flux 7描述了常用的8个Docker真实的使用场景,即简化配置,代码行管理,提高开发效率,隔离应用,集成服务器,调试能力,多租户环境中,快速部署。我们一直在谈论Dockers,码头工人如何使用,如何的情况下使用?也许这篇文章可以帮助你。哪里有需要交流的,他们可以与我们通过意见交流。 几个星期前,我们参加DockerCon,Dockercon是第... 继续阅读教你认识几个常用的Docker项目应用场景
:2018-05-18
-
Hadoop集群系列1:CentOS安装配置 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 1、准备安装 1.1 系统简介 CentOS 是什么? CentOS是一个基于Red Hat 企业级 Linux提供的可自由使用的源代码企业级的 Linux 发行版本。每个版本的 CentOS 都会获得七年的支持(通过安全更新方式)。新版本的 CentOS 每两年发行一次,而每个版本... 继续阅读Hadoop集群系列1:CentOS安装配置
:2018-05-18
-
HBase设计及应用:看上去很美 恍惚恍惚又来到了文章的学习,想必大家又有很多问题吧! 缘起 随着Hadoop系列的兴起,基于HDFS的大规模KV存储系统Hbase也进入“大规模使用阶段”。网上的Hbase资料很多,学习成本正在下降。从公开的资料看,国外facebook、国内taobao均宣称在线上环境大规模使用hbase。一切都让人很兴奋。于是,在项目中引入Hbase做存储,最终却选择放弃。... 继续阅读HBase设计及应用:看上去很美
:2018-05-18
-
Hadoop 2.0.2和Hive 0.10.0单机伪集群配置及应用 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! Hadoop: 1.安装JDK 1.6以上 2.下载Hadoop包 3.添加环境变量:oracle教程 export JavaHOME=/usr/lib/jvm/java-7-sun export JRE_HOME=$JAVA_HOME/jre expo... 继续阅读Hadoop 2.0.2和Hive 0.10.0单机伪集群配置及应用
:2018-05-18
-
Foursquare的野心:大数据时代“活点地图”的讲解 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 这还不止,Foursquare 还想要根据过去的“行动历史”以及朋友的喜好提供未来行动的指引,Foursquare Explore 服务,可以发现身处的城市周边都有什么值得一去的地方。他们还有怎样的“地图”美梦?处理这些数据的工具又是什么? 大野心:精细的“多边形区域”框... 继续阅读Foursquare的野心:大数据时代“活点地图”的讲解
:2018-05-18
-
恍惚恍惚又来到了文章的学习,想必大家又有很多问题吧! 你是不是也经历过这样的事? 当你正在处理你的数据集的时候,你建立了一个分类模型并且它的精确度达到了90%,这时,你一定会想:这个结果太棒了!但是当你继续更深地挖掘数据时你会发现这个90%的精确度只是一类数据的精确度,见鬼了! oracle数据库教程 以上是一个不均衡数据集的例子,这样的不均衡数据集有时会引起这样糟糕的结果。在这篇文章中你将可以领... 继续阅读8大策略让你对抗机器学习数据集里的不均衡数据
:2018-03-24
-
Hadoop集群系列2:机器信息分布表的讲解 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 1、分布式环境搭建 采用4台安装Linux环境的机器来构建一个小规模的分布式集群。 图1 集群的架构 其中有一台机器是Master节点,即名称节点,另外三台是Slaver节点,即数据节点。这四台机器彼此间通过路由器相连,从而实验相互通信以及数据传输。它们都可以通过路由器访问Inter... 继续阅读Hadoop集群系列2:机器信息分布表的讲解
:2018-05-18
-
在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 有人把数据比喻为蕴[4] 藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。对于很多行业而言,如何利用这些大规模数据是成为赢得竞争的关键。 大数据的价值体现在以下几个方面:1)对大量消费者提供产品或服... 继续阅读48小时:大数据时代怎么应对雅安地震?
:2018-03-24
-
在前面的文章中已经是给大家进行讲解了什么是Hadoop,简单的来说有很多服务器存储了很多文件。想要从这些文件里面查找想要的内容,把任务描述清楚,它就把结果返回给你了,最简单的理解就是架构系统,其中有各式各样的组件。 再来看看hadoop生态圈的一个解释: 我们知道所谓的大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)实际上都是为了处理超过单机尺度的数据处理而诞生的。更加直... 继续阅读大数据小白,hadoop生态圈
:2018-03-24