大数据教程
当前位置| > 博客

大数据教程

大数据-大数据(Big Data)又称为巨量资料 ...
  • 教你认识几个常用的Docker项目应用场景 Flux 7描述了常用的8个Docker真实的使用场景,即简化配置,代码行管理,提高开发效率,隔离应用,集成服务器,调试能力,多租户环境中,快速部署。我们一直在谈论Dockers,码头工人如何使用,如何的情况下使用?也许这篇文章可以帮助你。哪里有需要交流的,他们可以与我们通过意见交流。  几个星期前,我们参加DockerCon,Dockercon是第... 继续阅读教你认识几个常用的Docker项目应用场景

    :
    2018-05-18
  • Hadoop集群系列1:CentOS安装配置 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 1、准备安装 1.1 系统简介 CentOS 是什么? CentOS是一个基于Red Hat 企业级 Linux提供的可自由使用的源代码企业级的 Linux 发行版本。每个版本的 CentOS 都会获得七年的支持(通过安全更新方式)。新版本的 CentOS 每两年发行一次,而每个版本... 继续阅读Hadoop集群系列1:CentOS安装配置

    :
    2018-05-18
  • HBase设计及应用:看上去很美 恍惚恍惚又来到了文章的学习,想必大家又有很多问题吧! 缘起 随着Hadoop系列的兴起,基于HDFS的大规模KV存储系统Hbase也进入“大规模使用阶段”。网上的Hbase资料很多,学习成本正在下降。从公开的资料看,国外facebook、国内taobao均宣称在线上环境大规模使用hbase。一切都让人很兴奋。于是,在项目中引入Hbase做存储,最终却选择放弃。... 继续阅读HBase设计及应用:看上去很美

    :
    2018-05-18
  • 基于Hadoop云盘系统3:小文件存储优化及应用  在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 一、概述 首先明确概念,这里的小文件是指小于HDFS系统Block大小的文件(默认64M),如果使用HDFS存储大量的小文件,将会是一场灾难,这取决于HDFS的实现机制和框架结构,每一个存储在HDFS中的文件、目录和块映射为一个对象存储在NameNode服务器内存中,通常占用1... 继续阅读基于Hadoop云盘系统3:小文件存储优化及应用

    :
    2018-05-18
  • 信托inter网化改造 核心是大数据 恍惚恍惚又来到了文章的学习,想必大家又有很多问题吧! 信托行业在很多领域可以借助互联网的优势,比如说互联网产品的宣传介绍、互联网的验证面签、开户和期间的服务管理,都能够利用互联网扁平的无边界特性有效地提升客户体验和提升客户效率。 在论坛上,华宝信托总经理王波表示,尽管互联网与信托本是天生矛盾体,但信托的互联网改造、融合大有空间,核心即是搭建底层技术架构,进... 继续阅读信托inter网化改造 核心是大数据

    :
    2018-05-18
  • 美国数据科学家带你看看大数据的未来的理解 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 从SGI的首席科学家John R. Masey在1998年提出大数据概念,到大数据分析技术广泛应用于社会的各个领域,已经走过了17年的时间。现在再也没有企业怀疑大数据分析的力量,并且都在竞相利用大数据来增强自己企业的业务竞争力。但是,即使17年过去,大数据分析行业仍然处于快速发展的初期,... 继续阅读美国数据科学家带你看看大数据的未来的理解

    :
    2018-05-18
  • 小白学数据分析之解析在线平高比 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 什么是在线平高比 在线平高比,也有叫做CCU比率的,即平均在线占最高在线比例,公式就是R=ACU/PCU。这个公式看似很简单,大家估计很多人都会使用,那么究竟这个公式要说明什么问题?在解释问题之前简单的把ACU和PCU说明一下,因为很多人还不清楚。 ACU平均同时在线人数 定义 统计当日所有统计时... 继续阅读小白学数据分析之解析在线平高比

    :
    2018-05-18
  • 恍惚恍惚又来到了文章的学习,想必大家又有很多问题吧! 通过 采集系统 我们采集了大量文本数据,但是文本中有很多重复数据影响我们对于结果的分析。分析前我们需要对这些数据去除重复,如何选择和设计文本的去重算法?常见的有余弦夹角算法、欧式距离、Jaccard相似度、最长公共子串、编辑距离等。这些算法对于待比较的文本数据不多时还比较好用,如果我们的爬虫每天采集的数据以千万计算,我们如何对于这些海量千万级的... 继续阅读海量数据相似度计算之simhash和海明距离的讲解

    :
    2018-03-24
  •   因特网中计算机数据通信的原理?   通过课课家教育我了解到关于数据通信这些个完全不同的专业领域,想要有效有机地整合在一起进行数据挖掘项目实践,还须有完美的沟通能力。      1.1计算机网络通信技术简析计算机网络通信技术是将计算技术和通信技术有机的整合的结果,按照一定的协议固定进行计算机之间的网络信息数据传输。计算机网络通信技术是通过通信卫星或光纤等介质的有效连接,促进网络资源共享,并对数据... 继续阅读因特网中计算机数据通信的原理?

    :
    2018-03-24