大数据教程
当前位置| > 博客

大数据教程

大数据-大数据(Big Data)又称为巨量资料 ...
  • 全方面解析Spark知识体系   Spark是整个BDAS的核心组件,是一个大数据分布式编程框架,不仅实现了MapReduce的算子map函数和reduce函数及计算模型,还提供更为丰富的算子,如filter、join、groupByKey等。是一个用来实现快速而同用的集群计算的平台。      Spark简介   Spark是整个BDAS的核心组件,是一个大数据分布式编程框架,不仅实现了Ma... 继续阅读全方面解析Spark知识体系

    :
    2018-05-17
  •   这篇文章主要讲的是带宽容易出现的几个误区和我们要怎样选择一个好的服务器网络带宽和流量,带宽可是决定网速的,大家要认真的耐心看本篇文章噢!  带宽是决定主机访问速度的重要因素之一,尤其是对于访问量大的网站,网络带宽的大小显得尤为重要。而流量其实就是带宽在时间上的累积,用数学上的话说就是带宽对时间的积分。做个通俗的比喻,拿自来水来说,带宽其实就是水管的流速,而流量就是流出的水的总量。   因为网络... 继续阅读服务器的网络带宽和流量我们要怎样选择

    :
    2018-03-24
  •   Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。而且算法已经被广泛的应用到商业、网络安全等各个领域。今天课课家就和大家全面的介绍一下Apriori算法。  导读:   随着大数据概念的火热,啤酒与尿布的故事广为人知。我们如何发现买啤酒的人往往也会买尿布这一规律?数据挖掘中的用于挖掘频繁项集和关联规则的Apriori算法可... 继续阅读全面介绍Apriori算法(Python实现)

    :
    2018-03-24
  •   网站优化我们最看重的是什么?流量,不错流量才是我们所关心的主要要素。如果一个网站没有流量,那么谈再多也不过是空想奢望,一个网站没有流量,就如无源之水无本之木。流量才是衡量一个网站的基础与标准。我们固然做网站优化不是我了追求流量,而是宣传我们的产品和服务。   基本思路是:  1.尽量减少无所谓得页面刷新。比如采用xmlhttp或者ajax等技术实现页面局部刷新。  2.大量使用缓存,其中缓存又... 继续阅读妙解网站流量的处理办法

    :
    2018-03-24
  • 大数据所产生的供应方式详解   对于“大数据”(Bigdata)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。   大数据可能被破坏或中断,但供应链管理不在其中之列。这不是说供应链没有改变。人们如何收集和分析数据,改变了供应链的沟通方式。事实上,供应链发生了巨大变化,咨询机构德勤公司发布了... 继续阅读大数据所产生的供应方式详解

    :
    2018-05-17
  • 大数据无处可藏的缺点解析   大数据,大家一听感觉是无所不能的所属名词,但是,事事都有缺点,大数据也有缺点,那么,本篇文章就给大家具体的讲一讲大数据的缺点!   多年来,隐私和大数据之间的关系已经变得非常敏感,随着新兴技术产生大量数据,关于两者之间“辩论”才刚刚开始。   随着日常生活中数据生成设备的数量不断增长,因此关于应将数据公开,以及何时应将个人数据视为私有的争论也在不断增加。   S... 继续阅读大数据无处可藏的缺点解析

    :
    2018-05-17
  • 深入讲解Python程序中不同的重启机制      大家对Python程序都比较熟悉了吧,但是有的可能不知道Python程序中不同的重启机制,那么今天课课家,就来和大家一起探讨一下。有需要的小伙伴,可以参考一下。文章里面有一些细节的知识,还望大家认真的阅读哦! 分析典型案例:   Celery 分布式异步任务框架   Gunicorn Web容器   之所以挑这两个,不仅仅是应用广泛,而且两个... 继续阅读深入讲解Python程序中不同的重启机制

    :
    2018-05-17
  • RAID在数据库存储上的应用解析   大家一定对RAID不陌生了吧,但让RAID怎么应用在数据库上,我想大多数人还是不知道的,今天课课家就来刻大家分享一下,不明白的小伙伴要认真阅读哦~      随着单块磁盘在数据安全、性能、容量上呈现出的局限,磁盘阵列(RedundantArraysofInexpensive/IndependentDisks,RAID)出现了,RAID把多块独立的磁盘按不同... 继续阅读RAID在数据库存储上的应用解析

    :
    2018-05-17
  • 深入讲解TCP/IP协议   TransmissionControlProtocol/InternetProtocol的简写,中译名为传输控制协议/因特网互联协议,又名网络通讯协议,是Internet最基本的协议、Internet国际互联网络的基础,由网络层的IP协议和传输层的TCP协议组成。TCP/IP定义了电子设备如何连入因特网,以及数据如何在它们之间传输的标准。协议采用了4层的层级结构,... 继续阅读深入讲解TCP/IP协议

    :
    2018-05-17
  • 数据加密标准   数据加密标准使用一个 56 位的密钥以及附加的 8 位奇偶校验位,产生最大 64 位的分组大小。这是一个迭代的分组密码,使用称为 Feistel 的技术,其中将加密的文本块分成两半。使用子密钥对其中一半应用循环功能,然后将输出与另一半进行“异或”运算;接着交换这两半,这一过程会继续下去,但最后一个循环不交换。数据加密标准使用 16 个循环,使用异或,置换,代换,移位操作四种基... 继续阅读数据加密标准

    :
    2018-05-18