大数据教程
当前位置| > 博客

大数据教程

大数据-大数据(Big Data)又称为巨量资料 ...
  • CEO们需要了解的五个问题 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!!现在,沃尔玛施压是和可口可乐新一代配方饮料都在借助新的数据库系统和分析平台对客户数据进行实时分析和需求预测,他们以此来获得更好的产品优化方案。CEO们开始留意大数据,他们想知道大数据是否真的可以帮助他们的业务形成切实有效的竞争优势。大数据投资和汇报比到底如何,毕竟大数据技术并不便宜。这里给出关于大数据,... 继续阅读CEO们需要了解的五个问题

    :
    2018-05-18
  • 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 留存率这个数据指标不记得从何时起变得那么重要,重要到研发上把它作为游戏好坏的一个标准,运营商(平台)作为了一个准入的钥匙,是否值得继续下去。有时候觉得粗暴,甚至无知了有点。因为肤浅的百分比背后隐藏着更多的金子,也可能是垃圾。 以上算是一点吐槽,更多潜在的问题这里不想累述,前几日写过一个关于的留存率是什么的文章,我想肯定很多人看过了,... 继续阅读小白学数据分析:留存率是什么?

    :
    2018-03-24
  • 大数据提速:Impala能否取代Hive的讲解 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 近日,Cloudera发布Impala实时查询引擎Impala 1.0 beta版,并声称这项**性的技术能解决Hadoop批处理延迟问题(比原来基于MapReduce的HiveSQL查询速度提升3~30倍),开源的Impala还为Hadoop打开了通向关系型数据库和商业智能工具... 继续阅读大数据提速:Impala能否取代Hive的讲解

    :
    2018-05-18
  • 恍惚恍惚又来到了文章的学习,想必大家又有很多问题吧! R语言多元分析系列之一:主成分分析 主成分分析(principal components analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集... 继续阅读R语言多元分析系列的讲解

    :
    2018-03-24
  • 甲方乙方:大数据分析内外有别的讲解 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 另外,也有一些专做数据服务的第三方公司不断涌现,希望能够帮助产生数据的甲方分担数据分析的担子,挖掘出更多有价值的规律,帮助甲方不断改进业务水平、不断发现业务中存在的问题。从这个角度来讲,甲方公司与第三方数据服务公司的初衷是一致的。 那么到底在第三方公司做数据服务和甲方公司做数据服务有没有哪些不... 继续阅读甲方乙方:大数据分析内外有别的讲解

    :
    2018-05-18
  • 数据分析对淘宝时段数据的运用 恍惚恍惚又来到了文章的学习,想必大家又有很多问题吧! 商业活动过程中会产生很多方面的数据,这些数据所反映的是关于消费者和潜在的大型客户的信息,如果能够对这些数据进行深入的分析就会对于用户的行为掌握得更为精准,比如说在淘宝中运用数据分析就能够分析出当前的用户在淘宝时段和地域中的特点和规律,从而更好的把握市场需求。 mysql数据库 那么在淘宝数据上什么样的数据... 继续阅读数据分析对淘宝时段数据的运用

    :
    2018-05-18
  • 创建SSIS包:ETL中典型的数据清洗的方法 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 这个例子的情景是一个信用卡公司,目前正着手于拓展Florida州新成立的一些公司的业务。市场部门每周都会向这些公司发送一些邮件,我们要为所有的邮件准备抽取数据。假设Florida州提供的一个上面这个dat文件,它是从老的计算机系统里面得到的,它是定长分隔的,这意味着文件中没有分隔... 继续阅读创建SSIS包:ETL中典型的数据清洗的方法

    :
    2018-05-18
  • –在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! —————-回顾早期的争论—————– 现在搞大数据(后端数据)的朋友,和早些年搞数据仓库的没啥本质区别,因为都是人为需要把各系统的数据集中化,现在增加个非结构化数据,于是就叫大数据,而以前就叫数据仓库。 在10多年前,数据仓库界一直有个争论,到底是TOP-DOWN好还是Bottom-UP好,一边说,我先把企业所有数据都集成,数据... 继续阅读大数据与商业分析:新的TOP-DOWN纠结及疑问

    :
    2018-03-24
  • 浅谈快速发展中的企业存在的数据污染问题 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 引言 公司由粗犷式发展转向精细化运营的过程中,数据决策支持发挥着至关重要的作用。而在传统行业里,由于数据量相对较小;业务系统变更相对规律;系统架构相对简单;数据来源相对单一等原因,从而使数据的计算过程更加简单,计算结果更加准确。而作为业务与技术高速发展的京东,用常规的架构设计无法满足公司对... 继续阅读浅谈快速发展中的企业存在的数据污染问题

    :
    2018-05-18