大数据教程
大数据-大数据(Big Data)又称为巨量资料 ...
-
移动大数据在互联网金融反欺诈领域 恍惚恍惚又来到了文章的学习,想必大家又有很多问题吧! 参考最新的《2015中国移动互联网发展指数报告》,中国共拥有12.4亿太移动端设备,其中移动智能手机的保有量为9亿,每个移动互联网用户拥有大概1.35部智能手机。移动互联网用户中80后,90,00后占比超过了72%,成为移动互联网主要用户。平均每部手机装载了41款应用,平均每天打开25款应用,相对去年有较... 继续阅读移动大数据在互联网金融反欺诈领域
:2018-05-18
-
在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 感悟和理论 得到的灵感首先要感谢Nicholas Lovell 的这篇文章,是我得到了一些处理和分析这个模型的办法。连接如下: Lovell是从理论的解析了这个付费用户的模型,篇幅很短但是内容很好。早先我们有一个观点就是付费渗透率的提升,意味着收入在随后的一段时间内会逐渐打开和扭转,因为一旦用户开始付费(且这个群体不断膨胀),那么... 继续阅读付费用户的金子塔模型实践操作
:2018-03-24
-
Hadoop 2.0.3在Linux环境下单机部署的讲解 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 1.Hadoop2.0简述[1] HDFS:为了保证name服务器的规模水平,开发人员使用了多个独立的Namenodes和Namespaces。这些Namenode是联合起来的,它们之间不需要相互协调。Datanode可以为所有Namenode存放数据块,每个数据块要在平... 继续阅读Hadoop 2.0.3在Linux环境下单机部署的讲解
:2018-05-18
-
BI项目中的ETL设计详解 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! ETL是BI项目最重要的一个环节,通常情况下ETL会花掉整个项目的1/3的时间,ETL设计的好坏直接关接到BI项目的成败。ETL也是一个长期的过程,只有不断的发现问题并解决问题,才能使ETL运行效率更高,为项目后期开发提供准确的数据。 ETL的设计分三部分:数据抽取、数据的清洗转换、数据的加载。在设计... 继续阅读BI项目中的ETL设计详解
:2018-05-18
-
大数据智慧农业前进的号角已经吹响 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 据相关报告显示,世界人口到2050年将达到90亿。目前,农业生产力与50年前相比提高了三倍,但土地使用量仅比过去提高了12%。尽管如此,据联合国粮食及农业组织预测,粮食生产力必须提高60%才能应对人口快速增长带来的负担。 提高非洲及其他地区的粮食产量是使得数百万人脱贫,并满足未来90亿人口对... 继续阅读大数据智慧农业前进的号角已经吹响
:2018-05-18
-
恍惚恍惚又来到了文章的学习,想必大家又有很多问题吧! 因为项目的需要,学习使用了Hadoop,和所有过热的技术一样,“大数据”、“海量”这类词语在互联网上满天乱飞。Hadoop是一个非常优秀的分布式编程框架,设计精巧而且目前没有同级别同重量的替代品。另外也接触到一个内部使用的框架,对于Hadoop做了封装和定制,使得更满足业务需求。我最近也想写一些Hadoop的学习和使用心得,但是看到网上那么泛滥... 继续阅读Hadoop不能解决的问题
:2018-03-24
-
移动大数据在互联网金融反欺诈领域 恍惚恍惚又来到了文章的学习,想必大家又有很多问题吧! 参考最新的《2015中国移动互联网发展指数报告》,中国共拥有12.4亿太移动端设备,其中移动智能手机的保有量为9亿,每个移动互联网用户拥有大概1.35部智能手机。移动互联网用户中80后,90,00后占比超过了72%,成为移动互联网主要用户。平均每部手机装载了41款应用,平均每天打开25款应用,相对去年有较... 继续阅读移动大数据在互联网金融反欺诈领域
:2018-05-18
-
在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 感悟和理论 得到的灵感首先要感谢Nicholas Lovell 的这篇文章,是我得到了一些处理和分析这个模型的办法。连接如下: Lovell是从理论的解析了这个付费用户的模型,篇幅很短但是内容很好。早先我们有一个观点就是付费渗透率的提升,意味着收入在随后的一段时间内会逐渐打开和扭转,因为一旦用户开始付费(且这个群体不断膨胀),那么... 继续阅读付费用户的金子塔模型实践操作
:2018-03-24
-
Hadoop 2.0.3在Linux环境下单机部署的讲解 在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!! 1.Hadoop2.0简述[1] HDFS:为了保证name服务器的规模水平,开发人员使用了多个独立的Namenodes和Namespaces。这些Namenode是联合起来的,它们之间不需要相互协调。Datanode可以为所有Namenode存放数据块,每个数据块要在平... 继续阅读Hadoop 2.0.3在Linux环境下单机部署的讲解
:2018-05-18
-
采样定理为2倍,为何用2.56倍进行采样? 香农定理中要求采样频率至少为关心最高信号频率的2倍,但为什么工程中经常用2.56倍?本篇文章中有着详细的解答,我想大家看完这篇文章定会对大家有帮助~ 香农采样定理是这样描述的:采样频率fs至少为关心的信号最高频率的2倍。采样频率的一半称为奈奎斯特频率。采样频率的一半也称为分析带宽,或简称为带宽。 1.混叠 当采样频率设置不合理时,即采... 继续阅读采样定理为2倍,为何用2.56倍进行采样?
:2018-05-18