本文共 622 字,大约阅读时间需要 2 分钟。
一、大数据的起源
1、举例:(1)商品推荐 问题1:大量订单如何存储?问题2:大量订单如何计算?(2)天气预报: 问题1:大量的天气数据如何存储?问题2:大量的天气数据如何计算?2、大数据核心的问题: (1)数据的存储:分布式文件系统 (2)数据的计算:分布式计算(MapReduce)3、MapReduce的计算模型的来源 (1)根据Google发表一篇论文:MapReduce (2)问题:PageRank(网页排名)---> 举例
**三、MapReduce的处理数据流程(非常、非常、非常重要)
四、开发自己的MapReduce程序(Java程序)
五、Yarn调度的过程**
很多人都知道我有大数据培训资料,都天真的以为我有全套的大数据开发、hadoop、spark等视频学习资料。我想说你们是对的,我的确有大数据开发、hadoop、spark的全套视频资料。
如果你对大数据开发感兴趣可以加口群领取免费学习资料: 763835121
转载于:https://blog.51cto.com/11275216/2113261