
大數(shù)據(jù)分析原理和應(yīng)用培訓(xùn)
第一章 緒論
大數(shù)據(jù)的產(chǎn)生背景與概念
大數(shù)據(jù)的特點和技術(shù)概述
大數(shù)據(jù)的應(yīng)用與價值體現(xiàn)
大數(shù)據(jù)時代的思維變革
第二章 開源大數(shù)據(jù)平臺
開源大數(shù)據(jù)平臺(Hadoop)
開源大數(shù)據(jù)平臺(Spark)
簡明實驗指南
第三章 Hadoop分布式文件系統(tǒng)——HDFS
3.1HDFS概述
3.2HDFS體系結(jié)構(gòu)
3.3&3.4HDFS存儲原理與優(yōu)缺點分析
補充材料:熟悉常用的HDFS操作
第四章 MapReduce并行編程模型
4.1概述
4.2MapReduce體系結(jié)構(gòu)
4.3MapReduce工作流程
4.4MapReduce實例分析
4.5MapReduce編程實踐
4.6MapReduce優(yōu)缺點分析
第五章 Hadoop 2.0的資源管理調(diào)度框架——YARN
5.1 YARN產(chǎn)生的背景 &5.2 YARN設(shè)計思路
5.3 YARN體系結(jié)構(gòu)
5.4 YARN工作流程
5.5 YARN優(yōu)缺點分析
第六章 大數(shù)據(jù)的獲取
6.1 網(wǎng)絡(luò)爬蟲基礎(chǔ)知識
6.2 Requests庫
6.3 Beautiful Soup庫
6.4 綜合實驗
第七章 大數(shù)據(jù)分析算法
7.1 聚類算法
7.2 分類算法
第八章 大數(shù)據(jù)分析應(yīng)用
8.1大數(shù)據(jù)分析在商業(yè)中的應(yīng)用(大數(shù)據(jù)營銷)
8.2 大數(shù)據(jù)分析在投資中的應(yīng)用
8.3 大數(shù)據(jù)分析在保險中的應(yīng)用
8.4 大數(shù)據(jù)分析在銀行中的應(yīng)用