
Hadoop 數(shù)據(jù)導入與導出培訓
一個經(jīng)典的數(shù)據(jù)架構(gòu)中,Hadoop 是處理復雜數(shù)據(jù)流的核心。
數(shù)據(jù)往往是從許多分散的系統(tǒng)中收集而來,
并導入 Hadoop 分布式文件系統(tǒng)(HDFS)中,
通過 MapReduce 或者其他基于 MapReduce 封裝的語言進行處理。
1
導入和導出數(shù)據(jù)
1.使用Hadoopshell命令導入和導出數(shù)據(jù)到HDFS
2.Pig腳本來演示下getmerge命令的功能
3.使用distcp實現(xiàn)集群間數(shù)據(jù)復制
4.使用Sqoop從MySQL數(shù)據(jù)庫導入數(shù)據(jù)到HDFS
5.使用Sqoop從HDFS導出數(shù)據(jù)到MySQL

請
登錄
后發(fā)表評論
新評論
全部
第1節(jié)
第2節(jié)
第3節(jié)
第4節(jié)
第5節(jié)
第6節(jié)
第7節(jié)
第8節(jié)
第9節(jié)
第10節(jié)
第11節(jié)
第12節(jié)
第13節(jié)
第14節(jié)
第15節(jié)
第16節(jié)
第17節(jié)
我的報告 / 所有報告