視頻:80?
課程介紹:
大數據處理的主要流程包括數據收集、數據存儲、數據處理、數據應用等主要環節,大數據spark數據清洗ETL項目是一套完整的大數據的進階教程,基于 hadoop 和spark大數據框架。
本課程由淺入深帶領大家一步步攻克 Hadoop大數據基礎框架的各個模塊,通過一個個實例帶領大家了解分布式大數據平臺的搭建過程,大數據的MapReduce編程規范、spark大數據分析引擎的使用等內容。
課程內容涵蓋:
1. 大數據的學習總覽
2. LINUX操作系統的安裝與使用
3. Hadoop基礎
4. HDFS分布式文件存儲系統
5. MapReduce分布式計算框架
6. Hadoop生態系統:Spark
課程講師:
程鵬
講師