大数据实验踩坑指南

本文记录搭建伪分布式的大数据集群的全过程,复现(抄袭)了林子雨老师的网站用户行为分析案例[1],删除了已被归档的sqoop工具的部分,并对一些踩坑点进行了说明和修改

本文环境说明:

  • 本文使用的Shell为bash shell
  • 本文的Linux用户名及密码为hadoop
  • 本文的MySQL使用用户hadoop,密码为hadoop

记录分为以下章节


  1. 重磅:大数据课程实验案例:网站用户行为分析(免费共享) ↩︎