大数据实验踩坑指南
本文记录搭建伪分布式的大数据集群的全过程,复现(抄袭)了林子雨老师的网站用户行为分析案例[1],删除了已被归档的sqoop工具的部分,并对一些踩坑点进行了说明和修改
本文环境说明:
- 本文使用的Shell为bash shell
- 本文的Linux用户名及密码为
hadoop
- 本文的MySQL使用用户hadoop,密码为hadoop
记录分为以下章节
- 大数据实验踩坑指南_No.1——Hadoop的安装配置
- 大数据实验踩坑指南_No.2——Hive的安装配置
- 大数据实验踩坑指南_No.3——ZooKeeper的安装配置.md
- 大数据实验踩坑指南_No.4——HBase的安装配置.md
- 大数据实验踩坑指南_No.5——R语言和软件包的安装
- 大数据实验踩坑指南_No.6——实验案例:网站用户行为分析