国庆假期留在学校做了一下林子雨博士的大数据实验--淘宝双11数据分析与预测,虽然教程写得很详细,但自己还是踩了很多坑,现在记录下来,希望给别人一点帮助。

淘宝双11数据分析与预测实验链接:http://dblab.xmu.edu.cn/post/8116/

问题一:安装Hadoop时报错

Starting namenodes on [localhost]
localhost: mkdir: 无法创建目录"/usr/local/hadoop/logs": 权限不够
localhost: chown: 无法访问"/usr/local/hadoop/logs": 没有那个文件或目录
localhost: starting namenode, logging to /usr/local/hadoop/logs/hadoop-dblab-namenode-dblab-virtual-machine.out
localhost: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 159: /usr/local/hadoop/logs/hadoop-dblab-namenode-dblab-virtual-machine.out: 没有那个文件或目录
localhost: head: 无法打开"/usr/local/hadoop/logs/hadoop-dblab-namenode-dblab-virtual-machine.out" 读取数据: 没有那个文件或目录
localhost: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 177: /usr/local/hadoop/logs/hadoop-dblab-namenode-dblab-virtual-machine.out: 没有那个文件或目录
localhost: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 178: /usr/local/hadoop/logs/hadoop-dblab-namenode-dblab-virtual-machine.out: 没有那个文件或目录
localhost: mkdir: 无法创建目录"/usr/local/hadoop/logs": 权限不够
localhost: chown: 无法访问"/usr/local/hadoop/logs": 没有那个文件或目录
localhost: starting datanode, logging to /usr/local/hadoop/logs/hadoop-dblab-datanode-dblab-virtual-machine.out
localhost: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 159: /usr/local/hadoop/logs/hadoop-dblab-datanode-dblab-virtual-machine.out: 没有那个文件或目录
localhost: head: 无法打开"/usr/local/hadoop/logs/hadoop-dblab-datanode-dblab-virtual-machine.out" 读取数据: 没有那个文件或目录
localhost: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 177: /usr/local/hadoop/logs/hadoop-dblab-datanode-dblab-virtual-machine.out: 没有那个文件或目录
localhost: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 178: /usr/local/hadoop/logs/hadoop-dblab-datanode-dblab-virtual-machine.out: 没有那个文件或目录
Starting secondary namenodes [0.0.0.0]
0.0.0.0: mkdir: 无法创建目录"/usr/local/hadoop/logs": 权限不够
0.0.0.0: chown: 无法访问"/usr/local/hadoop/logs": 没有那个文件或目录
0.0.0.0: starting secondarynamenode, logging to /usr/local/hadoop/logs/hadoop-dblab-secondarynamenode-dblab-virtual-machine.out
0.0.0.0: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 159: /usr/local/hadoop/logs/hadoop-dblab-secondarynamenode-dblab-virtual-machine.out: 没有那个文件或目录
0.0.0.0: head: 无法打开"/usr/local/hadoop/logs/hadoop-dblab-secondarynamenode-dblab-virtual-machine.out" 读取数据: 没有那个文件或目录
0.0.0.0: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 177: /usr/local/hadoop/logs/hadoop-dblab-secondarynamenode-dblab-virtual-machine.out: 没有那个文件或目录
0.0.0.0: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 178: /usr/local/hadoop/logs/hadoop-dblab-secondarynamenode-dblab-virtual-machine.out: 没有那个文件或目录
dblab@dblab-virtual-machine:/usr/local/hadoop$ sudo chown -R niugen /usr/local/hadoop

报错原因:权限不够

解决方法:

sudo chown -R 你自己电脑到用户名 /usr/local/hadoop

问题二:Error: JAVA_HOME is not set and could not be found.

解决方法: JAVA_HOME 环境变量没设置好,请按教程在.bashrc文件中设置好JAVA_HOME,如果还是出现 Error: JAVA_HOME is not set and could not be found. 的错误,就到hadoop的安装目录修改配置文件“/usr/local/hadoop/etc/hadoop/hadoop-env.sh”,在里面找到“export JAVA_HOME=${JAVA_HOME}”这行,然后,把它修改成JAVA安装路径的具体地址,比如,
“export JAVA_HOME=/usr/lib/jvm/你自己到java版本”,然后,再次启动Hadoop。

问题三:使用Sqoop将Hive数据导入到MySQL中

报错内容:

ERROR manager.SqlManager: Error executing statement: java.sql.SQLException: Access denied for user 'root'@'localhost' (using password: YES)
...
ERROR tool.ExportTool: Encountered IOException running export job: java.io.IOException: No columns to generate for ClassWriter

报错原因:操作权限不够
解决方法:
首先用命令service mysql start确保mysql已经启动,进入操作界面 mysql -u root -p,按提示输入的mysql密码,然后执行下面命令修改远程登录权限

mysql> grant all privileges on *.* to root@localhost identified by 'root';
Query OK, 0 rows affected, 1 warning (0.00 sec)mysql> flush privileges;
Query OK, 0 rows affected (0.04 sec)

问题四:将Hive数据导入到MySQL时报错

报错内容:

ERROR:"Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient"

报错原因:换数据库时没有和hive成功通信。
解决方法:在确保Hive和MySQL配置步骤正确执行的前提下,在终端输入如下命令

source /usr/local/hive/scripts/metastore/upgrade/mysql/hive-schema-3.0.0.mysql.sql//使这个版本的配置文件有用!注意更换文件路径 

schematool -dbType mysql -initSchema//进行初始化.运行显示成功就可以正常通信了。

问题五:新建Java Web项目时,没有找到Dynamic Web Project

问题原因:安装的是专门开发java项目的,而Dynamic Web Project属于J2EE技术,所以你要专门下载一个集成了J2EE插件的Eclipse,(eclipse-jee-helios-SR2-win32)
解决方法:
方法一:先卸载之前的eclipse版本,到eclipse官网下载相对应版本的IDE

官网链接:http://www.eclipse.org/downloads/packages/release/neon/2/eclipse-ide-java-ee-developers

方法二:查看博客https://www.cnblogs.com/longronglang/p/7156383.html  (如果你在原来的eclipse版本下执行这个方法不成功,请转到方法一

问题六:Eclipse导入外部的jar包

ps:与其说这是一个问题,不如说这是一个注意项。之前天真以为导入jar包只要鼠标左键拖拉进去就可以,其实这种做法是错误的。

正确操作步骤查看此链接:https://jingyan.baidu.com/article/ca41422fc76c4a1eae99ed9f.html

转载于:https://www.cnblogs.com/lanhuo666/p/10036071.html

淘宝双11数据分析与预测汇总相关推荐

  1. 淘宝双11数据分析与预测--“坑点”汇总

    国庆假期留在学校做了一下林子雨博士的大数据实验--淘宝双11数据分析与预测,虽然教程写得很详细,但自己还是踩了很多坑,现在记录下来,希望给别人一点帮助. 淘宝双11数据分析与预测实验连接:点击这里 问 ...

  2. 淘宝双11数据分析与预测

    淘宝双11数据分析与预测 一. 案例简介 Spark课程实验案例:淘宝双11数据分析与预测课程案例,由厦门大学数据库实验室团队开发,旨在满足全国高校大数据教学对实验案例的迫切需求.本案例涉及数据预处理 ...

  3. 淘宝双11数据分析与预测课程案例—步骤四:利用Spark预测回头客行为代码报错

    在练习林子雨老师的"淘宝双11数据分析与预测课程案例-步骤四:利用Spark预测回头客行为"章节时出现了代码报错. 具体在执行"val model = SVMWithSG ...

  4. Spark大数据-基于Hive和Spark的淘宝双11数据分析与预测

    基于Hive和Spark的淘宝双11数据分析与预测 1.系统和环境要求(版本仅供参考): Linux: centos7 MySQL: 5.7.16 Hadoop: 2.7.1 Hive: 1.2.1 ...

  5. 大数据-11-案例演习-淘宝双11数据分析与预测

    主要摘自 http://dblab.xmu.edu.cn/post/8116/ 案例简介 Spark课程实验案例:淘宝双11数据分析与预测课程案例,由厦门大学数据库实验室团队开发,旨在满足全国高校大数 ...

  6. Cloud Computing(8)_实例实现_淘宝双11数据分析与预测

    在本文中,主要实现了一个云计算相关实例:淘宝双11数据分析与预测 数据来源为: http://dblab.xmu.edu.cn/ 由于本文内容为课上本人和同学所做的一次presentation,故将仅 ...

  7. 【大数据基础】淘宝双11数据分析与预测

    https://dblab.xmu.edu.cn/post/8116/ 问题 问题1 mysql登录需要密码 https://cloud.tencent.com/developer/beta/arti ...

  8. 淘宝双11数据分析与预测课程案例:实验环境搭配

    1 软件安装清单 安装Hadoop 安装MySQL 安装Hive 安装Sqoop 安装Eclipse 安装ECharts 2 hadoop安装 hadoop在centos的伪分布式安装 3 MySql ...

  9. 淘宝双11大数据分析(数据准备篇)

    文章目录 前言 数据内容分析 `user_log.csv`文件内容含义 `train.csv` 和 `test.csv` 文件内容含义 数据上传到Linux系统并解压 数据集的预处理 文件信息截取 导 ...

最新文章

  1. 重磅盘点:过去8年中深度学习最重要的想法
  2. 互联网如何促进经济发展?腾讯、谷歌、Facebook的实践和经验
  3. mysql 逻辑架构
  4. 用Git向gitHub上传项目
  5. Python: 测试函数是否被调用
  6. Shift register(RAM-based)------ALTSHIFT_TAPS
  7. boost::signals2::signal_type相关的测试程序
  8. 处理测试环境硬盘爆满
  9. mysql 结构体_mysql模块使用结构体生成数据库表,不识别long类型
  10. 算法导论6:排序小结和最值取法 2016.1.6
  11. “数学不好,干啥都不行!”高级开发:方向不对,努力也白费!
  12. 最新html取消dynsrc属性无效,HTML属性标签2
  13. Directx11教程(33) 纹理映射(3)
  14. PHP5.4 + IIS + Win2008 R2 配置
  15. Meta Learning | 加了元学习之后,少样本学习竟然可以变得这么简单!
  16. 单片机原理及应用 张鑫_单片机原理及应用
  17. 用javascript写一个简单的登录表单,包含用户名、密码和手机号码。提交数据时验证用户名、密码和手机号输入格式。
  18. 戴尔科技 赢在“边缘”
  19. 因子分析和主成分分析
  20. 官宣|深圳新增6条新建地铁线路和100个站点

热门文章

  1. Fiddler 工作原理和使用
  2. 【论文解读】Learning to Deceive with Attention-Based Explanations  注意力机制作为模型的可解释性存疑
  3. 《原创lightroom 4中文视频教程【高清包】》(lightroom4 video tutorials)更新至22集[MP4]
  4. Android 8.0 odex预编译与空间占用相关设置探究
  5. 蓝桥杯数学题:天平称重:巧用三进制。基于python3.9的原创代码
  6. Django框架整理
  7. 使用python提取轮廓做定制的毛笔字帖
  8. java基础教程:基础语法之术语和入口类(2)
  9. 福师《人格心理学》在线作业一、二
  10. 第一次作业(自我介绍+软工五问)