设为首页 收藏本站
查看: 2217|回复: 0

[经验分享] Hadoop之Cloudera Manager安装问题总结【转】

[复制链接]

尚未签到

发表于 2016-12-12 11:19:25 | 显示全部楼层 |阅读模式
安装过程中,由于网络终端,导致下面问题:
问题1:安装停止在获取安装锁


/tmp/scm_prepare_node.tYlmPfrT
using SSH_CLIENT to get the SCM hostname: 172.16.77.20 33950 22
opening logging file descriptor
正在启动安装脚本...正在获取安装锁...BEGIN flock 4 
    这段大概过了半个小时,一次卸载,一次等了快1个小时,终于过去了,
问题2:不能选择主机
    安装失败了,重新不能选主机
DSC0000.png
    解决方案,需要清理安装失败文件《Hadoop之Cloudera Manager CDH4卸载》
问题3:DNS反向解析PTR localhost
   描述:DNS反向解析错误,不能正确解析Cloudera Manager Server主机名。如下日志:

Detecting Cloudera Manager Server...
Detecting Cloudera Manager Server...
BEGIN host -t PTR 192.168.1.198
198.1.168.192.in-addr.arpa domain name pointer localhost.
END (0)
using localhost as scm server hostname
BEGIN which python
/usr/bin/python
END (0)
BEGIN python -c 'import socket; import sys; s = socket.socket(socket.AF_INET); s.settimeout(5.0); s.connect((sys.argv[1], int(sys.argv[2]))); s.close();' localhost 7182
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "<string>", line 1, in connect
socket.error: [Errno 111] Connection refused
END (1)
could not contact scm server at localhost:7182, giving up
waiting for rollback request

解决方案:将连不上的机器 /usr/bin/host 文件删掉,执行下面命令

sudo mv /usr/bin/host /usr/bin/host.bak
   说明:不明白cloudera的初衷,这里已经得到 Cloudera Manager Server的ip了,却还要把ip解析成主机名来连接。由于DNS反向解析没有配置好,根据Cloudera Manager Server 的ip解析主机名却得到了localhost,造成之后的连接错误。这里的解决方案是直接把/usr/bin/host删掉,这样Cloudera Manager就会直接使用 ip进行连接,就没有错了。
问题 4 NTP:
   问题描述: 

Bad Health --Clock Offset
The host's NTP service did not respond to a request for the clock offset.
  解决:配置NTP服务
   步骤参考:


  • CentOS配置NTP Server:【http://www.hailiangchen.com/centos-ntp/】
  • 国内常用NTP服务器地址及IP【http://www.douban.com/note/171309770/】

   修改配置文件:【vim /etc/ntp.conf】

# Use public servers from the pool.ntp.org project.
# Please consider joining the pool (http://www.pool.ntp.org/join.html).
server s1a.time.edu.cn prefer
server s1b.time.edu.cn
server s1c.time.edu.cn
restrict 172.16.1.0 mask 255.255.255.0 nomodify   <===放行局域网来源
  启动ntp服务【service ntpd restart 】   
  客户端同步时间(work02,work03):【ntpdate work01】
   说明:NTP服务启动需要大约五分钟时间,服务启动之前,若客户端同步时间,则会出现错误“no server suitable for synchronization found”
   定时同步时间:在work02和 work03上配置crontab定时同步时间【crontab -e】

00 12 * * * root /usr/sbin/ntpdate 192.168.56.121 >> /root/ntpdate.log 2>&1
  问题 5 
  描述:Clock Offset


  • Ensure that the host's hostname is configured properly.
  • Ensure that port 7182 is accessible on the Cloudera Manager Server (check firewall rules).
  • Ensure that ports 9000 and 9001 are free on the host being added.
  • Check agent logs in /var/log/cloudera-scm-agent/ on the host being added (some of the logs can be found in the installation details).


  问题定位:在对应host(work02、work03)上运行 'ntpdc -c loopinfo'

[iyunv@work03 work]# ntpdc -c loopinfo
ntpdc: read: Connection refused
  解决:【开启ntp服务:三台机器都开机启动 ntp服务】

chkconfig ntpd on
  问题 6 heartbeat:
  错误信息:【Installation failed. Failed to receive heartbeat from agent.】
  解决:关闭防火墙
  问题 7 Unknow Health:

Unknow Health
重启后:Request to theHost Monitor failed.
service --status-all| grep clo
机器上查看scm-agent状态:cloudera-scm-agent dead but pid file exists
  解决:重启服务

service cloudera-scm-agent restart
service cloudera-scm-server restart
  问题 8 canonial name hostname consistent:

Bad Health
The hostname and canonical name for this host are not consistent when checked from a Java process.
canonical name:
4092 Monitor-HostMonitor throttling_logger WARNING  (29 skipped) hostname work02 differs from the canonical name work02.xinzhitang.com
  解决:修改hosts 使FQDN和 hostname相同【ps:虽然解决了但是不明白为什么主机名和主机别名要一样】

/etc/hosts
192.168.1.185 work01 work01
192.168.1.141 work02 work02
192.168.1.198 work03 work03
  问题 9 Concerning Health:
  Concerning Health Issue
  --  Network Interface Speed --
  描述:The host has 2 network interface(s) that appear to be operating at less than full speed. Warning threshold: any.
  详细:

This is a host health test that checks for network interfaces that appear to be operating at less than full speed.
A failure of this health test may indicate that network interface(s) may be configured incorrectly and may be causing performance problems. Use the ethtool command to check and configure the host's network interfaces to use the fastest available link speed and duplex mode.
  解决:本次测试修改了 Cloudera Manager 的配置,应该不算是真正的解决
  转子:http://www.aboutyun.com/thread-9087-1-1.html

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.iyunv.com/thread-313245-1-1.html 上篇帖子: Hadoop Hive sql语法详解5--HiveQL与SQL区别 下篇帖子: 大数据框架hadoop之Observe设计模式应用
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表