大数据测试之hadoop命令大全 1-10978776

bei 发表于 2018-10-30 07:03:10

大数据测试之hadoop命令大全
　　1、列出所有Hadoop Shell支持的命令
　　$ bin/hadoop fs -help
　　2、显示关于某个命令的详细信息
　　$ bin/hadoop fs -help command-name
　　3、用户可使用以下命令在指定路径下查看历史日志汇总
　　$ bin/hadoop job -history output-dir
　　这条命令会显示作业的细节信息，失败和终止的任务细节。
　　4、关于作业的更多细节，比如成功的任务，以及对每个任务的所做的尝试次数等可以用下面的命令查看
　　$ bin/hadoop job -history all output-dir
　　5、格式化一个新的分布式文件系统：
　　$ bin/hadoop namenode -format
　　6、在分配的NameNode上，运行下面的命令启动HDFS：
　　$ bin/start-dfs.sh
　　bin/start-dfs.sh脚本会参照NameNode上${HADOOP_CONF_DIR}/slaves文件的内容，在所有列出的slave上启动DataNode守护进程。
　　7、在分配的JobTracker上，运行下面的命令启动Map/Reduce：
　　$ bin/start-mapred.sh
　　bin/start-mapred.sh脚本会参照JobTracker上${HADOOP_CONF_DIR}/slaves文件的内容，在所有列出的slave上启动TaskTracker守护进程。
　　8、在分配的NameNode上，执行下面的命令停止HDFS：
　　$ bin/stop-dfs.sh
　　bin/stop-dfs.sh脚本会参照NameNode上${HADOOP_CONF_DIR}/slaves文件的内容，在所有列出的slave上停止DataNode守护进程。
　　9、在分配的JobTracker上，运行下面的命令停止Map/Reduce：
　　$ bin/stop-mapred.sh
　　bin/stop-mapred.sh脚本会参照JobTracker上${HADOOP_CONF_DIR}/slaves文件的内容，在所有列出的slave上停止TaskTracker守护进程。
　　DFSShell
　　10、创建一个名为 /foodir 的目录
　　$ bin/hadoop dfs -mkdir /foodir
　　11、创建一个名为 /foodir 的目录
　　$ bin/hadoop dfs -mkdir /foodir
　　12、查看名为 /foodir/myfile.txt 的文件内容
　　$ bin/hadoop dfs -cat /foodir/myfile.txt
　　DFSAdmin
　　13、将集群置于安全模式
　　$ bin/hadoop dfsadmin -safemode enter
　　14、显示Datanode列表
　　$ bin/hadoop dfsadmin -report
　　15、使Datanode节点 datanodename退役
　　$ bin/hadoop dfsadmin -decommission datanodename
　　16、bin/hadoop dfsadmin -help 命令能列出所有当前支持的命令。比如：
　　* -report：报告HDFS的基本统计信息。有些信息也可以在NameNode Web服务首页看到。
　　* -safemode：虽然通常并不需要，但是管理员的确可以手动让NameNode进入或离开安全模式。
　　* -finalizeUpgrade：删除上一次升级时制作的集群备份。
　　17、显式地将HDFS置于安全模式
　　$ bin/hadoop dfsadmin -safemode
　　18、在升级之前，管理员需要用（升级终结操作）命令删除存在的备份文件
　　$ bin/hadoop dfsadmin -finalizeUpgrade
　　19、能够知道是否需要对一个集群执行升级终结操作。
　　$ dfsadmin -upgradeProgress status
　　20、使用-upgrade选项运行新的版本
　　$ bin/start-dfs.sh -upgrade
　　21、如果需要退回到老版本,就必须停止集群并且部署老版本的Hadoop，用回滚选项启动集群
　　$ bin/start-dfs.h -rollback
　　22、下面的新命令或新选项是用于支持配额的。前两个是管理员命令。
　　* dfsadmin -setquota...
　　把每个目录配额设为N。这个命令会在每个目录上尝试，如果N不是一个正的长整型数，目录不存在或是文件名，或者目录超过配额，则会产生错误报告。
　　* dfsadmin -clrquota ...
　　为每个目录删除配额。这个命令会在每个目录上尝试，如果目录不存在或者是文件，则会产生错误报告。如果目录原来没有设置配额不会报错。
　　* fs -count -q ...
　　使用-q选项，会报告每个目录设置的配额，以及剩余配额。如果目录没有设置配额，会报告none和inf。
　　23、创建一个hadoop档案文件
　　$ hadoop archive -archiveName NAME *
　　-archiveName NAME要创建的档案的名字。
　　src 文件系统的路径名，和通常含正则表达的一样。
　　dest 保存档案文件的目标目录。
　　24、递归地拷贝文件或目录
　　$ hadoop distcp
　　srcurl    源Url
　　desturl 目标Url
　　25、运行HDFS文件系统检查工具(fsck tools)
　　用法：hadoop fsck [-move | -delete | -openforwrite] [-files [-blocks [-locations | -racks]]]
　　命令选项描述
　　    检查的起始目录。
　　-move          移动受损文件到/lost+found
　　-delete 删除受损文件。
　　-openforwrite 打印出写打开的文件。
　　-files          打印出正被检查的文件。
　　-blocks 打印出块信息报告。
　　-locations 打印出每个块的位置信息。
　　-racks          打印出data-node的网络拓扑结构。
　　26、用于和Map Reduce作业交互和命令(jar)
　　用法：hadoop job [-submit ] | [-status < job-id>] | [-counter < counter-name>] | [-kill ] | [-events ] | [-history < jobOutputDir>] | [-list ] | [-kill-task ] | [-fail-task ]
　　命令选项                                                 描述
　　-submit                                           提交作业
　　-status                                           打印map和reduce完成百分比和所有计数器。
　　-counter                   打印计数器的值。
　　-kill                                                 杀死指定作业。
　　-events                   打印给定范围内jobtracker接收到的事件细节。
　　-history    -history       打印作业的细节、失败及被杀死原因的细节。更多的关于一个作业的细节比如
　　成功的任务，做过的任务尝试等信息可以通过指定选项查看。
　　-list -list all                                  显示所有作业。-list只显示将要完成的作业。
　　-kill-task                                           杀死任务。被杀死的任务不会不利于失败尝试。
　　-fail-task                                           使任务失败。被失败的任务会对失败尝试不利。
　　27、运行pipes作业

　　用法：hadoop pipes [-conf ] [-jobconf , < key=value>, ...] [-input ] [-output ] [-jar ] [-inputformat ] [-map 　　命令选项                            描述
　　-conf                            作业的配置
　　-jobconf , , ...    增加/覆盖作业的配置项
　　-input                            输入目录
　　-output                      输出目录
　　-jar                   Jar文件名
　　-inputformat                   InputFormat类
　　-map                            Java Map类
　　-partitioner                   Java Partitioner
　　-reduce                   Java Reduce类
　　-writer                   Java RecordWriter
　　-program                   可执行程序的URI
　　-reduces                            reduce个数
　　28、打印版本信息。
　　用法：hadoop version
　　29、hadoop脚本可用于调调用任何类。

　　用法：hadoop>　　运行名字为CLASSNAME的类。
　　30、运行集群平衡工具。管理员可以简单的按Ctrl-C来停止平衡过程(balancer)
　　用法：hadoop balancer [-threshold ]
　　命令选项                         描述
　　-threshold                   磁盘容量的百分比。这会覆盖缺省的阀值。

页: [1]

运维网's Archiver

大数据测试之hadoop命令大全 1-10978776