Hadoop – HDFS 操作

Hadoop – HDFS 操作


启动 HDFS

最初你必须格式化配置的 HDFS 文件系统,打开 namenode(HDFS 服务器),并执行以下命令。

$ hadoop namenode -format 

格式化HDFS后,启动分布式文件系统。以下命令将启动名称节点以及数据节点作为集群。

$ start-dfs.sh 

列出 HDFS 中的文件

在服务器中加载信息后,我们可以使用‘ls’找到目录中的文件列表、文件的状态下面给出了ls的语法,您可以将其作为参数传递给目录或文件名。

$ $HADOOP_HOME/bin/hadoop fs -ls <args>

插入数据到 HDFS

假设我们在本地系统中名为 file.txt 的文件中有数据应该保存在 hdfs 文件系统中。按照下面给出的步骤在 Hadoop 文件系统中插入所需的文件。

步骤1

您必须创建一个输入目录。

$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/input 

第2步

使用 put 命令将数据文件从本地系统传输并存储到 Hadoop 文件系统。

$ $HADOOP_HOME/bin/hadoop fs -put /home/file.txt /user/input 

第 3 步

您可以使用 ls 命令验证文件。

$ $HADOOP_HOME/bin/hadoop fs -ls /user/input 

从 HDFS 检索数据

假设我们在 HDFS 中有一个名为outfile的文件下面给出了从 Hadoop 文件系统检索所需文件的简单演示。

步骤1

最初,使用cat命令查看来自 HDFS 的数据

$ $HADOOP_HOME/bin/hadoop fs -cat /user/output/outfile 

第2步

使用get命令从 HDFS 获取文件到本地文件系统

$ $HADOOP_HOME/bin/hadoop fs -get /user/output/ /home/hadoop_tp/ 

关闭 HDFS

您可以使用以下命令关闭 HDFS。

$ stop-dfs.sh 

觉得文章有用?

点个广告表达一下你的爱意吧 !😁