配置伪分布模式
1.配置xml文件:
这里需要设定3个文件:core-site.xml hdfs-site.xml mapred-site.xml,都在/home/vinking/hadoop/conf目录下
core-site.xml: Hadoop Core的配置项,例如HDFS和MapReduce常用的I/O设置等。
hdfs-site.xml: Hadoop 守护进程的配置项,包括namenode,辅助namenode和datanode等。
mapred-site.xml: MapReduce 守护进程的配置项,包括jobtracker和tasktracker。
#mkdir tmp
#mkdir hdfs
#mkdir hdfs/name
#mkdir hdfs/data
配置core-site.xml
fs.default.name NameNode的IP地址和端口,通过这个配置可以知道整个hadoop集群的名称节点及监听端口在哪里,怎么样进行联系
hdfs://localhost:9000 伪分布式设置为localhost即可,若为真实的完全分布式则为名称节点真实的ip地址才能工作,否则进程可以启动,但格式化名称节点时会失败,端口普遍使用这个端口,不太有必要做改动
配置hdfs-site.xml:
dfs.name.dir 用逗号隔开的目录名 ${hadoop.tmp.dir}/dfs/name 存储名称节点永久元数据的目录列表。名称节点在列表的每一个目标下存储着元数据的副本。
dfs.data.dir 用逗号隔开的目录名 ${hadoop.tmp.dir}/dfs/data 数据节点存储块的目录列表
dfs.replication 在分布式文件系统里面要把数据块复制多少份,这里是伪分布式,所以是复制一份