VPS参考测评推荐
专注分享VPS主机优惠信息
衡天云优惠活动
华纳云优惠活动
荫云优惠活动

如何安装和配置Hadoop数据库(Hadoop Installation and Configuration)

主机参考:VPS测评参考推荐/专注分享VPS服务器优惠信息!若您是商家可以在本站进行投稿,查看详情!此外我们还提供软文收录、PayPal代付、广告赞助等服务,查看详情!
我们发布的部分优惠活动文章可能存在时效性,购买时建议在本站搜索商家名称可查看相关文章充分了解该商家!若非中文页面可使用Edge浏览器同步翻译!PayPal代付/收录合作

安装和配置Hadoop可以分为几个主要步骤。 以下是假设您使用 Linux 操作系统(例如 Ubuntu)的基本指南。

1.安装Java开发工具包(JDK)

Hadoop需要Java运行环境,因此必须先安装JDK。

sudo apt update
sudo apt install openjdk-11-jdk

验证安装Java:

java -version

2.下载并解压Hadoop即可下载来自 Apache Hadoop 官方网站的 Hadoop 最新版本。

wget https://downloads.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
tar -xzf hadoop-3.3.1.tar.gz
sudo mv hadoop-3.3.1 /usr/local/hadoop
 

3.配置环境变量

编辑~/.bashrc文件,添加Hadoop环境变量。

sudo nano ~/.bashrc

在文件末尾添加以下内容内容:

导出 HADOOP_HOME=/usr/local/hadoop
导出 PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
导出 HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

保存并退出编辑器以启用环境变量。

来源 ~/.bashrc

4. 配置 core-site.xml

编辑 Hadoop 配置文件 core-site.xml

sudo nano $HADOOP_CONF_DIR/core-site.xml

添加以下内容。

<配置>
 <属性>
 <名称>fs .defaultFS</名称>
 <>hdfs://localhost:9000</>
 </属性>
</设置>

保存并退出编辑器我会。

5.配置hdfs-site.xml

编辑Hadoop配置文件hdfs-site.xml

sudo nano $HADOOP_CONF_DIR/hdfs-site.xml

添加以下内容。

<配置>
 <属性>
 <名称>dfs.replication名称>
 <>1</>
 </ 属性> 
 <属性>
 <名称>dfs .namenode.name.dir</名称>
 <>/usr/local/hadoop/data/namenode</>
 </属性>
</设置>

保存完成

6.启动HDFS

格式化NameNode并启动HDFS集群>hdfs NameNode。 -format
start-dfs.sh

7.检查HDFS

hdfs dfs 可以使用H 命令。DFS 是否正常工作? /pre>

8. 启动 YARN

编辑 yarn-site.xml 文件。

sudo nano $HADOOP_CONF_DIR/yarn-site.xml

添加以下内容。

<设置>
 <属性>
 <名称>yarn.resourcemanager.hostname</名称> 
 <>本地主机</>
 </属性>
 <属性>
 <名称>yarn.nodemanager.aux-services</名称>
 <>mapreduce_shuffle</>
 </属性>
 < 属性> 
 <名称>yarn.nodemanager.aux-services.mapreduce.shuffle.class</名称>
 <>org.apache .hadoop.mapred.ShuffleHandler</>
 </属性>
</配置>

保存并退出编辑器。

启动 YARN ResourceManager 和 NodeManager。

start-yarn.sh

9. 检查 YARN

[ 您可以使用 h]

yarn 命令检查 YARN 是否正常运行。

纱线-版本

10。 安装Hive或Pig(可选)

如果您需要使用Hive或Pig等工具,可以继续安装和配置它们。

安装 Hive

wget https://downloads.apache.org/hive/hive-3.3.7/ apache -hive-3.3.7-bin.tar.gz
tar -xzf apache-hive-3.3.7-bin.tar.gz
sudo mv apache-hive-3.3.7 /usr/local/hive

编辑hive-site.xml 文件。

sudo nano $HADOOP_CONF_DIR/hive-site.xml

添加以下内容。

<设置>
 <属性>
 <名称>hive.metastore.warehouse.dir</名称>
 <>/usr/local/hive/warehouse</>
 </属性>
 <属性>
 <名称>hive.exec.scratchdir</名称>
 <>/tmp/hive</>
 </属性>
 <属性>
 <名称>hive.querylog 。    位置</名称>
 <>/tmp/hive/log</ >
 </属性>
 <属性>
 <名称>蜂巢。    server2.logging.operation.log.location</名称>
 <>/tmp/hive/operation_logs</>
 </属性>
</设置>

保存并退出编辑器。

启动 HiveServer2。

hive --service hiveserver2 &

11. 安装 Pig(可选)。

wget https://downloads.apache.org/pig/pig-0.19.0/pig-0.19.0.tar。   gz
tar - xzf pig-0.19.0.tar.gz
sudo mv pig-0.19.0 /usr/local/pig

pig-env.sh 文件。

sudo nano $HADOOP_CONF_DIR/pig-env.sh

添加以下内容。

导出 HADOOP_HOME=/usr /local/hadoop
导出 PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

保存并退出编辑器。

启动 Pig。

pig -version

上述步骤应该会成功安装。 然后配置Hadoop。 如果您遇到任何问题,请参阅Hadoop的官方文档或社区论坛。

这几篇文章你可能也喜欢:

本文由主机参考刊发,转载请注明:如何安装和配置Hadoop数据库(Hadoop Installation and Configuration) https://zhujicankao.com/132963.html

【腾讯云】领8888元采购礼包,抢爆款云服务器 每月 9元起,个人开发者加享折上折!
打赏
转载请注明原文链接:主机参考 » 如何安装和配置Hadoop数据库(Hadoop Installation and Configuration)
主机参考仅做资料收集,不对商家任何信息及交易做信用担保,购买前请注意风险,有交易纠纷请自行解决!请查阅:特别声明

评论 抢沙发

评论前必须登录!

 


切记:数据就是生命,数据就是站长的一切,务必!备份!备份!备份!重要事情说三遍!任何商家都有跑路的可能,所以一定要记住备份!本站所发布内容只起综合对比作用,非推荐引导行为


版权声明:主机参考部分内容均来自网络,若无意侵犯到您的权利,请及时联系我们,将在72小时内删除相关内容!请查阅:要求删除或断开链接侵权网络内容的流程


本站由 热网互联 & FunCDN 提供云计算和加速服务,热网互联成立于2009年,致力于成为最受用户爱戴的云服务商

© 2019-2024 主机参考(zhujicankao.com)   联系我们 广告赞助 RSS订阅 友联申请