linux下hadoop配置过程

站长资源 2024/11/23 佚名

2 0 1

1，安装linux
本文假设从裸机开始，所以要先装linux。本人是ubuntu对支持者，所以装的是ubuntu，废话没有，很容易就装好了。在安装过程中，要注意所有节点对主机名应该有规律，比如node0, node1, node2 ...
2，准备
下面对软件对安装，全都使用了apt，这个软件需要互联网链接，如果你对网速极慢，或者根本链接不到外部网络（这个现象在教育网内很常见），可以从一个能上网对ubuntu电脑上的/var/cache/apt/archives文件夹里deb文件出来安装（什么？你问我这个文件夹里为什么没有想要的包，这个文件夹是apt对缓存文件夹，想要里面有你想要对东西，不用我提醒你应该怎么办了吧）。
ubuntu默认已经装好了openssh-client，需要安装openssh-server。命令如下：

复制代码代码如下:
sudo apt-get install openssh-server

然后是jdk：

复制代码代码如下:
sudo apt-get install default-jdk

3，配置网络
如果你的节点们可以通过dhcp服务器获得ip，我个人建议，这样做，原因是简单，不用怎么配置就搞定了。或者可以使用静态ip，作为一个牛b的linux大牛，应该可以通过一行命令来设置静态ip，但是我不会。我通常都是在gnome提供的网络管理器来设ip对。如果你用对linux里没有图形界面，那样请google。
设置好了ip地址之后，记忆在/etc/hosts文件中给每个节点起个名字，最好就是各自对主机名，这样有利于下面对配置和管理。
hadoop要求各节点间可以不需要输入密码就能用ssh互相登录。我使用了比官方方法简单一点方法来设置，但是据说安全性有点儿问题。下面是方法：
在某个节点上执行如下命令：

复制代码代码如下:
rm -rf ~/.ssh

复制代码代码如下:
ssh-keygen -t rsa

这个命令之后需要多按几次回车，知道再次出现命令提示符。当然，这个做法也不是很安全，里面有个输入key的地方，官方的建议是，输入一首歌的歌词，呵呵，这个建议很搞笑。当然在我的步骤中，这个key就是空值了。

复制代码代码如下:
cat ~/.ssh/id_rsa.pub authorized_keys

然后把整个.ssh文件夹考到所有对节点上，具体方法可以使用scp命令，具体命令由于和具体环境有关，下面不写。

这样网络就设置对差不多了。
4，安装hadoop
解压，这个比较简单，命令不写。解压对位置最好每个hadoop都一样，不一样有什么后果，我没试过。
之后要进行一些配置，首先进入解压后目录对conf文件夹，要修改对配置文件包括hadoop-env.sh hadoop-site.xml masters slaves
hadoop-env.sh中要uncomment下面一行：

复制代码代码如下:
export JAVA_HOME=/home/hadoop/jdk1.6.0_16/

当然具体的值，也要根据具体情况进行更改。
接下来是hadoop-site.xml，下面是我的文件内容。

复制代码代码如下:
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://node0:6000</value>
</property>
<property>
<name>mapred.job.tracker</name>
<value>node0:6001</value>
</property>
</configuratiron>

这个例子很直白，不解释。

masters里面是jobtracker和namenode所在节点的主机名或者ip地址，我的masters文件里只有一行，当然如果你想要设置多个节点作为主节点，也可以。
slaves里面是所有tasktracker和datanode对主机名或ip地址。
5，运行
先进入hadoop安装文件夹。然后依次运行如下命令：

复制代码代码如下:
bin/hadoop namenode -format
bin/start-all.sh

不出意外的话，现在hadoop就可以使用了。

Hadoop是一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有着高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上。而且它提供高传输率（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。HDFS放宽了（relax）POSIX的要求（requirements）这样可以流的形式访问（streaming access）文件系统中的数据。

Hadoop

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

评论“linux下hadoop配置过程”

暂无评论...

www.wwsws.com 伏龙阁资源网

39,976影音资源

44,792技术资源

21,817软件资源

651,128站长资源

最新文章

手把手教你在VirtualBox中与主机共享文件夹

2024/11/23

如何打造自己的pe呢?微软官方WinPE的制作流

2024/11/23

几何画板怎么添加辅助线?

2024/11/23

UG草图怎么画多边形图形? UG绘制整八边形的

2024/11/23

深度操作系统15.4 Beta主要更新哪些内容呢?

2024/11/23

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2024/11/23

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

linux下hadoop配置过程

ubuntu 无线拨号上网方法

Fedora 13 Final DVD ISO系统下载

评论“linux下hadoop配置过程”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

linux下hadoop配置过程

ubuntu 无线拨号上网方法

Fedora 13 Final DVD ISO系统下载

评论“linux下hadoop配置过程”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存