文档详情

Apache_Flume安装与配置-大数据文档资料.docx

发布:2025-02-22约2.89千字共10页下载文档
文本预览下载声明

Flume安装与配置过程

一、Flume概述

角色

简介

Master

Master负责配置及通信管理,是集群的控制器

Collector

Collector用于对数据进行聚合(数据收集器),往往会产生一个更大的数据流,然后加载到storage(存储)中

Agent

Agent用于采集数据,Agent是flume中产生数据流的地方,同时Agent会将产生的数据流传输到Collector

简单的来说,就是Agent把采集到的数据定时发送给Collector,Collector接收Agent发送的数据并把数据写到指定的位置(Storage)。

二、安装Flume

2.1.准备安装介质

Flume是Java开发实现的,所以在安装Flume之前要先安装JDK,JDK的安装和配置本

文就不做介绍了。Flume下载地址:/cdh/3/

2.2.安装Flume

我们准备安装1个Master、1个Collector和1个Agent,这三个角色分别安装在3台机器上。我们先选择3台Linux机器且这三台机器网络互通(在一个网段),PC1/PC2/PC3。在PC1上安装Master,PC2上安装Collector,PC3上安装Agent。Master、Collector、Agent的安装文件一样,只是配置信息不一样。Flume的所有安装过程都是用root用户进行操作。

2.2.1.安装Master

A.上传Flume安装文件flume-distribution-0.9.4-bin.tar.gz到/opt/psrv/programes目录下,解压安装包:tar-zvxfflume-distribution-0.9.4-bin.tar.gz到当前目录。

B.到flume-distribution-0.9.4/bin目录下,配置文件flume-env.sh.template重命名为flume-env.sh。如果该目录下的脚本没有执行权限,则执行chmod+x*.sh添加脚本执行权限。修改flume-env.sh文件,在文件末尾加上如下代码:

如果系统没有配置Java环境变量,则还要在flume-env.sh中配置flume运行的Java环境。

C.到flume-distribution-0.9.4/conf目录下,配置文件flume-site.xml.template重命名为flume-site.xml。修改flume-site.xml配置文件:

配置Master,flume.master.servers可以配置多个Master,IP之间使用逗号隔开;

flume-site.xml中的配置可以参考flume-conf.xml;

E.Master启动和停止,使用flume-distribution-0.9.4/bin目录下的flume命令进行Master启停操作。启动Master命令:nohup./flumemaster;停止Master命令:./flumekillmaster。如果不能停止Master请杀掉Master的进程(2个),再删除/tmp/flumemaster.pid文件(该文件记录了Master服务主进程号)。

2.2.2.安装Collector

步骤A/B/C与2.2.1-A/B/C相同

A.略B.略C.略

D.到flume-distribution-0.9.4/conf目录下,修改配置文件flume-site.xml(Master配置在C步骤已经完成)添加Collector配置:

启动Collector命令:nohup./flumenode_nowatch-ncollectorName

2.2.3.安装Agent

步骤A/B/C与2.2.1-A/B/C相同

A.略B.略C.略

D.到flume-distribution-0.9.4/conf目录下,修改配置文件flume-site.xml(Master配置在C步骤已经完成)添加Agent配置:

启动Agent命令:nohup./flumenode_nowatch-nagentName

三、配置Flume

3.1.启动Flume基础服务

Master:nohup./flumemaster

Collector:nohup./flumenode_now

显示全部
相似文档