博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
CDH部署StreamSets
阅读量:4621 次
发布时间:2019-06-09

本文共 1662 字,大约阅读时间需要 5 分钟。

StreamSets是一个大数据采集工具,数据源支持包括结构化和半/非结构化,目标源支持HDFS,HBase,Hive,Kudu,Cloudera Search, ElasticSearch等。它包括一个拖拽式的可视化数据流程设计界面,定时任务调度等功能。举例,它可以将数据源从Kafka+Spark Streaming连接到你的Hadoop集群,而不需要写一行代码。

StreamSets并没有集成在cdh中,因此需要我们自己去官方下载软件包

下载地址: 

下载下来的文件如下,软件包有4.6G左右,需要点耐心

配置本地yum源

新建一个目录,把STREAMSETS_DATACOLLECTOR-3.10.0-el7.parcel, manifest.json放目录里

mkdir /var/www/html/streamsetsmv STREAMSETS_DATACOLLECTOR-3.10.0-el7.parcel /var/www/html/streamsetsmv manifest.json /var/www/html/streamsetscd /var/www/html/streamsetscreaterepo .

配置yum

[root@cm ~]# cat /etc/yum.repos.d/ss.repo [ssrepo]name = ss_repobaseurl = http://10.1.1.120/streamsetsenable = truegpgcheck = false
yum源

把ss.repo拷贝到集群其他节点,然后执行 yum. repolist,可以看到配置的yum 源

 

下载分发激活Parcel包

主机---Parcel---配置

点击下载--分配--激活,因为包比较大,时间可能会稍微有点长

#######小坑##########

就是分配过程中cloudera server那台机一直卡在那里,其他节点没问题,进行了回滚操作

#curl -u user:password -X POST http://cm.bigdata-heboan.com:7180/api/v18/clusters/cdh-heboan/parcels/products/{product}/versions/{version}/commands/deactivatecurl -u admin:admin -X POST http://cm.bigdata-heboan.com:7180/api/v18/clusters/cdh-heboan/parcels/products/STREAMSETS_DATACOLLECTOR/versions/3.10.0/commands/deactivate
回滚

后面发现,是clouder server这台机器的/etc/cloudera-scm-agent/config.ini 中的server_host是localhost,后面改为如下问题解决

...# Hostname of the CM server.server_host=cm.bigdata-heboan.com
config.ini

中途遇到一次提示STREAMSETS_DATACOLLECTOR-3.10.0-el7.parcel哈希验证失败,解决办法是去到cm机器上的/opt/cloudera/parcel-repo目录

执行 sha1sum /opt/cloudera/parcel-repo, 把得出的哈希值替换STREAMSETS_DATACOLLECTOR-3.10.0-el7.parcel.sha里面的内容

 

添加服务

选择StreamSets

分配角色

数据目录

 

启动成功后

 

点击Data Collector Web UI

默认账号: admin/admin

 

转载于:https://www.cnblogs.com/sellsa/p/11300033.html

你可能感兴趣的文章
重写Object类中的toString方法
查看>>
Linux curl 模拟form表单提交信息和文件
查看>>
[图论]在农场万圣节Trick or Treat on the Farm
查看>>
[BZOJ4824][Cqoi2017]老C的键盘 树形dp+组合数
查看>>
配置的热更新
查看>>
MySQL事务的开启与提交,autocommit自动提交功能
查看>>
PriorityQueue
查看>>
CODEVS1403 新三国争霸
查看>>
iOS 环信离线推送
查看>>
WPFTookit Chart 高级进阶
查看>>
thulac安装问题
查看>>
你必须知道的.NET Day1
查看>>
vim实现实时自动保存
查看>>
mysql CREATE USER
查看>>
H3C 快速以太网和千兆以太网
查看>>
oracle触发器——ddl触发器
查看>>
oracle函数 SOUNDEX(c1)
查看>>
spring-data-elasticsearch使用出现的一些小问题
查看>>
ios面试题整理
查看>>
可好的博客
查看>>