欢迎您访问365答案网,请分享给你的朋友!
生活常识 学习资料

基于Ubuntu玩转HudiDockerDemo(2)——测试数据写入Kafka

时间:2023-06-15

基于 Ubuntu 玩转 Hudi Docker Demo 系列文章:
《基于 Ubuntu 玩转 Hudi Docker Demo (1)—— 集群安装》
《基于 Ubuntu 玩转 Hudi Docker Demo (2)—— 测试数据写入 Kafka》
《基于 Ubuntu 玩转 Hudi Docker Demo (3)—— Spark写入和查询》
《基于 Ubuntu 玩转 Hudi Docker Demo (4)—— Hive 查询 Hudi 表》

简介

上一篇文章《基于 Ubuntu 玩转 Hudi Docker Demo (1)—— 集群安装》 介绍了如何在 Ubuntu 安装 Docker, 编译 Hudi 源码 以及 使用 docker-compose 部署测试集群。

本文主要介绍如何把测试数据写入到 Kafka 集群。

工具

本文使用 kafkacat 来生产、消费、查看元数据。
在 Ubuntu 在通过以下命令安装:

sudo apt updatesudo apt get install kafkacat

kafkacat 详细介绍可见 《Kafka 命令行工具 kcat/kafkacat》

检查/etc/hosts 文件

确保 /etc/hosts 文件有以下配置:

127.0.0.1 adhoc-1127.0.0.1 adhoc-2127.0.0.1 namenode127.0.0.1 datanode1127.0.0.1 hiveserver127.0.0.1 hivemetastore127.0.0.1 kafkabroker127.0.0.1 sparkmaster127.0.0.1 zookeeper

测试数据

在 hudi 源码目录下有两个测试数据文件:

测试数据写入 Kafka 1、查看当前 kafka 集群信息

kafkacat -b kafkabroker -L -J | jq .

2、生产数据

cat docker/demo/data/batch_1.json | kafkacat -b kafkabroker -t stock_ticks -P

3、查看当前 kafka 集群信息

kafkacat -b kafkabroker -L -J | jq .

4、消费数据

消费10条数据

kafkacat -C -b kafkabroker -t stock_ticks -p 0 -o -10

至此,测试数据已写入到 Kafka

下一篇:《基于 Ubuntu 玩转 Hudi Docker Demo (3)—— Spark写入和查询》

Copyright © 2016-2020 www.365daan.com All Rights Reserved. 365答案网 版权所有 备案号:

部分内容来自互联网,版权归原作者所有,如有冒犯请联系我们,我们将在三个工作时内妥善处理。