大数据国赛培训2023 第2页
本赛项涉及的典型工作任务包括大数据平台搭建(容器环境)、离线数据处理、数据挖掘、数据采集与实时计算、数据可视化、综合分析、职业素养,引入行业内较为前沿的数据湖架构作为创新、创意的范围与方向。
1-3.Spark on Yarn安装配置-知趣

1-3.Spark on Yarn安装配置

实验环境实验准备实验内容一、初始化hadoop集群二、下载所需安装包三、配置Spark环境变量四、完成on yarn相关配置五、采用 client 模式提交任务  实验环境Ubuntu 18.04Oracle JDK 1.8Hadoop 3...
4-2.Flink快速入门-知趣

4-2.Flink快速入门

api流程图批处理wordcount流处理wordcount集合sourceKafka SourceKafka SinkRedis Sink  api流程图批处理wordcount在src/main/scala/org/example目录下新建WordCount.scala文件,编写批处理代...
1-9.ZooKeeper分布式安装配置-知趣

1-9.ZooKeeper分布式安装配置

实验环境实验准备实验内容一、下载所需安装包二、安装配置ZooKeeper运行环境三、 分发内容到slave节点 实验环境Ubuntu 18.04Oracle JDK 1.8Hadoop 3.2.4ZooKeeper 3.6.3实验准备点击开始实验按...
1-4.Flume安装配置-知趣

1-4.Flume安装配置

实验环境实验准备实验内容一、初始化hadoop集群二、下载所需安装包三、安装配置Flume运行环境四、启动Flume传输Hadoop日志(namenode或datanode日志)  实验环境Ubuntu 18.04Oracle JDK 1.8Ha...
4-3.大数据国赛第2套任务D-子任务二:Flink处理Kafka中的数据-知趣

4-3.大数据国赛第2套任务D-子任务二:Flink处理Kafka中的数据

任务要求1 :1.1实现思路1.2获取Flink流运行环境1.3定义Kafka源1.4创建流1.5定义订单数量统计侧边流标签1.6设置水位线1.7设置事件时间1.8自定义处理函数1.9统计订单数量1.10创建redis连接池1.11...
1-5.Hive安装配置-知趣

1-5.Hive安装配置

实验环境实验准备实验内容一、初始化hadoop集群二、安装配置MySQL 5.7元数据库三、下载所需安装包四、安装配置Hive运行环境  实验环境Ubuntu 18.04Oracle JDK 1.8Hadoop 3.2.4Hive 3.1.3实验...
5-1.大数据国赛数据可视化-用柱状图展示各省份消费额的中位数-知趣

5-1.大数据国赛数据可视化-用柱状图展示各省份消费额的中位数

实验环境实验准备实验内容一、下载安装vue cli二、创建vue.js项目三、编辑App.vue添加MyCharts组件四、写出MyCharts数据可视化组件模板代码五、在模板里添加处理数据的逻辑代码  实验环境Ubun...
1-6.HBase分布式安装配置-知趣

1-6.HBase分布式安装配置

实验环境实验准备实验内容一、初始化hadoop集群二、安装zookeeper集群三、下载hbase所需安装包四、安装配置HBase运行环境五、分发内容到slave节点六、启动Hbase进行安装检查  实验环境Ubuntu ...
5-2.大数据国赛数据可视化-用玫瑰图展示各地区消费能力-知趣

5-2.大数据国赛数据可视化-用玫瑰图展示各地区消费能力

实验环境实验准备实验内容一、下载安装vue cli二、创建vue.js项目三、编辑App.vue添加MyCharts组件四、写出MyCharts数据可视化组件模板代码五、在模板里添加处理数据的逻辑代码  实验环境Ubun...