大数据培训2023共25篇
2-3.大数据国赛第2套任务B-子任务三指标计算-知趣

2-3.大数据国赛第2套任务B-子任务三指标计算

任务要求11.1编写job2脚本1.2编写job3脚本1.3编写job4脚本1.4编写azkaban脚本1.5打包上传azkaban脚本1.6执行azkaban脚本任务要求22.1实现流程概要2.2创建DWS层表2.3统计每个用户每天的消费金额2...
1-1.linux相关命令入门-知趣

1-1.linux相关命令入门

实验环境实验准备实验内容一、环境变量和脚本相关命令二、文件和目录操作命令三、文本编辑器命令四、网络相关命令五、软件包管理命令 实验环境Ubuntu 18.04 64位GNU bash 版本 4.4.20实验环境S...
4-1.大数据国赛第2套任务D-子任务一实时数据采集-知趣

4-1.大数据国赛第2套任务D-子任务一实时数据采集

任务要求1 :1.1实现思路1.2启动Hadoop、Zookeeper、Kafka1.3创建order主题1.4编写flume配置1.5启动flume1.6编写数据生成脚本1.7运行数据生成脚本1.8.查看结果数据任务要求2 :2.1实现思路2.2启动...
2-1.大数据国赛第2套任务B-子任务一数据抽取-知趣

2-1.大数据国赛第2套任务B-子任务一数据抽取

MySQL表结构分析表结构分析user. _info表sku_ _info表base. _province表base_ region表order_ info表order_ detail表任务要求11.1实现流程概要1.2任务分解任务要求22.1创建ODS层表2.2创建MySQL...
大数据国赛培训2023(目录)-知趣

大数据国赛培训2023(目录)

2023年全国职业院校技能大赛赛题 2023年全国职业院校技能大赛赛题第02套 2023年全国职业院校技能大赛评分标准(02) 专题1:2023大数据国赛第2套任务A 1-1.linux相关命令入门 1-2.Hadoop分布式安...
4-3.大数据国赛第2套任务D-子任务二:Flink处理Kafka中的数据-知趣

4-3.大数据国赛第2套任务D-子任务二:Flink处理Kafka中的数据

任务要求1 :1.1实现思路1.2获取Flink流运行环境1.3定义Kafka源1.4创建流1.5定义订单数量统计侧边流标签1.6设置水位线1.7设置事件时间1.8自定义处理函数1.9统计订单数量1.10创建redis连接池1.11...
5-3.大数据国赛数据可视化-用折线图展示每年上架商品数量的变化-知趣

5-3.大数据国赛数据可视化-用折线图展示每年上架商品数量的变化

实验环境实验准备实验内容一、下载安装vue cli二、创建vue.js项目三、编辑App.vue添加MyCharts组件四、写出MyCharts数据可视化组件模板代码五、在模板里添加处理数据的逻辑代码  实验环境Ubun...
1-5.Hive安装配置-知趣

1-5.Hive安装配置

实验环境实验准备实验内容一、初始化hadoop集群二、安装配置MySQL 5.7元数据库三、下载所需安装包四、安装配置Hive运行环境  实验环境Ubuntu 18.04Oracle JDK 1.8Hadoop 3.2.4Hive 3.1.3实验...
2-2.大数据国赛第2套任务B-子任务二数据清洗-知趣

2-2.大数据国赛第2套任务B-子任务二数据清洗

任务要求11.1实现流程概要1.2任务分解任务要求22.1创建表2.2按id更新数据2.3按id插入数据2.4查询数据任务要求33.1创建表3.2按Id更新数据3.3按ld插入数据3.4查询数据任务要求44.1创建表4.2按Id更...
1-2.Hadoop分布式安装配置-知趣

1-2.Hadoop分布式安装配置

实验环境实验准备实验内容一、下载所需安装包二、安装配置Java运行环境三、master节点安装配置Hadoop四、配置节点hosts解析五、配置及节点ssh免密登录六、分发内容到slave节点七、初始化Hadoop...
4-2.Flink快速入门-知趣

4-2.Flink快速入门

api流程图批处理wordcount流处理wordcount集合sourceKafka SourceKafka SinkRedis Sink  api流程图批处理wordcount在src/main/scala/org/example目录下新建WordCount.scala文件,编写批处理代...
1-6.HBase分布式安装配置-知趣

1-6.HBase分布式安装配置

实验环境实验准备实验内容一、初始化hadoop集群二、安装zookeeper集群三、下载hbase所需安装包四、安装配置HBase运行环境五、分发内容到slave节点六、启动Hbase进行安装检查  实验环境Ubuntu ...
5-2.大数据国赛数据可视化-用玫瑰图展示各地区消费能力-知趣

5-2.大数据国赛数据可视化-用玫瑰图展示各地区消费能力

实验环境实验准备实验内容一、下载安装vue cli二、创建vue.js项目三、编辑App.vue添加MyCharts组件四、写出MyCharts数据可视化组件模板代码五、在模板里添加处理数据的逻辑代码  实验环境Ubun...
3-1.大数据国赛第2套任务C-子任务一特征工程-知趣

3-1.大数据国赛第2套任务C-子任务一特征工程

任务要求11.1实现思路1.2连接Spark1.3查询用户id为38的用户购买的商品id1.4查询其他用户购买的相同商品数量1.5按格式输出结果任务要求22.1实现思路2.2连接Spark2.3实现方式一2.4实现方式二 任...
5-5.大数据国赛数据可视化-折柱混合图展示省份和地区平均消费额-知趣

5-5.大数据国赛数据可视化-折柱混合图展示省份和地区平均消费额

实验环境实验准备实验内容一、下载安装vue cli二、创建vue.js项目三、编辑App.vue添加MyCharts组件四、写出MyCharts数据可视化组件模板代码五、在模板里添加处理数据的逻辑代码  实验环境Ubun...
1-3.Spark on Yarn安装配置-知趣

1-3.Spark on Yarn安装配置

实验环境实验准备实验内容一、初始化hadoop集群二、下载所需安装包三、配置Spark环境变量四、完成on yarn相关配置五、采用 client 模式提交任务  实验环境Ubuntu 18.04Oracle JDK 1.8Hadoop 3...