大数据国赛培训2023 第2页
本赛项涉及的典型工作任务包括大数据平台搭建(容器环境)、离线数据处理、数据挖掘、数据采集与实时计算、数据可视化、综合分析、职业素养,引入行业内较为前沿的数据湖架构作为创新、创意的范围与方向。
大数据国赛培训2023(目录)-知趣

大数据国赛培训2023(目录)

2023年全国职业院校技能大赛赛题 2023年全国职业院校技能大赛赛题第02套 2023年全国职业院校技能大赛评分标准(02) 专题1:2023大数据国赛第2套任务A 1-1.linux相关命令入门 1-2.Hadoop分布式安...
3-1.大数据国赛第2套任务C-子任务一特征工程-知趣

3-1.大数据国赛第2套任务C-子任务一特征工程

任务要求11.1实现思路1.2连接Spark1.3查询用户id为38的用户购买的商品id1.4查询其他用户购买的相同商品数量1.5按格式输出结果任务要求22.1实现思路2.2连接Spark2.3实现方式一2.4实现方式二 任...
2023年全国职业院校技能大赛评分标准(02)-知趣

2023年全国职业院校技能大赛评分标准(02)

赛项名称:          大数据应用开发           英文名称:   Big Data Application Development       赛项组别:              高职组     ...
1-1.linux相关命令入门-知趣

1-1.linux相关命令入门

实验环境实验准备实验内容一、环境变量和脚本相关命令二、文件和目录操作命令三、文本编辑器命令四、网络相关命令五、软件包管理命令 实验环境Ubuntu 18.04 64位GNU bash 版本 4.4.20实验环境S...
3-2.大数据国赛第2套任务C-子任务二推荐系统-知趣

3-2.大数据国赛第2套任务C-子任务二推荐系统

任务要求11.1实现思路1.2连接Spark1.3实现方式一1.4实现方式二  任务要求1根据子任务一的结果,计算出与用户id为6708的用户所购买相同商品种类最多的前10位用户id(只考虑他俩购买过多少种相...
2023年全国职业院校技能大赛赛题第02套-知趣

2023年全国职业院校技能大赛赛题第02套

赛项名称:         大数据应用开发         英文名称:  Big Data Application Development  赛项组别:         高等职业教育组               ...
1-2.Hadoop分布式安装配置-知趣

1-2.Hadoop分布式安装配置

实验环境实验准备实验内容一、下载所需安装包二、安装配置Java运行环境三、master节点安装配置Hadoop四、配置节点hosts解析五、配置及节点ssh免密登录六、分发内容到slave节点七、初始化Hadoop...
4-1.大数据国赛第2套任务D-子任务一实时数据采集-知趣

4-1.大数据国赛第2套任务D-子任务一实时数据采集

任务要求1 :1.1实现思路1.2启动Hadoop、Zookeeper、Kafka1.3创建order主题1.4编写flume配置1.5启动flume1.6编写数据生成脚本1.7运行数据生成脚本1.8.查看结果数据任务要求2 :2.1实现思路2.2启动...
1-8.Hudi安装配置-知趣

1-8.Hudi安装配置

实验环境实验准备实验内容一、下载所需安装包二、安装配置Maven运行环境三、使用maven对Hudi进行构建四、安装配置Spark运行环境五、启动spark-shell运行案例  实验环境Ubuntu 18.04Spark 3.2....