2023年全国职业院校技能大赛评分标准(02)

赛项名称:          大数据应用开发           

英文名称:   Big Data Application Development       

赛项组别:              高职组             

赛项编号:              GZ033              

 

任务

子任务

主要知识与技能点

分值

任务A:大数据平台搭建(容器环境)

子任务一:Hadoop完全分布式安装配置

JDK的解压安装

1

JDK的环境变量配置

1

Host配置及三个节点的分发

1

Hadoop解压安装及环境初始化

2

Hadoop集群启动并查看

2

子任务二:Flume安装配置

Flume的解压安装、配置文件配置、运行测试等

1

环境变量配置

1

Hadoop日志传输

2

子任务三:Flink on Yarn安装配置

Flink的解压安装

1

环境变量配置

1

运行测试

2

小计

15

任务B:离线数据处理

子任务一:数据抽取

从MySQL中将user_info表的离线数据抽取到Hudi的ods_ds_hudi对应表中

1

从MySQL中将sku_info表的离线数据抽取到Hudi的ods_ds_hudi对应表中

1

从MySQL中将base_province表的离线数据抽取到Hudi的ods_ds_hudi对应表中

1

从MySQL中将base_region表的离线数据抽取到Hudi的ods_ds_hudi对应表中

1

从MySQL中将order_info表的离线数据抽取到Hudi的ods_ds_hudi对应表中

1

从MySQL中将order_detail表的离线数据抽取到Hudi的ods_ds_hudi对应表中

1

子任务二:数据清洗

从Hudi的ods_ds_hudi到dwd_ds_hudi的进行user_info表的数据合并清洗

1

从Hudi的ods_ds_hudi到dwd_ds_hudi的进行sku_info表的数据合并清洗

1

从Hudi的ods_ds_hudi到dwd_ds_hudi的进行base_province表的数据合并清洗

1

从Hudi的ods_ds_hudi到dwd_ds_hudi的进行base_region表的数据合并清洗

1

从Hudi的ods_ds_hudi到dwd_ds_hudi的进行order_info表的数据抽取

1

从Hudi的ods_ds_hudi到dwd_ds_hudi的进行order_detail表的数据抽取

1

子任务三:指标计算

在dwd层基于Azkaban进行工作流任务调度

1

统计每人每天下单的数量和下单的总金额存入Hudi的dws_ds_hudi层

1

统计每个省每月下单的数量和下单的总金额存入Hudi的dws_ds_hudi层

1

计算出每个省份2020年4月的平均订单金额和该省所在地区平均订单金额相比较结果存入ClickHouse

1

按照id进行升序累加订单的金额,取出累加值与目标值2023060600相差最小的前10条的订单id,按照差值从小到大进行排序,将计算结果存入MySQL数据库

2

按照id进行升序排序,取id小于等于20000的订单,求出连续订单中平均金额数最大前1000000的连续订单序列,将计算结果存入MySQL数据库

7

小计

25

任务C:数据挖掘

子任务一:特征工程

对推荐系统的数据集进行数据预处理

2

利用特征工程进行特征提取

3

子任务二:推荐系统

基于用户的推荐系统设计开发操作

5

小计

10

任务D:数据采集与实时计算

子任务一:实时数据采集

基于Flume的实时数据采集,将数据注入Kafka

4

将数据同时备份到HDFS

4

子任务二:使用Flink处理Kafka中的数据

实时统计商城实时订单数量存入Redis

3

实时统计每分钟申请退回的订单数量存入Redis

4

实时统计每分钟内状态为取消订单占所有订单的占比存入Redis

5

小计

20

任务E:数据可视化

子任务一:用柱状图展示各省份消费额的中位数

正确使用Vue.js框架,结合ECharts绘制柱状图

3

子任务二:用玫瑰图展示各地区消费能力

正确使用Vue.js框架,结合ECharts绘制玫瑰图

3

子任务三:用折线图展示每年上架商品数量变化

正确使用Vue.js框架,结合ECharts绘制折线图

2

子任务四:用条形图展示消费总额最高的省份

正确使用Vue.js框架,结合ECharts绘制条形图

3

子任务五:用折柱混合图展示省份平均消费额和地区平均消费额

正确使用Vue.js框架,结合ECharts绘制折柱混合图

4

小计

15

任务F:综合分析

子任务一:MySQL数据库事务

正确分析MySQL数据库事务及其隔离级别

4

子任务二:Flink的反压机制

正确分析Flink的反压机制

3

子任务三:Spark执行计划

正确分析Spark的执行计划

3

小计

10

任务G:职业素养

考察职业素养

竞赛团队分工明确合理、操作规范、文明竞赛

5

小计

5

总分

100

© 版权声明
THE END
喜欢就支持一下吧
点赞224赞赏 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

夸夸
夸夸
还有吗!没看够!
取消
昵称表情代码图片

    暂无评论内容