【决赛赛题公布——大数据科目】

注意:云计算科目赛题已公布,同学想要参赛可点击链接进入考场报名答题:https://edu.saikr.com/my/course/2103

【赛题简单,获奖率高,请认真作答。注意截止时间】

 

2023第六届“传智杯”全国IT技能大赛-云计算大数据挑战赛

 

大数据科目 决赛题

奥运会奖牌的大数据分析与分类

一、赛前准备

1、完成大数据平台搭建;

2、编程工具自选(比如用IDEA或Pycharm连接远程服务器中环境进行编程)。

3、科目二:云计算大数据挑战赛——大数据科目,主要考察数据统计、绘图、分析、建模等能力。

二、赛题材料

1、赛题背景

奥林匹克运动会是一项国际性的多项目赛事,每四年举行一次,来自世界各地的数千名运动员参加各种体育比赛。奥运会是全球最重要、最负盛名的体育赛事之一,促进了各国之间的团结、友谊和公平竞争。

现代奥运会的灵感来源于公元前8世纪至公元4世纪在希腊奥林匹亚举行的古代奥运会。法国教育家和历史学家皮埃尔·德·顾拜旦于1896年恢复了现代奥运会。夏季和冬季奥运会:奥林匹克运动会分为夏季奥林匹克运动会和冬季奥林匹克运动会。夏季奥运会通常包括田径、游泳、体操和团队运动等项目,而冬季奥运会则以滑雪、冰球、单板滑雪和花样滑冰等项目为特色。

图1. 奥林匹克运动会的标志性标志。

每届奥运会都由世界各地的一个选定城市主办。主办城市是通过国际奥委会组织的竞争性申办程序选出的。奥林匹克运动会的标志性标志是五个环环相扣的圆环,代表五大洲(非洲、美洲、亚洲、欧洲和大洋洲)。之所以选择圆环的颜色(蓝色、黄色、黑色、绿色和红色),是因为每个国家的国旗都至少包含其中一种颜色。奥林匹克格言是“Citius,Altius,Fortius”,在拉丁语中是“更快、更高、更强”的意思。它代表了运动员追求卓越和进步。奥运会是体育、文化和国际合作的庆典,将来自不同背景的人们聚集在一起,分享竞争精神和体育精神。

2、据描述

数据集data.csv包含70000个运动员的获奖记录,时间跨度为1896到2016年,每个记录由15个属性组成,具体的含义如下表:

字段名称

类型

含义

举例

ID

string

编号

70000

Name

string

姓名

Chen Aisen

Sex

string

性别

M

Age

integer

年龄

20

Height

integer

身高

168

Weight

integer

体重

60

Country

string

国家

China

NOC

string

缩写

CHN

Games

string

奥运会

2016 Summer

Year

integer

年份

2016

Season

string

季节

Summer

City

string

城市

Beijing

Sport

string

运动

Football

Event

string

项目

Archery Men's Team

Medal

string

奖牌

Gold

 

 

三、赛题要求

请根据以下赛题材料,完成数据清洗操作和统计需求操作,并将程序代码和文字分析填写在题目后对应的文本框中。

1、数据预处理(30分)

(1)读取附件data.csv数据,得到DataFrame数据帧格式的对象,并打印查看数据集。请在下面方框中填写程序代码:

 

 

 

 

要求程序能够打印出如下结果。

文字分析:

 

 

 

 

 

 

(2)请打印出数据集的前5行,并且包含标题行。

 

 

 

 

 

 

 

 

要求程序能够打印出如下结果。

文字分析:

 

 

 

 

 

 

 

 

 

 

 

(3)请从数据集中随机抽取5个运动员的所有数据,打印数据并且包含标题行。

 

 

 

 

 

 

 

 

 

 

要求程序能够打印出类似如下结果。(随机抽样的结果不唯一)

文字分析:

 

 

 

 

 

 

 

 

 

(4)请统计并打印出数据集中15个属性的数据类型和具体数量。

 

 

 

 

 

 

要求程序能够打印出如下结果。

文字分析:

 

 

 

 

 

 

(5)由于数据集中存在缺失数据,请查看并打印出15个属性分别缺失多少数据。

 

 

 

 

 

 

 

 

要求程序能够打印出如下结果。

文字分析:

 

 

 

 

 

 

 

 

 

(6)请查看并打印出15个属性分别有多少不重复的数据。

 

 

 

 

 

 

要求程序能够打印出如下结果。

 

文字分析:

 

 

 

 

 

 

 

 

文字分析:

完成数据预处理,接下来将使用编写应用程序,对清洗后的数据集进行统计分析。

 

2、数据分析(40分)

(1)请绘制数据集中运动员性别的扇形图。

 

 

 

 

 

 

 

要求程序能够画出如下结果。

(竞赛题目完整版可移步考场内查看)

四、提交要求

1、提交时间

 2023年12月31日为截止提交时间,请尽量避免截止时间前卡点提交,通过网络上传作品可能会因为即时网络卡顿或大量作品集中上传等不可控原因而造成上传失败,因此请尽量提前错峰上传提交,如有问题请及时联系赛务组。

2、提交说明

(1) 提交作品:请在报名系统中上传附件;

(2) 提交文件格式为zip压缩包(将需要提交的所有资料放在一个文件夹内压缩),命名规则:参赛院校+团队名+队长手机号【例如:**大学/学院+**队+186*****】。

3、需要提交的资料如下

(1)参赛代码文件:完整的代码,以zip (建议使用360压缩软件压缩) 包的方式提交。

(2)运行结果及效果截图,以本赛题文档形式提供。

(3)总结汇报PPT(需要根据项目完成情况制作PPT,用于答辩环节的展示与讲解):

  1. 团队介绍+人员分工介绍;
  2. 具体实施过程;
  3. 针对问题的思考方向;
  4. 结果展示;
  5. 亮点总结。
赛氪APP全新升级

下载赛氪APP

参加有趣活动,获得赛程提醒

分享大学生活,获得前辈指点

意见反馈

产品建议、功能吐槽、使用问题…

欢迎提出关于赛氪网的问题和建议 :)

微信公众号
关注赛氪订阅号
微信服务号
关注赛氪服务号
温馨提示

非常抱歉!本站不支持旧版本IE浏览器~~建议使用IE10/IE11/Chrome/Firefox/Safari等高级浏览器浏览。

温馨提示
温馨提示
帮助与反馈

热门问题