【赛题简单,获奖率高,请认真作答。注意截止时间】
1、完成云计算平台的搭建;
2、编程工具自选(比如用IDEA或Pycharm连接远程服务器中环境进行编程)。
3、科目一:云计算大数据挑战赛——云计算科目,主要考察云计算系统(Linux)搭建与软件(Hadoop、Spark 等)应用能力。
汽车行业市场分析和预测是汽车行业发展的重要环节,而采用大数据技术进行汽车市场的预测和分析,可以大大提高分析准确度和预测精度。汽车市场预测是汽车行业的重要组成部分。准确的市场预测可以帮助企业及时调整价格,改善销售策略,提高企业市场竞争力。而大数据技术可以帮助企业更加全面地获取市场信息和相关数据,从而进行更加准确的市场预测。利用大数据技术可以根据历史销售数据和消费者行为数据等进行趋势预测。
汽车行业是一个竞争激烈的行业,数据分析在该行业中扮演着越来越重要的角色。因此,基于汽车行业大数据分析系统拥有着广阔的应用前景和市场需求。在这个系统中,请利用编程语言的高效性和易用性,结合数据挖掘和机器学习技术,对汽车行业的大量数据进行多维度分析与处理。希望这个系统可以帮助企业分析市场趋势、掌握用户需求、预测未来发展趋势、提高经济效益,为汽车行业的可持续发展提供有力支持。
基于汽车行业大数据分析系统具有显著的实际意义。通过实时、可视化地展示汽车品牌的销售数据,能够帮助汽车制造商、经销商以及市场研究人员快速理解市场动态和趋势,从而更好地制定有针对性的市场策略和销售计划。同时,本系统的高性能和可扩展性也使企业能够降低数据分析和处理成本,提高企业在竞争激烈的市场环境中的核心竞争力。
图1. 美国制造汽车的示意图。
数据分析模块是数据挖掘平台的重点与关键,其中集成了各种数据挖掘算法,比如:聚类、分类、关联规则。用户可针对不同的任务选择调度不同的算法。基于该汽车行业数据可视化系统整体架构,进一步研究提出了汽车数据分析系统,重点包括客户情感分析和客户消费分析两个子系统。
数据集data.csv包含20851辆汽车的相关数据,时间跨度为1910到2023年,每个记录由26个属性组成,具体的含义如下表:
请根据以下赛题材料,完成Hadoop,Spark (不限编程语言,比如Python,Scala等) 环境搭建,完成数据清洗操作和统计需求操作,并将程序代码和结果截图填写在题目后对应的文本框中。
(1)搭建两个虚拟机,并完成Hadoop,Spark,Python的软件安装,请把操作指令截图粘贴在下面的方框中:
|
请把操作成功后的结果,截图粘贴在下面的方框中:
|
(2)配置连个虚拟机联通,并配置内网IP,请把操作指令截图粘贴在下面的方框中:
|
请把操作成功后的结果,截图粘贴在下面的方框中:
|
|
请把操作成功后的结果,截图粘贴在下面的方框中:
|
(4)安装两个mariadb数据库,并配置主从,请把操作指令截图粘贴在下面的方框中:
|
请把操作成功后的结果,截图粘贴在下面的方框中:
|
(5)利用ftp服务,将附件中两份文件上传到两台虚拟机上,请把操作指令截图粘贴在下面的方框中:
|
请把操作成功后的结果,截图粘贴在下面的方框中:
|
(6)利用NFS 服务,将从机的数据共享到主机上,请把操作指令截图粘贴在下面的方框中:
|
请把操作成功后的结果,截图粘贴在下面的方框中:
|
(7)将附件中的两份数据data1.csv和data2.csv合并导入到mariadb数据库中,请把操作指令截图粘贴在下面的方框中:
|
请把操作成功后的结果,截图粘贴在下面的方框中:
|
。
。
。
。
。
。
(竞赛题目完整版可移步考场内查看)
2023年12月31日为截止提交时间,请尽量避免截止时间前卡点提交,通过网络上传作品可能会因为即时网络卡顿或大量作品集中上传等不可控原因而造成上传失败,因此请尽量提前错峰上传提交,如有问题请及时联系赛务组。
2、提交说明
(1) 提交作品:请在报名系统中上传附件;
(2) 提交文件格式为zip压缩包(将需要提交的所有资料放在一个文件夹内压缩),命名规则:参赛院校+团队名+队长手机号【例如:**大学/学院+**队+186*****】。
3、需要提交的资料如下
(1)参赛代码文件:完整的代码,以zip (建议使用360压缩软件压缩) 包的方式提交。
(2)运行结果及效果截图,以本赛题文档形式提供。
(3)总结汇报PPT(需要根据项目完成情况制作PPT,用于答辩环节的展示与讲解):
非常抱歉!本站不支持旧版本IE浏览器~~建议使用IE10/IE11/Chrome/Firefox/Safari等高级浏览器浏览。