文档详情

《大数据平台核心技术》课程教学大纲.docx

发布：2025-04-06约4.83千字共9页下载文档

文本预览下载声明

《大数据平台核心技术》课程教学大纲

课程名称：大数据平台核心技术英文名称：HadoopSpark

课程编码：621010970

学分：3

学时：45

开课学期：第二学年春季学期适用专业：信息管理与信息系统专业、电子商务专业、计算机科学与技术等相关专业课程类别：专业学位必修课先修课程：Linux基础、Java面向对象程序设计、操作系统、计算机网络

建议教材：《Hadoop+Spark生态系统操作与实战指南》，第1版，余辉，清华大学出版社，

201709

课程教学目标

以习近平新时代中国特色社会主义思想为指导，贯彻落实立德树人根本任务，将课程思政作为一流课程建设的必要条件。《大数据核心平台与技术》课程在教学过程中，立足本国国情和本校教学实践，充分挖掘本课程的思政元素，系统有机地把思政元素融入线上线下教学全过程，形成技术与思政协同育人效应，培养具有家国情怀、具有全面的数据处理能力的高素质人才。

课程主要目标是让学生熟悉大数据软件生态，掌握以Hadoop和Spark为代表的大数据处理框架。对抽象文件系统HDFS，资源调度系统Yarn，以及计算框架MapReduce有充分的理解和感知。

课程注重培养学生的实验能力，需要学生在云环境或者本地虚拟机中配置好分布式集群，

搭建Hadoop框架，并编写相关的Java程序实现任务需求。

课程教学基本要求

1.教学要求

大数据核心平台与技术这门课程强调锻炼学生的环境配置能力，编程能力，与信息搜集、

分析的能力。在教学过程中需要不断地设计相关的实验训练学生发现问题、解决问题、总结问题地能力，从而掌握足够的大数据相关的技术与知识，可以找到与之相关的就业岗位。2．教学重点

本课程的教学重点内容是HDFS安装与使用、Yarn的安装与使用、ZooKeeper的安装与使用、MapReduce的理解与配置、HBase的理解、Hive的理解、Spark的理解。Java应用程序的编写，Maven的使用。

3．与先后课程的联系

本课程需要学生熟练掌握Linux操作系统、具备较好的Java编程能力，对分布式系统有较好的基础。本课程学习完成之后可以进一步深入学习分布式系统相关课程，也可以编写大型Web/数据库应用程序，与实际工作内容紧密对接。

4．主要教学环节安排

主要教学环节为理论讲解、结果解读以及上机实训。其中以上机实训为主，在操作中讲解理论与方法。

5、教学方法

理论课主要讲解HBase、Yarn、MapReduce、Hive、HDFS的架构与实现逻辑。

实验课主要是实验前的难点进行演示，实验中对学生进行指导，启发学生的手脑并用，培养学生通过实验独立获取知识和操作技能的能力，注重随堂考查，点评学生实验作品和实验报告，不断强化学生的动手能力。

指导学生利用各种途径学习查阅资料，综合利用所学知识和技能，对现实中碰到

的问题进行统计分析；勇于探索和实践，发扬团队精神，培养学生的创新意识。

三、课程教学内容

第一章.大数据理论Hadoop软件生态体系介绍教学内容：介绍大数据技术的发展现状和Hadoop软件生态的组成，架构，发展历史。

教学要求：

向学生介绍大数据技术的发展历史和相关技术，以及在工业界的发展现状。Hadoop基础组件HDFS和计算框架MapReduce介绍，结合运行案例和图示架构进行解说。

教学重点：

HDFS与普通文件系统之间的区别、MapReduce计算逻辑、Hadoop主要组件教学难点：

HDFS和MapReduce第二章.VMware虚拟机软件、CentOS、HDFS教学内容：

VMware虚拟机安装CentOS操作系统、配置主机名和IP地址之间的映射、配置静态IP地址。XShell软件和FileZilla软件介绍与使用，Java环境安装与配置，Hadoop软件包上传到虚拟机。HDFS存储、读写文件的基本逻辑。

教学要求：

解释虚拟机运行Linux操作系统配置操作、教会学生Java环境安装与配置、让学生理解HDFS原理与机制

教学重点：

虚拟机环境配置、HDFS原理

教学难点：

HDFS原理、环境配置

第三章伪分布式Hadoop搭建教学内容：

Hadoop环境变量配置，core-site.xml文件编写，NameNode与DataNode设置，

ResourceManager与NodeManager设定教学要求：掌握伪分布式Hadoop的意义，配置文件表示的含义，物理与逻辑分离的概念教学重点：每个配置文件表示什么意义

教学难点：

XML配置文件的编写

第四章分布式Hadoop集群搭建教学内容：

三台虚拟机环境搭建、SSH免密码登录配置、虚拟机克隆与通信、HDFS服务脚本启动、

Yarn服务脚本启动、Windows端查看集群文件存储。

教学要求：

需要让学生掌握配置的原理

显示全部

相似文档