文档详情

《Hive数据仓库技术与应用案例教程》教案 项目4 Hive数据导入与导出.docx

发布:2025-02-11约1.9万字共15页下载文档
文本预览下载声明

PAGE2

PAGE2

PAGE15

PAGE15

课题

Hive数据导入与导出

课时

4课时(180min)

教学目标

知识目标:

(1)掌握导入数据的语法格式

(2)掌握导出数据的语法格式

技能目标:

(1)能够使用LOAD语句向表中加载数据

(2)能够使用INSERT语句向表中插入数据

(3)能够使用CREATE…AS语句创建表并导入数据

(4)能够使用IMPORT语句导入表

(5)能够使用INSERTOVERWRITE语句从表中导出数据

(6)能够使用EXPORT语句导出表

素养目标:

(1)培养举一反三的能力,学会融会贯通

(2)了解中国的数据库市场,紧跟时代发展

教学重难点

教学重点:数据导入的语法格式、数据导出的语法格式

教学难点:熟练运用导入数据和数据导出的语法格式

教学方法

案例分析法、问答法、讨论法、讲授法

教学用具

电脑、投影仪、多媒体课件、教材

教学过程

主要教学内容及步骤

课前任务

【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务

请大家了解Hive的数据导入与导出。

【学生】完成课前任务

考勤

【教师】使用APP进行签到

【学生】班干部报请假人员及原因

问题导入

【教师】提出以下问题:

(1)什么是数据导入?

(2)在Hive中,可以使用哪些语句进行数据导出?

【学生】思考、举手回答

传授新知

【教师】通过学生的回答引入要讲的知识,介绍数据导入和数据导出的相关知识

4.1数据导入

数据导入是指将数据源中的数据加载到数据仓库各表中的过程。在Hive中,可以使用LOAD、INSERT语句向已有的表中导入数据;也可以使用CREATE…AS语句在创建表时导入数据;还可以使用IMPORT语句导入表。

4.1.1LOAD加载数据

在Hive中,如果数据已经存储在本地文件系统或HDFS中,则可以使用LOAD语句将数据加载到Hive表中。LOAD加载数据的语法格式如下。

LOADDATA[LOCAL]INPATHfilepath[OVERWRITE]

INTOTABLE[database_name.]table_name

[PARTITION(partition_column=partition_col_value,…)];

上述语法格式的详细解释如下。

LOADDATA:加载数据的关键字。

LOCAL:可选项,表示从本地文件系统中加载数据。如果不使用LOCAL,则默认从HDFS中加载数据。

?【教师】随机邀请学生回答以下问题:

在远程模式下操作Hive时,本地文件系统是指什么?

?【学生】聆听、思考、回答

?【教师】总结学生的回答

在远程模式下操作Hive时,本地文件系统是指启动HiveServer2服务的服务端主机,而不是启动Beeline工具的客户端主机。

INPATHfilepath:用于指定要加载的数据的路径。其中,filepath可以是具体的文件路径,也可以是一个文件夹的路径。如果filepath指定的是一个文件夹的路径,则加载该文件夹中的所有文件。

OVERWRITE:可选项,表示加载数据时,会覆盖表或分区中已经存在的数据。如果不使用OVERWRITE,则默认使用追加的方式加载数据。

INTOTABLE[database_name.]table_name:用于指定要加载数据的表名。

PARTITION(partition_column=partition_col_value,…):可选项,用于将数据加载到分区表的指定分区。其中,partition_column表示分区字段;partition_col_value表示分区字段的值。

?【教师】利用多媒体展示“‘student_data’文件中的数据”图片(详见教材),并进行讲解

【例4-1】将Worker1主机中“/usr/local/hive/hive_data/student_data”文件中的数据(见图所示)加载到数据库hive_database的外部表external_table中。

(1)切换至数据库hive_database。

(2)执行如下语句,向外部表external_table中加载数据。

…/LOADDATALOCALINPATH/usr/local/hive/hive_data/student_data

OVERWRITEINTOTABLEexternal_table;

……(详见教材)

?【教师】随机邀请学生回答以下问题:

除了使用LOAD语句加载数据到外部表外,还可以使用什么方法加载数据?

?【学生】聆听、思考、回答

?【教师】总结学生的回答

实现例4-1之前,需要在Worker1主机的“/us

显示全部
相似文档