C++课件:第13章 文件.ppt
文本预览下载声明
C++第13章 文件 文件的引入 问题:通过前面的学习,我们知道,数据的处理包括数据的输入、加工处理、结果的输出。纵观前面的c程序,对数据的输入输出有如下特点: 1)待处理的数据要么由程序员编程时在程序中设定(该程序只能处理固定的数据),要么在程序运行时由用户输入(而且每次运行时都要重新输入); 2)程序处理的结果均输出到显示屏,无法实现永久性的保存以便日后使用。 这显然不能满足实际应用的需求: 比如,在学生成绩的处理系统中,任何一个成绩只需输入一次,以后在任何时候都能对其进行处理(求平均、查找、排名次等),而且处理的结果(如排名次)可以保存起来,供以后使用,无需每次都要先执行排名次的操作,然后才能查找某人的名次。 解决以上问题的方法是使用文件,将有用的数据永久性的保存在外存上。 文件:一般指存储在外部介质上的数据的集合。作用:操作系统是以文件为单位对数据进行管理的,每个文件的标识是文件名。当要读取某个文件中的数据时,必须先指出文件名,按文件名找到其中的数据;当需要将一批数据永久存放在外存上时,也必须先确定文件名,然后才能向它输出数据。 本章主要介绍C文件的特点以及文件的使用(基本操作) 13.1C文件概述 C语言将文件看作是“数据流”,即文件是由一串连续的、无间隔的字符数据构成,这种结构称为“流式文件结构”。 特点:流式文件结构在处理时不需考虑文件中数据的性质、类型和存放格式,访问时只是以字节为单位对数据进行存取,没有记录的概念,而将对数据结构的分析、处理等工作都交给后续程序去完成。因此,该文件结构更具灵活性,对存储空间的利用率高,同时对编程者要求也高。 C文件的分类(按存储格式): 文本文件:按数据的ASCII码方式进行存储形成的文件。 二进制文件:按数据在内存中的存储形式原样输出到外存上形成的文件。 二者的区别主要体现在对数值型数据的处理上,例如,要存储一个整数255,按二进制文件的格式存储,在文件中存放的是255的二进制形战役各自结的存储空间;而以文本文件的格式存储,在文件中保存的是‘2’、‘5’、‘5’三个字符的ASCII码,占用3个字节,见图: 文本文件 二进制文件 特别提示:按以上两种方式中的某一种方式存储的文件,使用时必须以原来的方式从外存上读出,才能保证数据的正确性。 文件缓冲区 引入: 由于CPU与内存(即主机)的工作速度非常快,而对外存(磁盘、光盘等)的存取速度很慢。当访问外存时,主机必须等待慢速的外存操作完成后才能继续工作,严重影响了CPU效率的发挥。解决二者速度不匹配的方法是采用“缓冲区”技术。如图:13.2 缓冲区:在内存的RAM中分配的一块存储空间。 其作用是:当需要向外存文件中写入数据时,并不是每次都直接写入外存,而是先写入到缓冲区,只有当缓冲区的数据存满或文件关闭时,才自动将缓冲区的数据一次性写入外存。读数时,也是一次将一个数据块读入缓冲区中,以后读取数据时,先到缓冲区中找,若找到,则直接读出,否则,再到外存中寻找,找到后将其所在的数据块一次读入缓冲区。 目的:有效的减少了访问外存的次数。 C语言对文件缓冲区的控制方法有两种:缓冲文件系统和非缓冲文件系统 二者的区别在于“缓冲文件系统”的缓冲区是由操作系统在每个文件被打开时自动建立并管理的,而“非缓冲文件系统”的文件缓冲区需要由编程者为每个文件设置缓冲区的位置和大小。 说明:目前已采用“缓冲文件系统”作为标准的C文件系统。 13.2文件类型指针 文件类型的引入: 使用缓冲文件系统时,系统将自动为每一个打开的文件建立缓冲区,此后,程序对文件的读写操作实际上是对文件缓冲区的操作。 为了便于编程,C语言中将有关文件缓冲区的一些信息(如缓冲区对应的文件名、文件所允许的操作方式、缓冲区的大小以及当前读/写数据在缓冲区的位置等)。用一结构体类型来描述,类型名为FILE,该结构体类型的定义包含在stdio.h文件中。 文件类型指针(简称文件指针): 有了FILE类型后,每当打开一个文件时,系统自动为该文件建立一个FILE类型的结构体数据,将关于被打开文件及缓冲区的各种信息都存入到这个FILE型数据中,以后对文件的操作都可通过这个FILE类型的结构体数据进行。 对于编程者来说,只需要定义一个FILE类型的指针变量,并让该指针指向已打开的文件,以后就可以通过该指针来访问其对应的文件。 文件类型指针的定义方法: FILE *fp; fp是一个指向FILE类型数据的指针变量,未赋值以前,该指针没有指向任何文件。 特别说明:编程时,一个文件只能对应一个文件指针。 只要有了指向某个文件的文件指
显示全部