第二讲 数据组织存储和索引.pdf
文本预览下载声明
第二部分:数据存贮及索引技术
一、存储介质及访问策略
二 、数据文件的组织
三 、索引结构
教材第2-3章的内容
一:存储介质及访问策略
1 存储器层次
三级存储器 备份归档
二级存储器(磁盘) 存储
速度
主存储器
计算
高速缓冲存储器
DBMS主要与磁盘进行交互。所以我们主要讨论磁盘的
存储及访问策略。一般讲,DBMS 自己管理的磁盘块。
2 磁盘的存储特性
与磁盘相关的参数:
* 磁盘的容量:片数,磁道数,扇区数
实际应用中,使用逻辑单元磁盘块
一个磁盘块包含一个或几个扇区
3 磁盘的访问特性
磁盘的访问过程以及速度
访问过程:
定位:将磁头移到目标块所在的柱面
旋转:磁盘旋转,将第一个扇区移至磁头下面
读或写数据
访问速度:存取时间(延迟),指从发出数据请求到
内容出现在主存中。
A.处理器与控制器处理请求所花的时间
B.寻道时间:将磁头定位到合适的柱面所花的时间,
一般用平均寻道时间.
C.旋转时间:磁头转到组成块的第一个扇区所需时间
D.数据传输时间:在块内读或写数据所需时间。
存取时间=寻道时间+旋转时间+数据传输时间
注:这个时间与磁盘的物理特性密切相关,不同类型
的磁盘,时间不同。
4 磁盘存取优化策略
①按柱面组织数据
将所需要的数据存储在同一个磁道或同一个柱面上。
②使用磁盘臂调度算法—电梯算法
处理大量块请求的非常有效的算法
③使用多磁盘—并行处理方法
将数据分配到多个磁盘上
④磁盘镜像技术
通过选择寻道时间最短的磁盘来提高读速度。
⑤预取与大规模缓冲技术
通过预测将所需数据块先装入缓存,从而减少等待
时间。或者使用较好的缓冲策略尽量减少磁盘的访问
次数等。
5 数据存储稳定的策略—RAID技术
用N个磁盘代替一个磁盘进行数据存储,提高数据可靠性的一
类磁盘组织方法。
RAID1:一些做数据盘,一些做冗余盘。
Disk1
并行写入 1 3 5 … 并
2 4 6 … Disk2 行
Disk3 读
1 3 5 …
并行写入 出
Disk4
2 4 6 …
(1)写入操作并行化,并有冗余。
(2)没有错误校验。
(3)适用大记录和需要大量I/O操作的应用。
RAID2:内存风格的纠错码,按字节纠错
Disk1
1a 2a 3a … 读跨越
一次写 Disk2 所有数
1b 2b 3b …
横跨所
显示全部