第十章文件
*************************************************************************************
文件是性质相同的记录的集合记录是文件中存取的基本单位数据项是文件可使用的最小单位数据项有时称字段或者属性
文件 ·逻辑结构是一种线性结构
·操作有检索和维护并有实时和批量处理两种处理方式
文件 ·存储结构是指文件在外存上的组织方式
·基本的组织方式有顺序组织索引组织散列组织和链组织
·常用的文件组织方式顺序文件索引文件散列文件和多关键字文件
评价一个文件组织的效率是执行文件操作所花费的时间和文件组织所需的存储空间
检索功能的多寡和速度的快慢是衡量文件操作质量的重要标志
*************************************************************************************
顺序文件是指按记录进入文件的先后顺序存放其逻辑顺序和物理顺序一致的文件主关键字有序称顺序有序文件否则称顺序无序文件
一切存储在顺序存储器(如磁带)上的文件都只能顺序文件只能按顺序查找法存取
顺序文件的插入删除和修改只能通过复制整个文件实现
*************************************************************************************
索引文件的组织方式通常是在主文件之外建立一张索引表指明逻辑记录和物理记录之间一一对应的关系它和主文件一起构成索引文件
索引非顺序文件中的索引表为稠密索引索引顺序文件中的索引表为稀疏索引
若记录很大使得索引表也很大时可对索引表再建立索引称为查找表是一种静态索引
索引顺序文件常用的有两种 ·ISAM索引顺序存取方法是专为磁盘存取文件设计的采用静态索引结构
·VSAM虚拟存储存取方法采用B+树作为动态索引结构由索引集顺序集数据集组成
*************************************************************************************
散列文件是利用散列存储方式组织的文件亦称为直接存取文件
散列文件 ·优点是文件随机存放记录不需要排序;插入删除方便;存取速度快;不需要索引区节省存储空间
·缺点是不能进行顺序存取只能按关键字随机存取且询问方式限地简单询问需要重新组织文件
*************************************************************************************
多重表文件对需要查询的次关键字建立相应的索引对相同次关键字的记录建一个链表并将链表头指针长度次关键字作为索引表的索引项
倒排表次关键字索引表称倒排表主文件和倒排表构成倒排文件