档案组织

档案组织-介绍

档案存取方法是由用户使用档案的要求、存贮设备特徵来决定的，不仅要考虑到档案的逻辑结构，而且要考虑到档案物理结构。

当我们讨论档案组织时，我们是在讨论一个档案中记录的排列，因为所有档案都是由记录组成的。用户给出的修改档案内容的命令其实就是一个访问记录的命令。

在每个档案里面，记录都应该具有同样的格式——它们可以定长或者变长。不管其具体格式，这些记录都可以是分块或者未分块。

定长记录是最常见的，因为它们最容易直接访问。这就是为什幺它们是理想的数据档案。定长记录的关键是记录的大小。如果太小，小过了记录存储的字元数，那幺多出的字元就要被截掉了。如果记录大小太大了，大过了要存储的字元数，就会有空间的浪费。

变长记录不会有剩余空间和截掉记录，所以克服了定长的2个缺点。但儘管它也容易一个接一个读取，但因为记录的位置很难计算，所以直接读取很困难。连续访问的档案或者通过目录查找的档案经常使用变长记录格式。记录的格式，它如何分块，和其它相关信息都被保存在档案描述符里。

用来保存信息的空间根据系统各异，它由存储介质的物理性质所限制。

一个档案的物理组织就是根据记录的排列和存储介质的特性来组织档案。

在一个磁介质的磁碟上，档案组织可以是下面3种方法中的一种：顺序存储，直接存储，和顺序索引。为了选择最好的方法，程式设计师或者分析员必须要考虑下面特性的实际：

数据的挥发性——添加和删除的频率

档案的行为——在一个运行中，被处理的记录的百分比

回响时间——完成操作之前用户要等待的时间。这在互动环境中的查找和修改信息中尤其重要。

顺序记录组织是最容易实现的，因为记录的存储和得到都是顺序的，一个接一个。为了找到一个记录，档案要从头开始查找直到找到这个记录。

为了加速这个处理过程，一些最佳化特性被加入系统。一个就是选择记录的一个关键区域，然后再存储记录前都是根据这个区域分类记录。然后当用户需要一个记录的时候，系统只是查找关键区域。当相匹配的记录找到或者关键区域比最后一次比较的记录小时，给出信息“没找到记录”，然后完成搜寻。

儘管这个技术辅助查找处理过程，但因为当有记录添加或者删除的时候都要保存，它使得算法更複杂了。为了保存物理顺序，档案必须在更改的时候完成回写或者动态分类。

直接记录组织使用直接访问档案的方法，当然，只有在直接访问存储设备上才能实现。这些档案给用户提供了以任何顺序访问任何记录的灵活性，而不用从头开始寻找。这也是一个随机组织方法，其档案叫做随机访问档案。

记录是由它们的相对地址——它们到档案开始的相对位置来确定的。它们的逻辑地址是当档案被存储或者记录恢复的时候计算出来的。