勇敢心资源网

当前位置:首页 > 百科 / 正文

档案组织方式

(2018-11-20 06:33:20) 百科

档案组织方式

档案组织方式是网上数位化信息资源的一种主要存储形式。档案组织方式採用主题组织法的思想,以档案名称标识信息内容,用资料夹组织信息资源,并通过网路共享实现信息传播。档案伺服器(FTP)即以此方式组织网路信息资源(多为非结构化信息),用户界面就是人们熟悉的资料夹视窗,浏览和下载信息操作简便。

基本介绍

  • 中文名:档案组织方式
  • 解释:网上数位化信息资源主要存储形式
  • 套用:管理网路
  • 优点:简单快捷

优点

以档案系统来组织和管理网路信息资源具有以下优点:
(1)简单快捷。计算机有一整套档案处理的理论与技术,在组织网路信息时可以非常容易地利用这些成熟的技术和方法。
(2)适合图形、图像、音频、视频等各种非结构化信息组织管理。由于计算机处理的所有最终结果都能以档案的形式保存下来,因此对于图形、图表、音频、视频等非结构化信息,可以方便地利用档案系统来管理。正因为如此,以档案组织方式来管理信息资源在目前仍然广泛使用。
但是,随着网路信息资源利用的不断普及和信息量的不断增多,以档案为单位共享和传输信息会使网路负载越来越大。同时,档案方式对结构化信息的管理显得力不从心,档案系统只涉及信息的简单逻辑结构,当信息结构较複杂时,就难以实现有效的控制和管理,从而降低了信息组织的效率。因此,档案只能是网路信息资源管理的辅助形式或者是作为信息单位成为其他信息组织方式的管理对象。

种类

1.顺序档案
顺序档案的物理结构最简单,在此结构中,从档案空间的起点开始,档案的各个记录顺序地存放在外存的连续区内,记录的物理顺序和逻辑顺序是完全一致的。它适用于所有的档案媒体。磁带顺序档案从磁带上档案空间头部开始,按物理位置顺序存储记录:磁碟顺序档案的结构从磁碟档案空间最初磁轨的头部开始,按物理位置顺序排列。顺序档案适用于按顺序存取处理,处理速度较快,但记录的插入和删除都不方便。
顺序档案是一种最常用、最简单的档案组织方法,在许多资料处理的场合,它仍然是一种简单、经济而有效的方法。如磁带档案、列印档案都是常用的顺序档案。
实现顺序档案的排列方法有如下几种:
按记录产生的先后次序排列,这种方法对数据收集系统比较方便有效。
按记录键次序排列,可以根据键的升序或降序进行排列。一个记录中的键,可以是一个也可以是多个,分别称为主键、辅键及複合键等。主键是惟一标识记录的域(即记录数据项名称),辅键不是惟一标识记录的域,由两个以上的记录键值组合成的键称为複合记录键。例如在一个职工工资档案中,职工号为主键,姓名、级别、工资额可作为辅键,级别和工资额组成複合键。
按这种方法排列的数据,要求在档案建立时,首先对档案进行排序:
按记录的使用频率进行排列。设档案有n个记录,每个记录使用的机率为Pi,则要求该档案记录的排列顺序按使用机率的大小排列,满足。按使用频率对顺序档案进行排列,可以加速记录的搜寻速度。
自行重组顺序档案。若在上述方法中无法知道其使用频率,可以採用如下几种方法来实现:第一种方法,在记录中加一项使用频率记录,每使用一次加1,然后再按使用率大小排列:第二种方法,在每次记录使用后,将其移至档案的顶端。这样,常用的记录可经常保持在档案的前面:第三种方法,每次记录使用时将其移至现在位置和顶端位置的中间位置,这样可以减少偶然使用的记录占据档案前端位置。
2.索引档案
索引档案分为索引顺序档案和索引非顺序档案。索引顺序档案,其记录的物理顺序和逻辑顺序相一致。记录按记录键的顺序存放,并带有索引。这种档案组织方式用得比较普遍,但是只适用于磁碟媒体。对于这种档案记录的存取方式可以採用顺序存取和直接存取,并能进行各种形式的处理。
索引顺序档案的特点是:
具有记录键和记录键索引,按记录键顺序排列记录,并设有溢出区。
存取速度快。
比较节省存储单元。
增删比较麻烦。
不能用于多码检索。
此外,还有索引非顺序档案,这种档案也带索引表,但档案记录的物理顺序和逻辑顺序不一致,索引表中存有已排序的记录键号以及该键号的记录地址。处理和查找记录时,先查索引表,查到所需的记录地址后,再按地址查找记录。还可以通过设立不同键值的几个索引来利用同一个记录。这种组织方式,可以保证地址的惟一性,存取也比较简单,其缺点是记录数目多时,索引区也很大,索引表本身占用存储空间较大,查找费时。
3.直接档案
直接档案中记录的逻辑顺序与物理顺序不一定相同,但记录的键值直接指明该记录的地址,所以只要知道了记录键值,就能查找该记录的物理位置。
直接档案的记录存放在磁碟等随机存储媒体上,且可以被随机处理,所以也称直接档案为随机存取档案。
确定直接档案中记录的物理位置的方法很多,常用的有:
直接地址法:指定某记录的地址就是存储设备上的实际地址。
相对键法:以档案起始记录为基準的相对地址。
杂凑法:寻找一个杂凑函式H(k),将记录键值转换为相应的记录地址。
直接档案有3种形式:无键直接档案、带键直接档案、桶式(bucket)直接档案。
无键直接档案:是通过直接地址组织的,在记录中没有键项目,把记录的存储地址作为键值。
带键直接档案:在记录中设定键项目,并通过简单的键变换处理,就可以得到相应记录的存储地址。
桶式直接档案:档案空间按桶为单位进行划分,每个桶可以存放多个记录,这个桶通常以磁轨为单位,也可以用弧段作为单位,每个桶都有编号。根据桶号和记录键值,就可以查到相应记录的地址进行记录处理。由于每个桶能容纳m个具有相同Hash函式值的档案记录,只有当一个桶中m个记录都占满后,若还有转换为该桶地址的记录时,才产生溢出。所以适当地加大桶的尺寸,可以减少溢出现象,防止“冲突”现象的产生,这是桶式直接档案的特点。
增大桶的容量可以减少溢出次数,从而减少查找记录所需的平均查换次数。但桶太大,档案存储空间的密度减少,主数据区利用率低,在记忆体中查找桶中记录的时间增加,而且要求记忆体缓冲区足够大,所以桶的容量的选择要全面考虑,应选择大小合适的桶。
除了以上几种基本的档案组织方式外,还有索引连结档案、倒排档案等。索引连结档案是将索引方法和连结方法结合起来的一种组织方式,可用多码检索。倒排档案是一种处理多码检索的组织方式,它利用次键建立次索引表,便于档案记录按各种属性查找,但这种档案占用较大的存储空间。
综合几种基本的档案组织方式的优、缺点列于表中。
特性
组织方式
优点
缺点
顺序档案
处理速度快
存储空间利用率高
在任何媒体上实现
需要对事务己求预先排序
插入记录麻烦
要检索整个记录
索引档案
可顺序处理,也可随机处理
记录追加、插入方便
查找速度较快
增加索引区和溢出区空间
不能用于多码检索
直接档案
存取速度快
记录追加、删除容易
要进行键变换
存储空间利用率低
声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:baisebaisebaise@yeah.net
搜索
随机推荐

勇敢心资源网|豫ICP备19027550号