文档访问

文档访问概述

在信息化建设发展的过程中，作为信息主要载体的文档，成为我们工作生活中不可或缺的一部分，其中对基于XML格式的流式办公文档的套用最为广泛。目前世界主流的流式办公文档格式主要有3种：标準为IS0/IEC26300；2006的开放文档格式(open document format，ODF)、标準为ISO/IEC 29500：2008的OOXML(officeopen XML)以及标準为GB/T20916—2007的标文通。这3种流式文档格式都基于XML，相应的处理技术也由原来VBA、宏等方式逐渐过渡到利用XML相关技术进行处理。

在早期，用户对流式文档的操作，主要基于办公文档处理软体，并可以使用VBA、宏等方式扩展对办公文档的处理。带来的问题是，传统的方式效率低，速度慢，所能处理的文档格式单一，因其过分依赖办公软体产品，使之对于不同格式的流式文档而言，无法通过同一个办公软体实现操作互通，给用户带来不便。

流式办公文档採用基于XML的格式之后，对XML文档的各种访问技术也被用于对流式办公文档的处理。针对基于XML格式的文档，出现了很多XML数据访问技术，如：XPath、XSLT、DOM和SAX、XQuery、LINQ、相应格式的API/BD、UOML、ODQ等。

XML文档访问

随着XML(eXtensible Markup Language)在电子商务、政务、网路出版和移动通信等领域的广泛套用，越来越多的公司把XML作为其存放信息或与外部世界交换信息的手段。XML已经成为web环境中描述数据的标準，如何实现XML文档的安全访问控制是进行数据保护的一项重要内容。当这些XML格式的信息存储在计算机时，如果包含了比较敏感的数据，就需要一种灵活高效的访问控制机制，既保证合法用户能够方便快捷地访问资源，又要阻止非法用户的访问请求或合法用户的非法访问请求。

国内外对XML文档的访问控制的研究有很多。其中自主访问控制策略DAC具有相当大的缺陷，它是建立在用户本身能够保证客体的可信性的假设基础上的，这个假设通常不成立；基于角色的访问控制策略RBAC是一种灵活而有效的访问控制策略，但在拥有多个安全等级的信息系统中效果不佳；基于规则的访问控制可以解决这些问题，BLP模型是一种基于规则的访问控制模型，源自军事套用领域，对一般套用过于严格，但又有许多优点，根据实际需求进行改进并得到一个新的DBLP模型。

文档访问控倒

支持读操作的访问控制模型在处理读操作时的工作过程如图中虚线部分所示：

当用户请求访问XML文档时首先将文档解析为DOM(Document Object Model)树。
根据文档的DTD(Document‘Type Definition)及存放文档授权信息的XAS(XML Access Sheets)标记DOM树，给文档中的每个节点都设定授权符号(+允许访问，一禁止访问)。
将DOM树中所有授权符号为“一”的节点移除，将剩下的节点转化为XML格式返同给用户。
移除某些节点而形成的新的文档可能不符合原来的DTD。通过将DTD中所有的元素和属性都设定为可选的来解决该问题，此过程称为loosening DTD。用户只能看到他有权访问的那部分文档，这样就确保了数据的保密性。然而，这些模型没有详细研究更新操作的访问控制，也没有考虑由于更新操作引起的数据完整性问题。
如果向以上支持读操作的模型引入更新操作以支持用户的更新请求，则要增加如图I实线框内所示的访控制过程，用以处理更新操作带来的有效性验证问题。具体步骤为：
通过DTD验证(DTD verification)确认更新操作执行之后是否引起XML文档结构的改变，使其不再符合原来的DTD。
如果文档的结构发生改变，对原有的DTD不再有效，则检查用户是否具有修改原有DTD的许可权。
如果用户具有修改DTD的许可权，则修改DTD并更新文档；否则，不能修改DTD并拒绝执行操作。

文档访问

文档访问

基本介绍

文档访问概述

XML文档访问

文档访问控倒

访问控制实现

BLP和DBLP模型

BLP模型

动态BLP模型

流式办公文档访问

处理需求

处理技术

访问方法比较