管理檔資訊及其所用資源的軟體系統,是電腦作業系統的一個組成部分。檔系統為用戶提供一種簡便的、統一的存取和管理資訊的方法。檔是為瞭某種目的而組織起來的資訊的集合。每個檔有一個名稱,供系統或用戶識別之用。檔可以代表範圍很廣的物件。一個根源程式、一篇文章和一類報表,都可以構成一個檔。為瞭便於存儲、檢索或加工相關的資訊專案,有時把檔劃分成若幹個記錄,這種檔稱為記錄式檔;而不分記錄的檔稱為流式檔或無記錄檔。記錄(或邏輯記錄)由相關資料項目組成;;而數據項則由一個或多個字符組成。文件系統的主要作用是使用戶可以按文件名稱使用文件,用戶隻要提出文件名稱,通過文件系統規定的操作,按照信息的邏輯關系就可存取所需要的信息。為瞭保證文件的安全,文件系統通常采取保護措施,如自動復制副本,以便在文件遭受破壞時能及時復原。文件系統還采取保密措施,使未經文件主許可的任何用戶不能使用他的文件,另一方面又使經他許可的用戶在規定的權限內方便地使用他的文件,實現文件可享。

  文件結構 文件中數據的組織方式。對於由記錄組成的文件則指文件中記錄的組織方式。文件結構可以分為邏輯結構和物理結構。

  用戶觀察到的文件結構稱為邏輯結構,分流式和記錄式兩種。流式文件是一維連續的字符序列或字序列,這種文件不再分成中間的數據單位。記錄式文件由數據記錄組成,按記錄的長度可分為定長記錄文件和變長記錄文件。記錄是記錄式文件的最小存取單位。一個記錄由若幹屬性組成。用以標識記錄的屬性稱為關鍵字。以學生文件為例,每個學生的情況就是一個記錄,有學號,姓名,出生日期,性別等屬性。學號可以選作該記錄的關鍵字。一般來說,可用來標識一個記錄的關鍵字不隻一個,但其中有一個是唯一標識這個記錄的,稱之為主關鍵字(如上例中的學號),而其他關鍵字稱為次關鍵字(如學生的出生日期)。

  文件的物理結構指文件存於外存儲器的結構關系。外存儲器劃分成塊(或物理記錄),計算機在處理的時候以塊作為數據的傳輸單位。文件存在外存儲器的塊中。對於記錄式文件有時一個塊可以包含幾個邏輯記錄,有時幾個塊才能存放一個邏輯記錄。文件的物理結構常見的有三種形式:①連續結構(或稱順序結構),文件的信息存於外存儲器的若幹連續的塊中;②串聯結構,即文件信息散佈在外存儲器的若幹不連續的塊中,其間由指針連接起來;③索引結構,即文件信息散存於外存儲器的若幹塊中,另外建立一個索引表,表中開列記錄的關鍵字值和該記錄在外存儲器位置的對應關系。不同的物理結構其存儲器利用效率、檢索效率和維護效率均不相同。按文件的結構特征文件可分為順序文件和隨機文件。

  順序文件 邏輯順序和物理順序一致的文件,物理順序指文件記錄在存儲器中實際的存儲順序。因此也可說,順序文件是其記錄按照邏輯順序依次存放在外存儲器連續區中的文件。邏輯順序號為i的記錄,其物理順序號亦為 i。順序文件是物理結構最簡單的一種文件。存於磁帶上的文件都是順序文件;存於磁盤上的文件,可以是順序的,也可以是隨機的。順序文件隻能用順序掃描的方法存取,要檢索第i個記錄,必須先逐個檢索它前面的i-1個記錄。存放在磁盤上的順序文件,可以用順序掃描的方法存取,也可以按分塊查找的方法存取。順序文件要插入一個記錄,一般隻能放在文件末端。修改記錄比較難,往往需要重新組織文件。順序文件適用於對記錄的順序訪問,是面向商業的批處理中最常用的文件類型,尤其適用於數據周期性處理的場合,如月帳單等。

  隨機文件 按隨機存取方式組織記錄的文件,即文件所包含的記錄以隨機的方式存放在外存儲器上,並可隨機訪問其中任何一個記錄。隨機文件適用於實時檢索系統。有索引表的文件是一種隨機文件,稱為索引文件。索引表中的索引項按關鍵字的順序排列,而文件本身可以按關鍵字的順序排列,也可以不按關鍵字的順序排列。前者稱為索引順序文件,後者稱為索引非順序文件。對於索引非順序文件,每個記錄必須有一個索引項。索引順序文件則不同,不必對每個記錄設索引項,而是將記錄分成組,每組設一個索引項;索引項中給出的是這組記錄的最大關鍵字和這組記錄所在外存的地址,這就大大縮減瞭索引所占的存儲空間。當文件很大時,索引項必然很多,這時可設多級索引,例如二級索引。高級索引給出低級索引的位置,低級索引給出記錄組的位置。使用索引對文件尋址時,計算機查找的是索引,而不是文件本身,從而節省瞭查找的時間,但索引表要占用額外的存儲空間。索引文件適用於要求隨機存取文件中記錄的情形。例如回答查詢系統、機票預訂系統或與終端操作員進行對話的系統。用雜湊(或散列)函數法組織的文件也是一種隨機文件。這種文件通過雜湊函數把記錄的關鍵字值轉換成一個隨機數,並用這個數來確定記錄的存放位置。雜湊法往往用於關鍵字分佈范圍比較廣,而實際記錄的個數遠比這個范圍小的情形。常見的雜湊法有質數除餘法、基本轉換法、平方取中法、折疊法等。雜湊法的優點是存取速度快,比較節省存儲空間。缺點是不易找到一個良好的雜湊函數,而碰撞現象發生過多,則會增加存取時間,此外還不便於順序處理。

  存取方式 記錄式文件以記錄為單位存取;流式文件按信息個數或以特殊字符為界進行存取。對文件的存取有兩種方式:順序方式和隨機方式。以記錄式文件為例,采用順序方式時文件中的記錄是按照某種次序排列的。文件的使用者總是依上述次序存取一個個記錄。因此隻需要提出存取要求,而無需指出要存取哪個記錄。對於采用隨機存取的文件,使用者不但要提出存取要求,而且要指出存取哪個記錄。文件系統根據指定的記錄來確定該記錄在外存儲器中的物理地址。