電腦可讀的、有組織的相關文獻資訊的集合。在文獻資料庫中,文獻資訊不是以傳統的文字,而是將文字用二進位編碼的方式表示,按一定的資料結構,有組織地存儲在電腦中,從而使電腦能夠識別和處理。文獻資料庫是當前通過遍佈於全世界的通信網路進行聯機情報檢索的最早的和主要的處理和檢索對象。

  文獻資料庫起源於二次文獻編輯出版的電腦化。20世紀60年代初,各文摘社為克服因資訊爆炸而帶來的困難,紛紛引進瞭先進的電腦技術。將經過整理、加加工的文獻信息輸入到計算機中,由計算機進行編輯和排版,輸出後排版印刷為文摘刊物和各種索引。同時,仍保留在計算機中的機器可讀的文獻信息,作為二次文獻編輯出版的副產品,發展成為文獻數據庫。由於機器可讀信息大多記錄在計算機的磁帶上,因此也稱文獻數據庫為磁帶版二次文獻。早期的文獻數據庫有1964年正式對外發行的美國國立醫學圖書館的醫學文獻分析與檢索系統(MEDLARS),美國化學文摘社的《化學文摘數據庫》(CACON)等。

  文獻數據庫的內容與其傳統的文獻信息是相對應的。一種書刊或一篇文獻的內容和形式特征經著錄後形成一條款目。款目是文獻信息的基本單位。在文獻數據庫中,一條款目稱為一條記錄,記錄也是構成文獻數據庫的基本單位。款目由篇名、作者和主題等著錄項目組成,著錄項目在文獻數據庫中稱為字段。一個字段又可細分為若幹個子字段。這樣,文獻數據庫是由一系列連續的記錄、字段和子字段組成,並形成瞭一個分級樹型結構。

  文獻數據庫經過20年的發展,全世界已從1965年20個數據庫發展到80年代末約4000個商用數據庫,幾乎覆蓋瞭主要國傢的所有文獻。數據庫的規模有小、中、大、超大規模之分,小型文獻數據庫年增長幾百條記錄,超大規模數據庫年增長50萬條記錄以上。文獻數據庫的內容也不限於二次文獻,已發展為3 種類型:①全文數據庫,存儲文獻全文;②書目數據庫,存儲內容為題錄或除題錄外,還包括文摘、提要或簡介;③書目相關數據庫,僅存儲索引詞和文獻號,不存儲其他書目信息。

  文獻數據庫主要用於情報檢索,包括:①由計算機處理直接進行聯機情報檢索和定題情報檢索;②生產傳統性的文獻產品,如文摘刊物、書目、索引、專題目錄等;③生產機讀文獻產品,如綜合或專題文獻數據庫磁帶、軟盤等;④生產文獻縮微產品,如計算機輸出縮微片(COM)。

  文獻數據庫的發展趨勢是:①文獻數據庫生產產業化;②高密度存儲,如采用光盤;③向全文數據庫發展,采用自然語言檢索;④多文種,即一個數據庫可用多種語言檢索。