研究資訊傳輸和資訊處理系統中一般規律的新興學科。核心問題是資訊傳輸的有效性和可靠性以及兩者間的關係。學科內容包括資訊熵、信源編碼、通道編碼、通道容量、資訊失真率理論、信號檢測和估計等。

  形成和發展 資訊理論形成一門獨立的學科,公認是以1948年美國數學傢C.E.香農發表著名論文《通信的數學理論》為標誌的。香農用負熵作為資訊的度量,成功地解決瞭資訊傳輸的基本問題,為資訊理論奠定瞭瞭基礎。50年代,人們一方面在理論上闡明和推廣香農的研究成果,把信息論置於嚴謹的數學基礎上,另一方面發展瞭糾錯碼的理論和應用。60年代,在此基礎上進一步發展,建立瞭信源編碼的失真率理論,研究瞭最優信號集,發明瞭卷積碼的序列譯碼和維特比譯碼技術。70年代,衛星通信和計算機技術的迅速發展給信息論以新的動力。各種多用戶通信模型的信息傳輸理論獲得瞭迅速發展。信息論已經發展成為一門擁有眾多分支的新興學科。

  信息量 信息的度量是信息論研究的基本問題之一。對於應用范圍如此廣泛的信息提出一個統一的度量是困難的。美國數學傢C.E.香農在1948年提出信息熵作為信息量的測度。根據人們的實踐經驗,一個事件給予人們的信息量多少,與這一事件發生的概率(可能性)大小有關。一個小概率事件的發生,如“唐山發生七級以上大地震”使人們感到意外,它給人們的信息量就很多。相反一個大概率事件的出現,如“12月15日北京未下雪”給人們的信息量就很少。因此,用I(A)=-logP(A)〔P(A)表示事件A發生的概率〕來度量事件A給出的信息量,稱為事件A的自信息量。若一次試驗有M個可能結果(事件),或一個信源可能產生M個消息(事件),它們出現的概率分別為p1p2,…,pM ,則用

來度量一次試驗或一個消息所給出的平均信息量。當對數取 2為底時,單位為比特;當對數取 e為底時,則單位為奈特。 H的表達式與熵的表達式差一個負號,故稱負熵或信息熵。

  信息傳輸模型 信息傳輸系統主要由信源、信道和信宿組成,下圖為信息傳輸系統的基本模型。信源是產生消息的系統。信宿是接受消息的系統,信道則是傳輸消息的通道。圖中編碼器、譯碼器的作用是把消息變換成便於傳輸的形式。

  信源編碼 信源是產生消息(包括消息序列)的源。消息通常是符號序列或時間函數。例如電報系統中的消息是由文字、符號、數字組成的報文(符號序列),稱為離散消息。電話系統中的消息是語聲波形(時間函數),稱為連續消息。消息取值服從一定的統計規律。因此,信源的數學模型是一個在信源符號集中取值的隨機變量序列或隨機過程。信源編碼器將消息變換為一個數字序列(通常為二進制數字序列)。在離散情形,若信源產生M個可能消息,它們出現的概率分別為p1,p2,…,pM,每個消息由N個信源符號組成,便可取信源編碼與數字序列一一對應。第i個消息對應的數字序列長(數字個數)為lili相等的稱等長編碼,否則稱變長編碼。定義

為編碼速率,它表征平均每個信源符號要用多少個數字來表示。若取信源譯碼器為信源編碼器的逆變換器,則在無噪信道(信源編碼器的輸出即為信源譯碼器的輸入)情況下,消息可以正確無誤地傳送。這時信源編碼問題是要找出最小的速率 R及其相應的編碼。已經證明,對於相當廣泛的信源類,當 N可以任意大時這個最小極限速率 稱為信源的熵率,是信源的一個重要參數。對於固定的 N,最優編碼就是赫夫曼編碼。在連續消息的情形,信息編碼器不可能使消息與數字序列一一對應,因此譯碼也不是編碼的逆變換。通常的方法是先對連續消息進行采樣和量化,變為離散消息,再將離散消息變換為數字序列。信源譯碼器先將數字序列逆變換為離散消息,再用內插法求得連續消息。這樣一來,即使在無噪信道的情況下,發送消息與接收消息之間也會產生誤差,稱為消息失真。可以用一個非負函數 d( u,v)來度量消息 u,v之間的失真大小。這時信源編碼問題是在保證平均失真不超過給定允許極限 D 的條件下找出最小速率 R 及其相應編碼。求解這一問題導致熵推廣到失真率函數,信源編碼的失真率理論因而得到發展。

  信道編碼 信道是傳輸信息的媒質或通道,如架空明線、同軸電纜、射頻波束、光導纖維等。有時為研究方便將發送端和接收端的一部分如調制解調器也劃歸信道。信息論把信息傳送過程中受各種幹擾的影響都歸入信道中考慮。根據幹擾的統計特性,信道有多種模型。最簡單的是離散無記憶恒參信道,它可以用信道入口符號集X、出口符號集Y和一組條件概率P(y|x)(xX,yY)來描述。若信道輸入信號x=(x1,x2,…,xN),則相應的輸出(受擾)信號y=(y1,y2,…,yN)出現的概率為P(y|x)=

信道編碼器將數字序列每 K個一組變換為字長 N 的信號(碼字),稱為分組編碼。若數字和信道符號都是二進制的(可用0,1表示),則 RK/ N 定義為編碼速率,它表明每個信道符號表示多少個數字。 N- K 稱為編碼冗餘度。信道編碼(糾錯編碼)的基本思想就是增加冗餘度以提高可靠性。更確切地說,信道譯碼器可以利用編碼冗餘度將受擾信號變換為正確的發送數字序列。重復編碼乃一簡例。信道編碼器將輸入數字重復三次, 如將01011變換為000111000111111。信道譯碼器可用門限譯碼,即先將輸入譯碼器的信道符號每三個一組地相加,再將結果逐個與閾值 2比較,小於閾值2的譯為0,否則譯為1。這樣若受擾信號010110100011011雖然錯瞭 5個符號,但譯碼仍為01011與發送數字序列完全相同。信息論得出的重要結論是:對於一個有噪信道,隻要在信道編碼中引入足夠而有限的冗餘度,或等價地說編碼速率足夠小,就能通過信道漸近無誤地傳送消息。更確切地說,對充分長的數字序列,其接收錯誤概率可以任意小。信道編碼問題是要找出使信道漸近無誤地傳輸消息所能達到的最大編碼速率 R和相應的編碼。已經證明,對於離散無記憶恒參信道,這個最大極限編碼速率為 ,它是對 X上一切概率分佈 p取極大值。 p為信道轉移概率(條件概率),

稱為交互信息;C 稱為信道容量,是信道的重要參數。

  信息傳輸定理 對圖中的信息傳輸系統,若H/TSC/TC,其中H為信源的熵率,C為信道容量,TSTC分別為信源符號和信道符號的持續時間,則一定存在編碼和譯碼使消息可通過信道漸近無誤地傳送。反之,若H/TSC/TC,則不存在這樣的編碼和譯碼。

  信息論研究的主流始終是圍繞這個基本定理展開的,隻是信源和信道的模型更復雜而已。上述定理是實際存在的,但沒有給出實現這一理想傳輸的具體編碼方法。尋找實現這一理想傳輸的編碼和譯碼方法則是編碼理論研究的目標。雖然這一目標至今尚未達到,但信息論的研究成果對設計新通信系統的作用是人們所肯定的。

  信息論的應用 信息論的意義和應用范圍已超出通信的領域。自然界和社會中有許多現象和問題,如生物神經的感知系統、遺傳信息的傳遞等,均與信息論中研究的信息傳輸和信息處理系統相類似。因此信息論的思想對許多學科如物理學、生物學、遺傳學、控制論、計算機科學、數理統計學、語言學、心理學、教育學、經濟管理、保密學研究等都有一定的影響和作用。另一方面,由於借助負熵定義的信息量隻能反映符號出現的概率分佈(不肯定性),不能反映信息的語義和語用層次。一篇重要的報告和一篇胡說亂道的文章可以具有同樣的信息,這顯然不符合常識。因此現階段信息論的應用又有很大的局限性。把信息的度量推廣到適合於語義信息和語用信息的情況,曾經做過許多嘗試。但至今還沒有顯著的進展。