使電腦“理解”人類語言以便人機之間直接用自然語言通信的技術。自然語言理解的研究能從根本上為普及電腦掃清道路,並為揭示人類語言機制和思維奧秘創造條件,因此自然語言理解已成為人工智慧活躍的研究領域。自然語言理解的研究物件一般指書面語。口語理解因涉及語音過程和結果的處理,已形成單獨的研究領域(見言語理解)。

  20世紀40年代中期,人們開始研究根據輸入原文用電腦來編制語詞索引(詞的出處、出現頻率),在此基礎上進一步提出瞭機機器翻譯問題,目的在於研制能翻譯科技文獻的實用系統。當時采用的方法是,先在雙語對照詞典上對輸入語句每一個詞按順序逐一選擇目標語言中與之對應的詞,並調整詞序以得到符合目標語言習慣的輸出句。實踐表明,依靠簡單匹配技術和單純語法結構知識難以保證翻譯質量。在經過一段時期的低潮之後,人們終於認識到要機器翻譯自然語言乃至用機器進行一切形式的自然語言處理,首先要使計算機“理解”自然語言,也就是走人工智能的道路。這便是自然語言理解的研究在60年代應運而起的原因。

  60年代初期,最早一批自然語言理解程序是在特定領域內且受到較大限制的條件下編制的。輸入限定為簡單的陳述句或疑問句,同預先規定的關鍵詞或模式進行匹配,然後運用啟發式知識作出響應。這些系統缺乏演繹推理能力,隻適用於專門領域的簡單問答系統。文本型自然語言處理系統則是對上述簡單系統的改進。

  

文本的原文以某種符號形式存放於系統內,然後用較靈活的索引技術檢索所需材料,而不作語義處理。這類系統已可用於一般領域但仍缺乏演繹推理能力。60年代中期,人們開始研究有限推理型系統。輸入語句以某種內部形式存放於系統內並進行語義分析,系統能以有限的推理能力提供數據庫中並未顯式存儲的事實。這就是演繹數據庫的原型。70年代以後開始研究的知識型自然語言理解系統,也可納入 知識工程范圍。系統擁有大量一般知識、環境知識和語言本身的知識。設計這類系統的一個指導思想是將語言過程看成認知過程的反映,下圖為語言雙方交互通信的基本模型。70年代初期研制的具有較大影響的兩個著名知識型自然語言理解系統是W.A.伍茲的LUNAR系統和T.維諾格勒的SHRDLU系統。LUNAR是用自然語言通信的實驗性信息檢索系統。它的作用是輔助地質學傢對“阿波羅”11號航天飛船從月球帶回的土壤和巖石標本進行分析。此外這種系統采用的 擴展轉移網絡和過程語義技術對人工智能研究具有普遍意義。SHRDLU系統模擬操作積木塊的機器人,其目的在於表明:要使計算機程序理解自然語言,必須將語法、語義和推理等有機地結合起來。這項研究對 知識表示的研究有推動作用。80年代還出現瞭將自然語言理解系統與 專傢系統結合起來的趨勢。例如概念汲取系統對輸入的科技文獻在理論的基礎上進一步評價分析,試圖提出一些有用建議。

  要使計算機能“理解”自然語言,必須在語言學基本理論指引下並以機器可以接受的方式提供實用的自然語言語法分析的技術。

  自然語言理解主要用於機器翻譯、數據庫檢索、集成型問答系統、原文分析、響應生成、智能機的人機接口等方面。也有一些系統的研制是為瞭進行語言學或認知心理學的理論研究而不在於直接應用。

  

參考書目

 T.Winograd,Language as a Cognitive Process,Vol.1, Addison-Wesley Publ. Co., Reading, Mass.,1983.