研究人類如何使用各族語言與電腦通信(對話),探索人類自身的語言機制和思維活動的本質。是一門新興的邊緣學科,內容涉及語言學、心理學、邏輯學、聲學、數學和電腦科學,以語言學為基礎。是人工智慧的一個重要分支。

  自然語言理解大體上可歸結為對自然語言句子和篇章兩個層面上的分析和生成的研究。在人工智慧界,人們普遍認為可以採用圖靈試驗來判斷電腦是否“理解”瞭自然語言,具體的評判方式如下:①問答。電腦能正確抽出輸入文本中的主要信資訊,並據此正確回答用戶的相關提問。②釋義。機器能用不同的詞語和句式復述輸入文本。③文摘生成。機器有能力自動產生輸入文本的摘要。④翻譯。機器具有把一種源語言的輸入文本翻譯成另一種指定的目標語言的能力。達到這些要求的計算機系統將在機助人譯(MAHT)或人助機譯(HAMT)系統、自然語言人機接口或人機對話系統、信息抽取和自動文摘等方面得到廣泛應用。

  自然語言理解研究大體上經歷瞭3個時期:即20世紀60年代以關鍵詞匹配為主線的早期;70~80年代以句法–語義分析為主線的中期;90年代以來走向實用化和大規模工程開發的新時期。早期的系統通過含有關鍵詞的模板識別輸入句子的意思,並根據匹配的模板輸出事先定義好的響應。中期的系統大都裝備瞭句法–語義分析模塊,因而在“理解”的深度上比早期系統有瞭長足進步。這個時期的主流方法在機器翻譯等領域取得產品化進展的同時,也暴露出開發周期長、語言覆蓋面窄和性能低下等弱點。90年代以來,因特網上的搜索引擎、漢字拼音輸入、文本–言語轉換和漢語聽寫機等應用系統的成功開發,顯示瞭統計語言模型方法的強大生命力。大規模真實文本處理的需求將進一步推動自然語言理解研究的變革,以句法–語義分析為代表的理性主義方法,以語料庫和機器學習方法為代表的經驗主義方法,以及它們二者的有機結合必將使這個領域的研究與應用取得更大的成功。

  

推薦書目

 姚天順, 朱靖波, 張俐等. 自然語言理解: 一種讓機器懂得人類語言的研究. 2版. 北京: 清華大學出版社, 2002.