用電腦把一種自然語言翻譯為另一種自然語言,又稱自動翻譯。被翻譯的語言稱為源語,譯出的語言稱為目標語。機器翻譯不僅和人工智慧研究關係密切,而且還涉及語言學研究(特別是應用語言學研究)。它是有一定代表性的電腦非數值應用研究。機器翻譯過程和人翻譯有某些類似之處,也要通過查詞典、源語分析和目標語綜合等幾個階段。機器翻譯系統一般包括詞典、語法分析、語義分析和轉換與綜合等4個子系統。

  詞典子系統統 機器詞典是存儲在計算機系統內的一部雙語或多語大詞典,其中對每個源語詞不僅指出對應的目標語的譯法,而且還給出翻譯過程中需要使用的其他一系列信息,例如詞類信息、詞組信息、語法信息、語義信息和目標語綜合信息等。機器詞典是機器翻譯工作的基礎,詞典子系統的任務就是在計算機內建立並使用這樣一部大詞典。在翻譯過程開始時,通過自動查找這部機器詞典,提供源語句子中每個詞的有關信息。

  語法分析子系統 求得源語詞匯和詞組信息之後,計算機還要對源語句子進行語法分析,求出源語句子的語法結構,即查明句中各詞之間的語法關系。通常,這種語法結構用一種倒置的樹狀圖來表示,稱為語法樹。例如,英語句子“I read a book”,通過翻譯系統的語法分析子系統,可得到語法結構描述(見圖)。

  語義分析子系統 為瞭得到正確的譯文,不能僅僅進行形式語法分析。例如有些詞匯具有多種詞義,即所謂多義詞;有些句子脫離上、下文的語義就可能有一種以上的不同語法解釋,形成多值語法結構。為解決這些多義和多值問題,必須使用語義手段進行一定的語義分析。在機器翻譯研究中,語義分析是一個比較薄弱的環節,還需要結合人工智能和語言理解的研究進行深入的探討。

  轉換和綜合子系統 根據求得的詞匯信息、語法信息和語義信息,計算機進行翻譯的最後一個階段是目標語譯文的綜合。譯文的產生考慮源語與目標語之間在詞匯和語法等方面的差異,找出對應的規則,進行必要的詞匯轉換和語法結構轉換,綜合出合乎目標語語言規范的譯文。轉換和綜合子系統是翻譯過程的主要完成者,其他子系統都是在為機器翻譯提供必要的信息準備。

  特點 機器翻譯的特點是速度快,計算機能在較短的時間內“不知疲倦地”完成大量的文字翻譯工作;但是機器翻譯質量尚不理想,譯文比較生硬呆板,有些譯句不通順,甚至譯錯。機器翻譯隻適用於翻譯語法結構比較嚴謹、詞匯含義比較明確的文獻,例如科技文獻。為保證機器翻譯具有一定的譯文質量,往往還需要人從旁協助,進行所謂的“譯前加工”(源語句子輸入計算機時,對機器難於處理的某些語言現象由人先提供一定的註釋和解法)或“譯後編輯”(對計算機翻譯出來的譯文由人再去校對和潤色),甚至要求建立人機合作式的機器翻譯系統,對計算機翻譯過程中出現的疑難問題,隨時由人提供解答。