人和電腦增長知識和提高技能的過程或技術。在人工智慧研究中,一般指知識獲取(顯式知識和非顯式知識)和理論形成(假說形成和歸納推理)。

  研究“學習”的基本目的有兩個方面:一是從認知建模角度出發(見認知模型),通過建立學習的電腦模型來研究人的學習機制;二是從工程技術角度出發,研究電腦如何具有學習能力,即機器學習問題。這兩方面的研究互相關聯,不可分割。機器學習,歸根結蒂是人的學習問題,即人學習如何教會機器學習的問題。

  發展簡況 人工智能研究中對學習問題的研究大體經歷瞭三個階段。①早期的人工智能研究者(20世紀50年代)曾經研究自適應、自組織系統,試圖模擬神經元的系統,典型的代表是A.羅森佈盧埃特的感知機。這類從原來“一無所知”狀態出發,通過反饋進行學習以改善其結構參數的電子裝置並未獲得預期結果。60年代初期,人工智能研究從學習問題轉向問題求解和自然語言理解等方面,而自適應控制系統則沿著另外路線發展,成為現代控制理論的組成部分。②70年代對學習的研究又有回升,人們總結出一條重要經驗:學習是一個極為復雜的過程,而任一學習系統如果從一無所知的起點出發是不可能學到高級知識的。這樣便開始向兩方面努力。理論方面主要通過簡單問題深入研究人的學習機制,實踐方面則開始研究將大量與問題領域有關專門知識通過學習程序(即知識獲取程序)向知識型系統轉移。③70年代後期,一方面繼續研究學習機制,並從理論上提高認知科學或思維科學的水平;另一方面則研究在知識型系統中采用更復雜而有效的學習方式。

  學習系統的簡化模型 

學習系統可通過一個由環境、學習元件、知識庫、執行元件四個基本部分組成的簡化模型來研究(圖1)。其中環境提供信息,學習元件從環境信息獲取知識並存儲於知識庫,由執行元件運用,運用的效果再反饋給學習元件。

  基本學習方式 根據不同的環境條件和問題的性質,可歸納出例行手續學習方式、原則說明學習方式、典型示范學習方式和類比學習方式等幾種基本的學習方式。

  例行手續學習方式 例行手續學習方式的實質是信息檢索。它適用於環境提供的信息和執行程序所需信息屬於同一層次,因而無需建立假設的情況。隻有在檢索時間短於重新計算所需時間的情況下此種學習方式才有應用價值。

  原則說明學習方式 原則說明學習方式的實質是將告知的抽象原則具體化。它適用於環境提供的信息涉及整個一類問題的較一般的高層次信息,而執行程序所需的信息則是屬於某一特定問題所需的低層次信息的情況。例如MYCIN系統的知識獲取程序TEIRESIAS就采用這種學習方式。

  典型示范學習方式 典型示范學習方式的要點在於歸納推理。它適用於環境提供的信息隻涉及特定問題的低層次信息,而執行程序所需的則是適用於整個一類問題的較一般的高層次信息的情況。示范的例子既可以是正面的,也可以是反面的。BACON程序是采用典型示范學習方式的例子。這個程序能通過歸納推理學習新的簡單概念並重新發現若幹經典的科學定律。BACON程序的基本思想並不復雜,即反復檢查所得數據並運用不同算子逐次建立新項,直到項等於常數為止。BACON程序的工作可以發現開普勒第三定律為例來說明。所謂開普勒第三定律指的是行星圍繞太陽運動的公轉周期的平方T2與它們的軌道半長徑的立方a3成正比,即有a3/T2=k(常數)。向BACON提供的每個訓練范例用一組特征值表示,BACON程序采用不同算子,依次生成a/Ta2/Ta3/T2的新項,一直到新項的值等於常數(圖2)。至此BACON程序提出a3/T2=常數的假說,並收集更多數據來證明假說的可靠性。典型示范學習方式還在系統辨識、自適應控制和模式識別中得到應用(在模式識別中典型示范學習方式常被稱為監督學習)。

←訓練開始→←運用歸納推理得出結論→ ←典型示范學習方式→ 圖2 特征值表

  類比學習方式 從類比推理中得到啟示的學習方式。

  

參考書目

 Paul R.Cohen and Edward A.Feigenbaum,ed.,The Handbook of Artificial Intelligence,Vol.Ⅲ, William Kaufmann, Inc., Los Altos, Calif.,1982.

 R.S.Michalski,R.S.Carbonell,T.M.Mitchell,eds, Machine Learning, Tioga Publ. Co., New York, 1983.