《機器學(xué)習(xí)漸入佳境》由會員分享,可在線閱讀,更多相關(guān)《機器學(xué)習(xí)漸入佳境(6頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、機器學(xué)習(xí)漸入佳境
研究具備自我提升能力軟件的嘗試最早始于 20 世紀 60 年代,而經(jīng)常被稱之為“機器學(xué)習(xí)”的技術(shù)仍然基本停留 在學(xué)術(shù)研究階段,只有極少部分進入商用市場的邊緣,例如 語音識別、信用卡詐騙偵測等領(lǐng)域。如今,專家認為隨著更 好的算法、更強性能的計算機和更智能的應(yīng)用策略的相繼問 世,機器學(xué)習(xí)和自我訓(xùn)練軟件技術(shù)將開始進入主流應(yīng)用。
贏得 200 萬大獎的機器學(xué)習(xí)
隨著此類技術(shù)的進步和推廣,市場需求也將逐漸看漲。 “在過去,程序員可以針對一個問題編寫代碼,再進行測試 和運行, 并在以后人工調(diào)試和改進, 如此反復(fù)進行循環(huán)測試, 美國斯坦福大學(xué)人工智能實驗室主管 Sebastian T
2、hrun 教授說,
“這樣的問題在于, 軟件將變得越來龐大, 越來越難以管理。 由此產(chǎn)生了一種趨勢,即讓軟件具備自動調(diào)節(jié)和適應(yīng)能力, 這將是未來計算領(lǐng)域發(fā)生的一項重大革命。 ”
在美國國防部高級研究計劃署 (Defense Advanced
Research Projects Agency最近主持展開的一項競賽中, Thrun 教授通過采用幾種新的機器學(xué)習(xí)技術(shù)的軟件,來驅(qū)動一輛汽 車在沙漠中自動駕駛了 132 英里的路程,從而為斯坦福大學(xué) 贏得了 200 萬美元的獎金。在新技術(shù)的幫助下,這輛汽車能 識別并記憶它所行駛過的路面特征。機器學(xué)習(xí)技術(shù)還使 Thrun 教授的研究團隊極大地提高了工
3、作效率,據(jù)說他在過 去需要花半個月來完成的人工編程工作,現(xiàn)在只需要一天時 間就能讓軟件自動完成。
讓軟件訓(xùn)練軟件
卡耐基 . 梅隆大學(xué)的自動學(xué)習(xí)和探測中心主管 Tom Mitchell 說,對人類而言很容易完成的一些任務(wù) (例如語音和 圖像識別 ),要交給計算機來處理往往有較大的難度, 因為很 難用軟件規(guī)則來將這些任務(wù)解釋和交代清楚,但機器學(xué)習(xí)技 術(shù)的運用可以明顯改善這種情況。在機器學(xué)習(xí)技術(shù)的應(yīng)用案 例中,經(jīng)由人工編寫和標記的測試平臺來“訓(xùn)練”軟件,并 分析和記錄軟件運行結(jié)果的對或錯,不斷對其進行校正,最 終將成熟的軟件派發(fā)出去解決現(xiàn)實中的問題。
為了試驗這種概念, Mitchell 用
4、兩種學(xué)習(xí)算法來相互進 行基本訓(xùn)練,以讓二者共同工作的效果好于單獨使用其中一 種。例如,一種搜索引擎算法通過分析網(wǎng)頁上的詞語來對其
進行分類,而另一種算法則分析指向該頁面的超鏈接中的詞 語,這兩種算法共享對同一個頁面的分析線索,并匯集出更 準確的分析報告。試驗結(jié)果表明,這種聯(lián)合訓(xùn)練方案能明顯 降低錯誤率。它所取得的突破是:軟件的訓(xùn)練平臺不是由人 工編寫的,而是由另一種軟件完成的。
填補人工編程的盲區(qū)
加州大學(xué)伯克利分校的 Stuart Russell 教授正在試驗一些 編程語言,程序員們經(jīng)常用它們來為某些任務(wù)編寫代碼,這 些任務(wù)很容易理解和編碼,但也容易產(chǎn)生許多無法處理的盲 區(qū)和縫隙。為了
5、填補這些縫隙,該試驗引進了諸如人工神經(jīng) 網(wǎng)絡(luò)的機器學(xué)習(xí)技術(shù)。
Russell已經(jīng)將其“局部編程”概念運用在一種稱之為
Alisp(Lisp 語言的擴展 )的語言中。“舉例來說其原理:如果我 想告訴你如何到達機場,但我手上沒有地圖,哪該怎么辦 呢?” Russell 說,“我將編寫一個程序,告訴計算機來如何 到達目的地:‘沿著這條街持續(xù)走下去,穿過所有的路口, 直到在一個斜坡處進入高速公路。在高速公路上一直走到有 機場出口的路牌處, 下了高速再駛?cè)肫胀ń值溃?直到機場。 在這個流程的編碼過程中,將會產(chǎn)生大量無法處理的縫隙, 但它仍然將是個非常有用的導(dǎo)航軟件。 ”在每個縫隙處,程 序員都會指定
6、相應(yīng)的學(xué)習(xí)算法, 但 Russell 的研究目標是有朝 一日讓系統(tǒng)在每個縫隙處自動選擇最佳的算法。
已經(jīng)商用的機器學(xué)習(xí)技術(shù)
計算技術(shù)對機器學(xué)習(xí)自然化的提升,激發(fā)了紐約州立大
學(xué)Yann LeCun教授的靈感,他發(fā)明了一種稱之為“回旋網(wǎng)絡(luò)”
的人工神經(jīng)網(wǎng)絡(luò)系統(tǒng),據(jù)稱它與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比,能用 更少的資源和工作量來更好地完成圖像識別等任務(wù)。通過大 量的神經(jīng)網(wǎng)絡(luò),軟件必須接受數(shù)量龐大的不同情況下的訓(xùn)練, 以讓其適應(yīng)多種不同情況――目標的不同位置和不同大小、 不同的視角和背景等等,而這是項艱巨的挑戰(zhàn)。
LeCun發(fā)明的技術(shù)如今已被用于銀行門禁中的模式識別 閱讀器和機場的監(jiān)視系統(tǒng),它將監(jiān)測目
7、標的每個圖像分解成 小塊區(qū)域 (例如鼻子、眼睛等 ),然后再拼接起來,生成高水 平的特征信息, 這種系統(tǒng)更加靈活, 并且減少了訓(xùn)練的次數(shù)。
軟件也可“物競天擇”
與此同時,研究還推進了機器學(xué)習(xí)的一個分支一一基因 編碼學(xué)(Genetic Programming , GP)的發(fā)展,這種技術(shù)讓軟件
的發(fā)展遵循像達爾文的生物進化論一樣的規(guī)律。事實上,對 同一種問題的解決,往往會有多個不同版本的程序,甚至?xí)?同時出現(xiàn)成百上千個版本,而這很容易讓人們混淆。其中的 絕大多數(shù)是比較弱的,但進化程序?qū)钠渲羞x擇兩個最優(yōu)的 出來,并將二者組合成更優(yōu)秀的新一代程序。在沒有人工參 預(yù)的情況下,這種進化過程將持續(xù)
8、進行數(shù)百代,并且每次都 使程序得到優(yōu)化和提升。
斯坦福大學(xué)的電子工程學(xué)教授 John Koza是GP研究的先
驅(qū),他用這種概念來設(shè)計電路、控制器、光學(xué)系統(tǒng)和天線等 設(shè)備,結(jié)果與那些取得專利的傳統(tǒng)設(shè)計方法等效或優(yōu)于后者。 他完全用GP創(chuàng)建的一個控制器設(shè)計最近還獲得了一項專利。
不過,有點像生物進化過程一樣, GP的研究進展非常緩 慢。即使到了計算機速度超前發(fā)展的當(dāng)前, GP在解決復(fù)雜問
題的過程中所用得上的計算資源仍然是杯水車薪。在那項專 利設(shè)計工作中,Koza教授在他的筆記本電腦上所做的工作量 只有幾個小時, 而完成控制器設(shè)計的 GP 進程則在由 1000 個 Pentium 處理器節(jié)點組成的集群環(huán)境下持續(xù)了 1 個月之久。
“我們從20世紀80年代后期開始了 GP研究,現(xiàn)在我
們所獲得的計算能力將比那時強 100萬倍” ,Koza說,“預(yù)計
再過 10 年左右,我們的研究成果將在實際的工程設(shè)計領(lǐng)域 發(fā)揮作用?!?