什麽是學習?
學習是一種觀察。
觀察->學習->技能。
_ 機器學習即是人類通過電腦來模擬學習的一種過程_
在電腦的學習上是由:
- data -> ML -> skill
什麽是skill?
增加某種表現的方法。
機器學習的過程是是從資料出發,經過電腦計算,最終得到某種表現得增强。
適合機器學習的三個關鍵:
要有能夠增進的表現,有一些可以學習的潛藏模式。
有一定的規則,可是不知道如何描述。
要有可以學習的資料。
機器學習最重要的是得到一個 target function -> f
- (未知)f : X -> Y ( X 是 input,Y 是 output )
- data => training examples D = { (x1,y1)``` }
- hypothesis => skill G : X -> Y
(x,y) from f => ML => G
最佳結果是 G 無限趨近 F
G 是從所有的 (hypothesis set) H 中取最好的。
從資料出發,機器學習演算法找到 G,這個
G 無限接近我們要的 function F
從100萬筆((用戶,歌曲),評分)的資料出發,產生出所有可能的(用戶-》歌曲)的可能關係,選出最合適的公式 g,給入 input ,得到在這個 g 之下,用戶 => 歌曲的[ 0,100 ]的評分。
Machine Learning VS Data Mining 資料探索
如果今天是直接希望找出一個 input =》output結果的話, ML 和 DM 類似,目標一致。
因而在有些時候可以通過 DM 找到的性質,進一步幫助 ML 來找到更合適的 g 。
然而在 DM 的一些情況下,并不是單純找出一個 g 來預測,而是希望能找到對使用者有幫助的一些性質,這就與 ML 所預期的是不一樣的。
Machine Learning VS Artificial Intelligence
- 儅今天我們得出一個 g 是爲了進一步預測某些行爲的時候,ML 是實現 AI 的一種方法。
Machine Learning VS Statistics
統計是實現機器學習的一種方法。
- 統計使用資料來進行一些推論,推論一個未知的東西。
- 例如統計出丟硬幣正反面的可能性是多少。
- 可以假設我們希望得到的 g 是一個推論的結果。因此可以理解為,統計是實現機器學習的一種方法。f 是我們想得到的結果,g 是我們推論的結論。
學習視頻:[機器學習基石(1~5)]