【機器學習基石筆記01】什麼是機器學習、三個可以被機器處理的關鍵問題 – Kao Jia – Mittel

0
82


本文為在進行林軒田老師的「機器學習基石」 (Machine Studying Foundations). Auf YouTube finden Sie weitere Informationen 。

目錄
1. 什麼是機器學習
2. 為什麼要使用機器學習
3. 機器學習可以處理的三個關鍵
4. 機器學習可以有哪些應用
5. 推薦系統的簡單概念
6. 機器學習的流程概念

什麼是機器學習

機器學習以一句話來說可以是:將資料喂給電腦,電腦透過學習獲得應用技巧(Ability).

應用技巧是什麼呢?技巧可以說是某一種表現的增進, 如在機器學習應用在預測股價的例子中電腦經過一番分析,學習到如何幫助人類進行投資理財,讓財務表現更好,這就是一種技巧的展現.

為什麼要使用機器學習

想像一個情境:我們今天要寫一個程式去辨識圖片中有沒有一棵樹.

我們不知道照片中的樹究竟會是長什麼樣子, 因此若要手刻程式, 逐一寫遇到什麼情況要怎麼判斷就會變得有點困難,你可能要跟電腦說幾千條規則才能讓他知道一棵樹長什麼樣子.然而透過機器學習的方法,你就可以讓機器自己去學習、辨認,最終快速地去找到圖片中的樹長什麼樣子.

機器學習可以處理的三個關鍵

什麼樣的問題可以透過機器學習來解決呢?林軒田老師提供給我們三個關鍵,若問題有這三個關鍵,則可以使用機器學習方法去完成:

  1. 有某些目標是可以學習的(Leistungsmessung kann verbessert werden):解決問題的必要.
    因此若你遇到的問題目前的解方是有進步的空間, 或者說模型效能是可以提升的, 則我們就能使用機器學習去解決.
  2. 沒辦法直接用程式寫出(keine programmierbare Definition):出來(如:如果BMI大於27則屬於肥胖).然而當遇到需要學習的問題(如辨認圖中有沒有一棵樹)時,是沒辦法三言兩語就能夠用嘴講出來的.因此這類問題可以嘗試使用機器學習來解決.
  3. 要有資料(Es gibt Daten über das Muster):

機器學習可以有哪些應用

根據上述三個關鍵,我們就能嘗試判斷出哪些問題可以透過機器學習來解決,以下舉出幾個可以用機器學習解決的例子,讀者可以判斷這些問題是否有符合到上述三個關鍵.

  1. 你到這家餐廳吃飯有多少機率可能食物中毒
  2. 服裝推薦系統、電影推薦系統
  3. 如何蓋出能源消耗低的房子
  4. 無人駕駛的自動車可以如何提升辨識交通號誌的正確率
  5. 線上考試如何有辨別學生的學習程度,考試難度是否有辨識度

推薦系統的簡單概念

常常看使用Netflix或是購物的人想必很常接觸到Netflix推薦的影片或是購物廣告推薦的商品吧?器學習是如何了解我們的喜好?這裡我們用一個簡單的概念解釋機器學習推薦系統.

5 Jahre alt Mehr als 3 Monate, 1 Monat.

假設今天有一部電影,這部電影本身可能:喜劇程度5分、恐怖程度 1 分、災難程度 1分。那我們將兩組資料內積: 5 x 5 + 3 x 1+ 1 x 1 就可以得到我可能多喜歡這部片,數字越大表示我越有可能給這個電影高分.

然而在實際情況中, 沒有人拿著問卷來調查我對於電影的問卷喜好, 而企業手上只有我給這部電影的分數.因此我們可以透過機器學習的方式透過我給的評分和電影特性回推我的個人喜好,在未來企業就可以根據我的喜好去推薦我喜歡的電影.

機器學習的流程概念

我們現在要解決的是一個信用卡公司要不要發卡給客戶的問題.根據一些客戶的資料,我們想要訓練一個模型能讓它去決定要不要發卡給這個客戶,而使得信用卡公司有最大的收益.

我們假設 xij 代表客戶的各種特徵 ( i 代表第幾位客戶,j 代表客戶的第幾個特徵) ,可能 x11代表第一位客戶年齡、x12代表第一位客戶年收入、x13 代表第一位客戶的年資,而 y 則代表信用卡公司最終會不會發卡.

我們假設有一個未知的完美個目標函數 f (Zielfunktion), 我們的客戶所有的特徵 x 丟進去出來的就會是實際上最後公司是否會發卡: f(x) = y,而從 f(x ()的目標函數是什麼(有點像統計學中母體的概念).

我們能做的是用現有資料 D ({x11,x12,x13,y1}, {x21,x22,x23,y2}………)練出模型 g(x) 。其中,g(x) 可能包含Ja Antwort:

  1. 客戶年收>1.000.000
  2. 客戶年齡>25
  3. Mindestens 10 Minuten

判條件不確定每一個都能成為 g(x)篩選其中幾個,讓訓練出來的 g(x) 可以越接近完美的f(x)。

這就是機器學習的一個流程概念!



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here