藏字閣

閱讀時間約 3 分鐘

1093 字

Kaggle 做為世界最大的機器學習競賽平台,上面隨時有比賽正在進行,而比賽通常會有獎金。更重要的是,如果想找一個機器學習或資料科學相關的工作,在 Kaggle 拿到好成績可以讓你的履歷加分不少。

什麼是 Kaggle

Kaggle 是世界最大的機器學習競賽平台,一開始是澳洲公司,2017 年被 Google 收購。在競賽頁面隨時可以看到有比賽正在進行。在 Kaggle 比賽上拿到好成績的話,是全世界都認可的。

有點像機器學習的 Leetcode,不過除了可以練習以外,Kaggle 比賽的好成績寫在履歷上是廣泛被認可的,不像 Leetcode 刷再多題寫履歷上也沒有人看。特別是想要轉領域的人,沒辦法回學校念一個學位發論文,也沒有機會得到相關工作經驗,最平易近人的方式就是上 Kaggle 打一個好成績。這個成績就可以當作往機器學習或資料科學工作的敲門磚。

比賽類別

如果到比賽頁面,可以看到一個 All Categories 的下拉選單,點選以後可以看到比賽有幾個類別 (介紹常見的幾個):

  1. Featured:通常是由企業主辦,獎金也會比較高。
  2. Research:通常是學術機構或是學術會議主辦,獎金通常比較少。
  3. Playground:通常是 Kaggle 自己舉辦的,通常沒有獎金只有小獎品,成績也不會計入排名。

一般只有有獎金且成績會計入排名的比賽 (Featured 或 Research) 放到履歷上大家才會認可。畢竟這種比賽難度才高,得獎才表示你很厲害。

比賽的進行方式

比賽一般來說會進行兩到三個月,可以組隊或是個人參加。他會有兩組資料,train 跟 test。train 都會有答案,讓你訓練模型用的,訓練完以後對 test 每一筆資料做預測,以 test 預測得到的分數決定排名。

test 資料會再分成 public、private 兩部份,但你不會知道是怎麼分的。每次上傳預測結果都可以看到其中 public 的部份的分數跟排名,但是最終名次是由 private 部份決定的。

最後,依據參賽人數的不同,大概前十名可以拿到金牌,前五十名可以拿到銀牌,前一百名可以拿到銅牌。參賽人數越多獎牌越多,反之則越少。詳情可以看官網說明。大致上來說,有獎牌的成績寫在履歷上就是加分了。

深度學習的比賽

通常深度學習的比賽需要有 GPU 才有足夠的運算資源參賽。一般人可能不太會特地去買有 GPU 的電腦,所以 Kaggle 很貼心地提供了免費 GPU 讓大家使用。只要是在 Kaggle 網站上提供的界面寫程式,就可以用 Kaggle 的 GPU 執行,唯一要注意的是用量是有限制的,每週只能跑幾十個小時。

如果用完了,還有 Google Colab,一樣可以免費地使用 GPU,限制是瀏覽器要一直開著。只能日常使用,如果 Google 偵測到你開始跑以後就跑去睡覺,用太多資源的時候,他就會停掉你的程式。不過預算有限的話算是一個堪用的選擇。

非深度學習的比賽

非深度學習的比賽就不用擔心 GPU 的資源了,資料不太大的話,通常一般的筆記型電腦都可以跑得動模型。

參考資料

  1. Kaggle 官網競賽頁面
comments powered by Disqus

最新文章

分類

標籤