閱讀時間約 5 分鐘

2066 字

我在業界也做了六年 machine learning engineer (雖然職稱都不是這個,不過我覺得工作內容是),在深度學習熱潮起來以前就入行。工作內容包含將商業問題轉換成 機器學習可解的問題並且將解出來的模型跟系統組的同事合作推上線,有時候也要處理 data pipeline。分享一下我認為作為 machine learning engineer 需要的數學能力。

閱讀時間約 3 分鐘

1093 字

Kaggle 做為世界最大的機器學習競賽平台,上面隨時有比賽正在進行,而比賽通常會有獎金。更重要的是,如果想找一個機器學習或資料科學相關的工作,在 Kaggle 拿到好成績可以讓你的履歷加分不少。

閱讀時間約 4 分鐘

1792 字


閱讀時間約 3 分鐘

1099 字

Python line profiler 是一個很方便的套件,讓你很方便看到程式碼逐行執行的時間,用法可以參考拙作關於 Python profiling 的介紹。有一個致命的缺點就是不知道 multiprocess 的 profiling,Github 上也有一個 2016 年留到現在的 issue。我在這裡提供一個 hacky 的作法在 multiprocessing 下使用 line profiler。