多數交友軟體的機制是:對一個用戶右滑會向他送出配對邀請,左滑則會略過,一旦對方接受邀請雙方就可以開始私訊聊天。因為幫助異性戀配對的交友軟體上通常都是男多女少,所以就有人說男性用戶最佳的配對策略就是無限右滑,先配對到再說。我會以資料科學家角度說明為什麼這不是一個好的策略。
五年前開始定期拿薪水買股票,當時也是上網看了很多資料,主要都是綠角的部落格,應該是不下上千篇。真的拿錢出來還是需要一點時間醞釀,看了一年才真的去開戶買股票。一開始就是買全球大盤市值型 ETF (VT + VGIT),股債八二。很慶幸自己有好的開局,不過五年過去,我開始有不同的想法。
Join
在 SQL 中非常常用,但通常用到的是 inner join
, left join
, right join
, outer join
。這邊介紹什麼是 semi join
與 anti join
,並且用 PySpark
做範例。
將 Firebase 與 Google Analytics 設定好以後,Flutter 可以很方便地送出 screen_view 事件。但必須在每一頁手動加入,找到了一個方法可以在改動最小的情況下每一頁自動送出。
標題用「建立」而非「寫」,是因為有些經歷是需要時間來準備的,像是修一門課至少要半年,如果課程有先修需求就要更久。打一場 Kaggle 機器學習比賽可能要三到六個月,也不是每一次參賽都能夠拿到足以寫在履歷上的成績。有意識地提前建立履歷才能在找工作的時候拿到最多面試。
無意間發現 Y Combinator 有 YouTube 頻道,還有給新創公司創辦人的課程。趁著連假看完了,雖然已經在新創公司工作多年,但還是學到很多東西,有些東西甚至逆轉了我原本的想法。
現在的模型都越來越巨大了,尤其是語言模型。搜尋引擎需要即時回傳結果,手機上的模型只有極小的記憶體以及計算能力,都需要將模型輕量化。ONNX是微軟開發的跨平台機器學習套件,可以將各種框架 (PyTorch、TensorFlow 等等) 的模型轉成 ONNX 格式,並且做輕量化。本文以 PyTorch 模型作為範例,使用 ONNX 將之輕量化,在相似精確度下獲得更小的模型、更快的推論速度。所有程式碼都會放在 GitHub model_quatization 上。
最近讀完 Walter Isaacson 所寫的馬斯克傳,每一個章節都是短短的一個小故事,透過這些故事讓我們了解馬斯克的性格,以及他是如何做到他的所有成就:商業化的電動車、全球領先的自動駕駛、可重複使用的火箭、衛星通訊等等。都是光想就令人卻步的事情,他卻做到了。馬斯克不是一個完美的人,也沒有必要是,我們可以盡可能學習他的工作方法,但不要變得跟他一樣沒同理心。
最近 FIRE (Financial Independent and Retire Early) 很流行,可能大家都很不想上班。不上班的經濟來源就是 4% 法則,但其實這是一個簡化、有陷阱的結果。
很多經濟學研究在討論收入跟快樂程度的關係,這裡不是正經的經濟學部落格,我就不一一介紹了,所以研究部分不會太詳細也不會太精確,主要想聊聊我自己的想法。詳細的研究內容可以看我的參考資料。