冷啟動問題 如何構建你的機器學習組合?

2021-09-17 04:58:50 字數 2641 閱讀 3955

作為即將告別大學的機器學習畢業狗的你,會不會有種迷茫的感覺?你知道 hr 最看重的是什麼嗎?在求職季到來之前,畢業狗要怎麼做,才能受到 hr 的青睞、拿到心儀的 offer 呢?負責幫助應屆生找到機器學習工作的 edouard harris 給我們分享了他見到的例子和觀點,希望對面臨就業壓力不斷增大的畢業狗們有點用!

我是一名物理學家,在 yc 初創公司工作。我們的工作是幫助應屆畢業生找到他們的第乙份機器學習工作。

前段時間,我曾寫了一篇文章《the cold start problem: how to break into machine learning》(《冷啟動問題:如何順利進入機器學習》),闡述了為得到第乙份機器學習的工作,你應該做哪些事情。我在那篇文章中說過,你應該做的一件事就是,建立個人機器學習專案的投資組合。但我漏了這一部分:如何才能做到。因此,在這篇文章中,我將闡述應該如何去做這件事。[1]

得益於我們的初創公司所做的事情,我才能看到如此多的個人專案的例子。這些個人專案有非常優秀的,也有非常槽糕的。讓我給你例舉兩個非常優秀的例子。

下面是一則真實的故事,不過,為了保護個人隱私,我使用了化名。

當雜貨店需要訂購新庫存時,x 公司就會使用人工智慧來提醒雜貨店。我們有一名學生,叫 ron,他非常渴望能夠在 x 公司工作,已經急不可耐了。為了確保能夠得到 x 公司的面試機會,於是,他建立了乙個個人專案。

通常情況下,我們不會建議像 ron 那樣把所有的賭注都押在一家公司。如果你剛開始這樣做的話,是很有風險的。但是,就像我剛才說的,ron 真的特別想到 x 公司工作,特別特別想。

那麼,ron 做了什麼呢?

紅框處表示該處缺少商品。

ron 用膠帶將他的智慧型手機綁在購物車上。然後,他推著購物車在雜貨店的過道來來回回地走,同時使用手機的攝像頭記錄下過道的情況。他在不同的雜貨店這樣做了 10~12 次。

回到家後,ron 就開始構建機器學習模型。他的模型識別出了雜貨店貨架上的空白處,那是貨架上缺少玉公尺片(或其他商品)的地方。

特別棒的是,ron 在 github 上實時構建了他的模型,完全公開。每天,他都會改進他的 repo(提高準確性,並記錄 repo 自述檔案的變更)。

當 x 公司發現 ron 正在做這件事時,非常感興趣。不止是好奇,事實上,x 公司還有點緊張。他們為什麼會感到緊張呢?因為 ron 無意中在幾天內複製了他們的專有技術棧的一部分。[2]

x 公司的能力很強,他們的技術在行業中無出其右。儘管如此,4 天之內,ron 的專案還是成功吸引了 x 公司 ceo 的注意力。

這是另一則真實的故事。

alex 主修歷史專業,輔修俄語(這是真實的情況)。不同尋常的是,作為歷史專業的大學生,他居然對機器學習產生了興趣。更不尋常的是,他決定學習 python,要知道,他從來沒用 python 寫過一行**。

以下是 alex 在幾個月的時間裡所做的事情:

alex構建的地球引力引發昏厥探測器的演示。

alex 為這些影象構建了乙個資料管道,可以將飛行員從駕駛艙背景中摳出來,這樣分類器就能更容易專注於飛行員。最後,他構建了自己的昏厥分類器。

在做這些事的同時,alex 在社交**上向招聘主管展示了他的專案快照。每次

他拿出手機展示這個專案時,他們都會問他是怎麼做到的,構建的管道是怎麼回事,以及怎麼收集資料的等等。但從來沒有人問過他的模型的準確度如何,要知道,這個模型的準確度就從來沒超過 50%。

當然,alex 早就計畫提高模型的準確性,但是在他還沒有實現這一計畫時就已經被錄用了。事實證明,對企業而言,他那個專案呈現出來的視覺衝擊力,以及在資料收集方面表現出來的不屈不撓的精神和足智多謀,遠比他的模型究竟有多好來得更為重要。

我剛才有沒有提到 alex 是一名主修歷史,輔修俄語的學生?

是什麼讓 ron 和 alex 如此成功?以下是他們做對的四件大事:

ron 和 alex 並沒有在建模上耗費太多的精力。我知道這聽上去很奇怪,但是對於現在的許多用例來說,建模是乙個已解決的問題。在實際工作中,除非你做的是最先進的人工智慧研究,否則無論如何,你都需要耗費 80~90% 的時間來清理資料。為什麼你的個人專案會有所不同呢?

ron 和 alex 營造了視覺化效果。面試,並不能讓無所不知的面試官能夠客觀地評估你的技能。面試的本質就是將自己推薦給他人。人類是視覺動物,因此,如果你掏出手機給面試官展示你所做的東西,那麼,確保你做的東西看上去很有趣是值得的。

ron 和 alex 所做的事情,看上去似乎太多了,但實際上,他們所做的事兒並不比你在實際工作中所期望的多多少。這就是問題的關鍵:當你沒有做某件事的工作經驗時,招聘經理會看你做過的類似做某件事的工作經驗。

幸運的是,你只需在這個級別上,構建一兩個專案就可以了——ron 和 alex 的專案在他們各自所有面試中被反覆使用。

因此,如果讓我必須用一句話來總結乙個卓越的機器學習專案的秘訣,那就是:用有趣的資料集去構建專案,這個資料集顯然需要耗費大量精力來收集,並使其盡可能有視覺衝擊力。

[1] 如果你想知道為什麼這一點非常重要,那是因為招聘經理會檢視你的業績記錄來評估你的技能。如果你沒有業績記錄的話,那麼,個人專案就是最為接近的替代者。

冷啟動問題 如何構建你的機器學習組合?

n 作為即將告別大學的機器學習畢業狗的你,會不會有種迷茫的感覺?你知道 hr 最看重的是什麼嗎?在求職季到來之前,畢業狗要怎麼做,才能受到 hr 的青睞 拿到心儀的 offer 呢?負責幫助應屆生找到機器學習工作的 edouard harris 給我們分享了他見到的例子和觀點,希望對面臨就業壓力不斷...

冷啟動問題 如何構建你的機器學習組合?

n 作為即將告別大學的機器學習畢業狗的你,會不會有種迷茫的感覺?你知道 hr 最看重的是什麼嗎?在求職季到來之前,畢業狗要怎麼做,才能受到 hr 的青睞 拿到心儀的 offer 呢?負責幫助應屆生找到機器學習工作的 edouard harris 給我們分享了他見到的例子和觀點,希望對面臨就業壓力不斷...

冷啟動問題 如何構建你的機器學習組合?

作為即將告別大學的機器學習畢業狗的你,會不會有種迷茫的感覺?你知道 hr 最看重的是什麼嗎?在求職季到來之前,畢業狗要怎麼做,才能受到 hr 的青睞 拿到心儀的 offer 呢?負責幫助應屆生找到機器學習工作的 edouard harris 給我們分享了他見到的例子和觀點,希望對面臨就業壓力不斷增大...