來源:http://nirvacana.com/thoughts/becoming-a-data-scientist/,
作者:Swami Chandrasekaran
翻譯:Tacey Wong
數(shù)據(jù)科學(xué)、機器學(xué)習(xí)、大數(shù)據(jù)分析、認知計算……我們都被各種與此相關(guān)的文章、技能需求信息圖表給整崩潰了。有一件事情是可以肯定的:你不可能一夜之間成為數(shù)據(jù)科學(xué)家,它肯定是一個具有挑戰(zhàn)的旅程。但如何才能做到呢?從哪兒開始呢?什么時候才能到達隧道盡頭看到光明?學(xué)習(xí)路線是什么樣的?需要知道什么相關(guān)工具和技術(shù)?如何知道什么時候達到預(yù)期目標(biāo)?
可視化是數(shù)據(jù)科學(xué)中非常重要的一環(huán),諷刺的是我只能找到很少的幾個務(wù)實地說明“成為數(shù)據(jù)科學(xué)家需要什么”的可視化作品。所以這里是我的一個小小嘗試——一個學(xué)習(xí)計劃,可以在你成為一個數(shù)據(jù)科學(xué)家的旅程中使用。我從地鐵地圖獲得靈感,并用它來描繪學(xué)習(xí)的路徑。我將整體計劃逐步納入以下領(lǐng)域:
1.基礎(chǔ)知識
2.統(tǒng)計
3.編程
4.機器學(xué)習(xí)
5.文本挖掘/自然語言處理
6.數(shù)據(jù)可視化
7.大數(shù)據(jù)
8.數(shù)據(jù)提取
9.數(shù)據(jù)清洗/數(shù)據(jù)遷移
工具箱
每個區(qū)域被表示為“地鐵線”,站點代表你必須以漸進的方式學(xué)習(xí)/掌握/理解的主題。你選擇一條線,趕上火車,通過所有車站(主題),直到你到達最終目的地(或)切換到下一個路線。我用1-10逐步標(biāo)記每個車站(線),以指明路徑順序。你可以將此作為個人學(xué)習(xí)計劃,以確定您最想開發(fā)的領(lǐng)域和獲得技能。這絕不是最終目的地,卻可以是一個堅實的開始!