AS WE ALL KNOW,學(xué)機(jī)器學(xué)習(xí)的一般都是從python+sklearn開始學(xué),適用于數(shù)據(jù)量不大的場(chǎng)景(這里就別計(jì)較“不大”具體指標(biāo)是啥了,哈哈)
數(shù)據(jù)量大了,就需要用到其他技術(shù)了,如:spark, tensorflow,當(dāng)然也有其他技術(shù),此處略過一坨字...
先來看看如何讓這3個(gè)集成起來吧(WINDOWS環(huán)境):pycharm(python開發(fā)環(huán)境), pyspark.cmd(REPL命令行接口), spark(spark驅(qū)動(dòng)、MASTER等)
download Anaconda, latest version, which 64bit support for windows, 這里必須安裝64位版本的Anaconda,因?yàn)楹竺鎡ensorflow只支持64位的
https://www.continuum.io/downloads/
安裝Anaconda,都是默認(rèn)選項(xiàng)就行