機(jī)器學(xué)習(xí)實(shí)戰(zhàn)-----八大分類器識(shí)別樹葉帶源碼
今天我想送給大家兩句話:1:在這個(gè)浮躁的社會(huì)中,每個(gè)人都想找到捷徑,那么我想認(rèn)真踏實(shí)地做好一件事也便是最大的捷徑了。2:不要管別人做什么,有自己的目標(biāo),可能你現(xiàn)在的環(huán)境牛人多多,讓你壓力巨大,也可能你身處的環(huán)境廢物多多,讓你感慨你本可以讓自己更加強(qiáng)大。不要管這些,只要相信自己選擇的,走下去。
以上獻(xiàn)給迷茫的人們,同時(shí)也自勉。不多說(shuō),進(jìn)入八大分類器。
引言:樹葉有好多種,如下圖:
目標(biāo):寫一個(gè)系統(tǒng),讓系統(tǒng)區(qū)分各種樹葉屬于哪個(gè)品種。
我的思路如下圖:
特征提取:也就是我們前幾張說(shuō)的xi,抽取能代表這個(gè)物體的特征。比如讓你去識(shí)別另外一個(gè)人,一般從臉型,膚色,身高,體重…..這些特征去標(biāo)記,現(xiàn)在計(jì)算機(jī)識(shí)別樹葉可能就從葉子啊,形狀啊,寬度啊,有無(wú)鋸齒啊,這些去識(shí)別。這個(gè)詳細(xì)我們暫時(shí)不說(shuō),下次再說(shuō)。
訓(xùn)練分類器:就是找到一個(gè)有某些特征的樣本,我們只需要對(duì)新來(lái)的特征和前面出現(xiàn)類似的特征進(jìn)行比對(duì),那么找出最可能的類別,我們就說(shuō)這個(gè)新的樣本是屬于這個(gè)類別的。
測(cè)試數(shù)據(jù):當(dāng)這個(gè)模型找出來(lái)了,我們是不是得測(cè)試一下這個(gè)人可不可信對(duì)吧,就好像我們生活中的,有的人酷愛吹牛逼,那么我們對(duì)他說(shuō)的話,是不是就抱著懷疑的態(tài)度?而有的人幾乎很少說(shuō)謊話,那么他說(shuō)的話是不是可信度就大,這個(gè)測(cè)試數(shù)據(jù)就是這個(gè)道理,測(cè)試效果越好,那么這個(gè)模型分類器可能效果就越好。
下面是代碼講解部分,為了方便我先以截圖的形式,呈上代碼,最后用百度云上傳我的數(shù)據(jù)集和源代碼,希望大家學(xué)得愉快。
一 代碼講解
這一段代碼沒什么好說(shuō)的,就是導(dǎo)入matplotlib,pandas,sklearn的這些包.python這個(gè)語(yǔ)言最強(qiáng)大的地方就是可以直接引用別的語(yǔ)言寫的代碼包,其實(shí)python作為一門腳本語(yǔ)言它本身的執(zhí)行速度是很慢的,但是它就像膠水一樣把其他語(yǔ)言實(shí)現(xiàn)的功能粘合起來(lái),那么就很厲害了,類似于劉邦,馭人于千里之外。所以它又叫膠水語(yǔ)言。