由于公司需要進(jìn)行了中文驗(yàn)證碼的圖片識(shí)別開(kāi)發(fā),最近一段時(shí)間剛忙完上線,好不容易閑下來(lái)就繼上篇《基于Windows10 x64+visual Studio2013+Python2.7.12環(huán)境下的Caffe配置學(xué)習(xí) 》文章,記錄下利用caffe進(jìn)行中文驗(yàn)證碼圖片識(shí)別的開(kāi)發(fā)過(guò)程。由于這里主要介紹開(kāi)發(fā)和實(shí)現(xiàn)過(guò)程,CNN理論性的東西這里不作為介紹的重點(diǎn),遇到相關(guān)的概念和術(shù)語(yǔ)請(qǐng)自行研究。目前從我們訓(xùn)練出來(lái)的模型來(lái)看,單字識(shí)別率接近96%,所以一個(gè)四字驗(yàn)證碼的準(zhǔn)確率大概80%,效果還不錯(cuò),完全能滿足使用,如果每張圖片的樣本繼續(xù)加大應(yīng)該能取得更高的準(zhǔn)確率,當(dāng)然隨著樣本的加大,訓(xùn)練時(shí)間也隨之增大,對(duì)硬件設(shè)備要求也越高,還有就是優(yōu)化LeNet網(wǎng)絡(luò)結(jié)構(gòu),目前這里只使用了三層卷積。
(一)開(kāi)發(fā)準(zhǔn)備
(1)開(kāi)發(fā)環(huán)境
軟件環(huán)境:visual Studio2013+Python2.7.12+caffe
硬件環(huán)境:Intel Core i7-4790+GTX1080+RAM32G
(2)訓(xùn)練圖片