以下內(nèi)容來源于一次部門內(nèi)部的分享,主要針對AI初學者,介紹包括CNN、Deep Q Network以及TensorFlow平臺等內(nèi)容。由于筆者并非深度學習算法研究者,因此以下更多從應用的角度對整個系統(tǒng)進行介紹,而不會進行詳細的公式推導。
** 關(guān)于Flappy Bird **
Flappy Bird(非官方譯名:笨鳥先飛)是一款2013年鳥飛類游戲,由越南河內(nèi)獨立游戲開發(fā)者阮哈東(Dong Nguyen)開發(fā),另一個獨立游戲開發(fā)商GEARS Studios發(fā)布。—— 以上內(nèi)來自《維基百科》
Flappy Bird操作簡單,通過點擊手機屏幕使Bird上升,穿過柱狀障礙物之后得分,碰到則游戲結(jié)束。由于障礙物高低不等,控制Bird上升和下降需要反應快并且靈活,要得到較高的分數(shù)并不容易,筆者目前最多得過10分。
本文主要介紹如何通過AI(人工智能)的方式玩Flappy Bird游戲,分為以下四個部分內(nèi)容:
Flappy Bird 游戲展示
模型:卷積神經(jīng)網(wǎng)絡
算法:Deep Q Network
代碼:TensorFlow實現(xiàn)
一、Flappy Bird 游戲展示
在介紹模型、算法前先來直接看下效果,上圖是剛開始訓練的時候,畫面中的小鳥就像無頭蒼蠅一樣亂飛,下圖展示的是在本機(后面會給出配置)訓練超過10小時后(訓練步數(shù)超過2000000)的情況,其最好成績已經(jīng)超過200分,人類玩家已基本不可能超越。
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動安全 [無線安全]玩轉(zhuǎn)無線電——不安全的藍牙鎖 2017-07-26
- 消息隊列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標分割】 2017-07-26
- 詞向量-LRWE模型-更好地識別反義詞同義詞 2017-07-26
- 從棧不平衡問題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
- 阿里移動安全 Android端惡意鎖屏勒索應用分析 2017-07-26
- 集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來看看(二) 2017-07-26