scikit-learn官網:http://scikit-learn.org/stable/

通常情況下,一個學習問題會包含一組學習樣本數據,計算機通過對樣本數據的學習,嘗試對未知數據進行預測。

學習問題一般可以分為:

  • 監(jiān)督學習(supervised learning)

    • 分類(classification)

    • 回歸(regression)

  • 非監(jiān)督學習(unsupervised learning)

    • 聚類(clustering)

監(jiān)督學習和非監(jiān)督學習的區(qū)別就是,監(jiān)督學習中,樣本數據會包含要預測的標簽(label),例如給定一組貓和狗的圖片并對不同的照片給定對應的標簽(貓或狗),而非監(jiān)督學習只會給定一組圖片,并不會給出標簽。

分類和回歸的區(qū)別是,分類的樣本數據中的標簽有大于等于2種,對于預測數據只需要判斷屬于其中哪個類即可,而回歸則是期望輸出由一個或多個連續(xù)的變量組成,例如根據魚的年齡和重量推斷魚的長度。

網友評論