Begin

上次用C#把《全唐詩》和《唐詩三百首》整理成為QData格式之后,就開始進行各種分析…

詳細內容可以看看上次這篇文章,《用C#來學習唐詩三百首和全唐詩》

接下來講一下分析的內容,由于筆者不是很懂文學和大數據統(tǒng)計什么的,所以只好隨便分析一通,首先分析的有:標題、作者、單字分析、還有詩句字數(也就是“五言”、“七言”)

標題分析

標題分析就是分析有多少首詩采用了某一個標題啦~

首先是《唐詩三百首》

seo優(yōu)化培訓,網絡推廣培訓,網絡營銷培訓,SEM培訓,網絡優(yōu)化,在線營銷培訓

從統(tǒng)計可以看到《子夜四時歌》出現的次數是最多的= =.. 雖然不懂是什么,但覺得蠻厲害的

接下來看看《全唐詩》的分析結果

seo優(yōu)化培訓,網絡推廣培訓,網絡營銷培訓,SEM培訓,網絡優(yōu)化,在線營銷培訓

哇,這下可就厲害了,我的《全唐詩》數據文件中共有42904首詩,雖然不全,不足以稱之為“全”唐詩,但是也勝在基數之大。

從分析結果看到,排名第一的標題是《句》,共有437首詩采用這個標題,看起來就很非主流的一個標題居然深受唐朝文人騷客的喜愛;排名第二的是《古意》,不過這個和第一名的差距可就大了,總共只有39首,可不知道這個”古意“是懷古之意還是古人之意。

作者分析

作者分析就是統(tǒng)計每個詩人總共寫了多少首詩,以及總字數。

先來看看《唐詩三百首》的結果

seo優(yōu)化培訓,網絡推廣培訓,網絡營銷培訓,SEM培訓,網絡優(yōu)化,在線營銷培訓

嗯,不錯,杜甫摘取桂冠。不過《三百首》畢竟是小樣本,真正的還得看大塊頭的。

seo優(yōu)化培訓,網絡推廣培訓,網絡營銷培訓,SEM培訓,網絡優(yōu)化,在線營銷培訓

延伸閱讀

學習是年輕人改變自己的最好方式-Java培訓,做最負責任的教育,學習改變命運,軟件學習,再就業(yè),大學生如何就業(yè),幫大學生找到好工作,lphotoshop培訓,電腦培訓,電腦維修培訓,移動軟件開發(fā)培訓,網站設計培訓,網站建設培訓學習是年輕人改變自己的最好方式