這是數(shù)據(jù)可視化(全彩) 陳為下載,本書從研究者的角度,介紹數(shù)據(jù)可視化的定義、方法、效用和工具,既可作為初學者的領路手冊,也可用于可視化研究和可視化工具使用的參考指南。
數(shù)據(jù)可視化(全彩) 陳為是在確定數(shù)據(jù)可視化為自己研究主題之初,我經(jīng)常上網(wǎng)搜尋相關資料。但是初期的收集經(jīng)常是雜亂無章,缺乏系統(tǒng)規(guī)劃的。以至于我產(chǎn)生了三個困擾我的問題、
1. 信息可視化與數(shù)據(jù)可視化,到底有什么區(qū)別?或者說infographics 與visualization之間有何區(qū)別?
2.data visualization就是數(shù)據(jù)挖掘之后的用于顯示結果的統(tǒng)計圖嗎?
3.曾經(jīng)在知乎上看見某資深程序員直言,數(shù)據(jù)可視化在國內除了折騰一下社交網(wǎng)絡外,沒什么好做的,是這樣嗎?
今年4月以來,我終于有時間仔細研究相關問題。閱讀大量文獻資料,尤其是購買了幾本專著,如《數(shù)據(jù)之美》、《可視化數(shù)據(jù)》、《數(shù)據(jù)可視化之美》、《鮮活的數(shù)據(jù)》、《數(shù)據(jù)可視化實戰(zhàn):使用D3設計交互式圖表》以及一系列數(shù)據(jù)挖掘相關的案例及算法書。但最給我有開闊視野、醍醐灌頂之功效的書,還是這本浙大陳為教授等人編著的大數(shù)據(jù)叢書:數(shù)據(jù)可視化。本來國內可視化領域的專著就極少,市面上基本是國外翻譯書的天下。而我得說這是我目前看過的,最系統(tǒng),最專業(yè)的,涵蓋全面的教材。首先,分類明確,結構清晰;其次用例翔實,資料豐富,2013年編著所以資料很新,且每章都有參考文獻,最后還有一大堆資料連接,簡直是論文寶典;最后,全彩印刷,效果一級棒。之前困擾我的問題。
1. 最好的理解是,數(shù)據(jù)可視化包含信息可視化。信息可視化是數(shù)據(jù)可視化的一個研究分支?梢暬瞧者m性的,而信息圖是具體的?梢暬遣灰驗閮热荻淖兊模畔D則和內容本身有著緊密的聯(lián)系。于是乎,數(shù)據(jù)可視化被劃分了三個分支,分別是科學可視化,信息可視化,可視分析學。這種分類也被諸多權威人士所認可,恰好對應著三個國際會議:IEEE conference on scientific visualization (SciVis),IEEE conference on Information visualization(infoVis),IEEE conference on visual analyticsscience and technology(VAST).
2.本來數(shù)據(jù)挖掘與可視化就是密不可分的。智能數(shù)據(jù)分析所產(chǎn)生的的知識與人類所掌握的知識正是導致新的知識發(fā)現(xiàn)的根源。而表達、分析與檢驗這些差異必須用到人腦智能,必經(jīng)之路是用視覺感知為通道。故而這里涉及到數(shù)據(jù)可視化的另一個分支:可視分析學(Visual Analytics)。不論從何種數(shù)據(jù)分析-可視化模型,都在可視化與數(shù)據(jù)挖掘之間構造了一個循環(huán)——互相影響的螺旋形上升的循環(huán),最終目的是在其中獲取知識。故而數(shù)據(jù)可視化絕不僅僅是用于顯示結果的統(tǒng)計圖,而是結合在整合數(shù)據(jù)分析過程中的不斷迭代的一份子,是與用戶交互的必經(jīng)之路。并且其形式遠超基本統(tǒng)計圖型。
3. 顯然社交網(wǎng)絡只是一個數(shù)據(jù)可視化可以結合的研究點。事實上數(shù)據(jù)可視化是普適的,幾乎可以跟任何學科集合。簡單的羅列我感興趣的方面:文本分析,地理信息位置,數(shù)字生活可視化。