大數據分析一般用什麼工具分析

大數據分析的前瞻性使得很多公司以及企業都開始使用大數據分析對公司的決策做出幫助,而大數據分析是去分析海量的數據,所以就不得不藉助一些工具去分析大數據,。一般來說,數據分析工作中都是有很多層次的,這些層次分別是數據存儲層、數據報表層、數據分析層、數據展現層。對於不同的層次是有不同的工具進行工作的。下面小編就對大數據分析工具給大家好好介紹一下。

首先我們從數據存儲來講數據分析的工具。我們在分析數據的時候首先需要存儲數據,數據的存儲是一個非常重要的事情,如果懂得資料庫技術,並且能夠操作好資料庫技術,這就能夠提高數據分析的效率。而數據存儲的工具主要是以下的工具。

1、MySQL資料庫,這個對於部門級或者互聯網的資料庫應用是必要的,這個時候關鍵掌握資料庫的庫結構和SQL語言的數據查詢能力。

2、SQL Server的最新版本,對中小企業,一些大型企業也可以採用SQL Server資料庫,其實這個時候本身除了數據存儲,也包括了數據報表和數據分析了,甚至數據挖掘工具都在其中了。

3、DB2,Oracle資料庫都是大型資料庫了,主要是企業級,特別是大型企業或者對數據海量存儲需求的就是必須的了,一般大型資料庫公司都提供非常好的數據整合應用平台;

接著說數據報表層。一般來說,當企業存儲了數據後,首先要解決報表的問題。解決報表的問題才能夠正確的分析好資料庫。關於數據報表所用到的數據分析工具就是以下的工具。

1、Crystal Report水晶報表,Bill報表,這都是全球最流行的報表工具,非常規范的報表設計思想,早期商業智能其實大部分人的理解就是報表系統,不藉助IT技術人員就可以獲取企業各種信息——報表。

2、Tableau軟體,這個軟體是近年來非常棒的一個軟體,當然它已經不是單純的數據報表軟體了,而是更為可視化的數據分析軟體,因為很多人經常用它來從資料庫中進行報表和可視化分析。

第三說的是數據分析層。這個層其實有很多分析工具,當然我們最常用的就是Excel,我經常用的就是統計分析和數據挖掘工具;

1、Excel軟體,首先版本越高越好用這是肯定的;當然對Excel來講很多人只是掌握了5%Excel功能,Excel功能非常強大,甚至可以完成所有的統計分析工作!但是我也常說,有能力把Excel玩成統計工具不如專門學會統計軟體;

2、SPSS軟體:當前版本是18,名字也改成了PASW Statistics;我從3.0開始Dos環境下編程分析,到現在版本的變遷也可以看出SPSS社會科學統計軟體包的變化,從重視醫學、化學等開始越來越重視商業分析,現在已經成為了預測分析軟體。

最後說表現層的軟體。一般來說表現層的軟體都是很實用的工具。表現層的軟體就是下面提到的內容。

1、PowerPoint軟體:大部分人都是用PPT寫報告。

2、Visio、SmartDraw軟體:這些都是非常好用的流程圖、營銷圖表、地圖等,而且從這里可以得到很多零件;

3、Swiff Chart軟體:製作圖表的軟體,生成的是Flash

② 大數據分析軟體有哪些

大數據分析用什麼分析軟體? 一般基礎數據分析用 excel,origin,功能還是比較強大的,大數據分析用SAS, SPSS,RSA,MATLAB,DPS,EVIEWS, GAUSS, Minitab, Statistica,FineBI,最新的還有採用Hadoop技術。
SAS可以用來設計正交試驗,SAS比SPSS功能多一些,RSA用來作相應面分析,MATLAB是面向矩陣的,可以做很多方面,比如:數值分析,模式識別,優化...裡麵包含了巨豐富的工具箱,小波分析,遺傳演算法等。photoshop當然是必需的,可以修整下圖片,潤色,美化,刪繁存簡。國內帆軟公司的FineBI支持即時分析和多維分析即OLAP。

③ 好用的大數據分析工具

R/SAS/SPSS/MatLab都可以

④ 大數據分析一般用什麼工具呢

雖然數據分析的工具千萬種,綜合起來萬變不離其宗。無非是數據獲取、數據存儲、數據管理、數據計算、數據分析、數據展示等幾個方面。而SAS、R、SPSS、python、excel是被提到頻率最高的數據分析工具。


  • Python

  • Python,是一種面向對象、解釋型計算機程序設計語言。Python語法簡潔而清晰,具有豐富和強大的類庫。它常被昵稱為膠水語言,能夠把用其他語言製作的各種模塊(尤其是C/C++)很輕松地聯結在一起。

    常見的一種應用情形是,使用Python快速生成程序的原型(有時甚至是程序的最終界面),然後對其中有特別要求的部分,用更合適的語言改寫,比如3D游戲中的圖形渲染模塊,性能要求特別高,就可以用C/C++重寫,而後封裝為Python可以調用的擴展類庫。需要注意的是在您使用擴展類庫時可能需要考慮平台問題,某些可能不提供跨平台的實現。

  • R軟體

  • R是一套完整的數據處理、計算和制圖軟體系統。它可以提供一些集成的統計工具,但更大量的是它提供各種數學計算、統計計算的函數,從而使使用者能靈活機動的進行數據分析,甚至創造出符合需要的新的統計計算方法。

  • SPSS

  • SPSS是世界上最早的統計分析軟體,具有完整的數據輸入、編輯、統計分析、報表、圖形製作等功能,能夠讀取及輸出多種格式的文件。

  • Excel

  • 可以進行各種數據的處理、統計分析和輔助決策操作,廣泛地應用於管理、統計財經、金融等眾多領域。

  • SAS軟體

  • SAS把數據存取、管理、分析和展現有機地融為一體。提供了從基本統計數的計算到各種試驗設計的方差分析,相關回歸分析以及多變數分析的多種統計分析過程,幾乎囊括了所有最新分析方法,其分析技術先進,可靠。分析方法的實現通過過程調用完成。許多過程同時提供了多種演算法和選項。

⑤ 常用的大數據分析軟體有哪些

國內的數據分析軟體比較多,大數據分析軟體推薦選擇Smartbi Insight(點擊連鏈接可以直接專免費下載,或者進入屬smartbi.com.cn ,在線體驗使用),定位於前端數據分析,對接各種業務資料庫,數據倉庫和大數據平台,滿足各種數據分析應用需求,如大數據分析,自助探索分析,地圖可視化,移動管理駕駛艙,指揮大屏幕,企業報表平台等。

⑥ 大數據分析工具

1、日誌管理工具Splunk(http://www.splunk.com/)
<img src="https://pic4.mg.com/_b.png" data-rawwidth="1894" data-rawheight="902" class="origin_image zh-lightbox-thumb" width="1894" data-original="https://pic4.mg.com/_r.png">

面向使用的人群主要有:
<img src="https://pic1.mg.com/_b.png" data-rawwidth="841" data-rawheight="366" class="origin_image zh-lightbox-thumb" width="841" data-original="https://pic1.mg.com/_r.png">
Splunk的功能組件主要有Forwarder、Serch Head、Indexer三種,然後支持了查詢搜索、儀表盤和報表(效果真不是吹的,很精緻呀),另外還支持SaaS服務模式。其中,Splunk支持的數據源也是多種類型的,基本上還是可以滿足客戶的需求。
<img src="https://pic1.mg.com/_b.png" data-rawwidth="554" data-rawheight="389" class="origin_image zh-lightbox-thumb" width="554" data-original="https://pic1.mg.com/_r.png">
目前支持Hadoop1.x(MRv1)、Hadoop2.x(MRv2)、Hadoop2.x(Yarn)三個版本的Hadoop集群的日誌數據源收集,在日誌管理運維方面還是處於一個國際領先的地位,目前國內有部分的數據驅動型公司也正在採用Splunk的日誌管理運維服務。
<img src="https://pic3.mg.com/_b.png" data-rawwidth="834" data-rawheight="396" class="origin_image zh-lightbox-thumb" width="834" data-original="https://pic3.mg.com/_r.png">

可視化部分效果也是很不錯的
<img src="https://pic2.mg.com/_b.png" data-rawwidth="554" data-rawheight="260" class="origin_image zh-lightbox-thumb" width="554" data-original="https://pic2.mg.com/_r.png"><img src="https://pic3.mg.com/_b.png" data-rawwidth="554" data-rawheight="259" class="origin_image zh-lightbox-thumb" width="554" data-original="https://pic3.mg.com/_r.png"><img src="https://pic4.mg.com/_b.png" data-rawwidth="554" data-rawheight="258" class="origin_image zh-lightbox-thumb" width="554" data-original="https://pic4.mg.com/_r.png">

2、EverString(Home - EverString)
<img src="https://pic1.mg.com/_b.png" data-rawwidth="479" data-rawheight="159" class="origin_image zh-lightbox-thumb" width="479" data-original="https://pic1.mg.com/_r.png">

everstring主要是通過大數據的預測分析建模為企業提供業務和客戶推薦的SaaS服務,獲取和積累了兩個數據信息資源庫,一個行業外部的資源庫(公有SaaS收費形式),一個行業自己內部的資源庫(私有),然後再通過機器學習和人工智慧的方法對數據進行相應行業或是領域的建模,最後得到一個比較不錯的結果,優化於人工可以得到的結果,而且Everstring也成為了初創大數據公司裡面估值很高的公司。

3、國外的Tableau(http://www.tableau.com/)

可視化界面還是做得不錯的
<img src="https://pic2.mg.com/_b.png" data-rawwidth="660" data-rawheight="407" class="origin_image zh-lightbox-thumb" width="660" data-original="https://pic2.mg.com/_r.png">
<img src="https://pic1.mg.com/_b.png" data-rawwidth="1272" data-rawheight="754" class="origin_image zh-lightbox-thumb" width="1272" data-original="https://pic1.mg.com/_r.png">

可是對於價格還是按需掏腰包吧。
<img src="https://pic3.mg.com/_b.png" data-rawwidth="1603" data-rawheight="847" class="origin_image zh-lightbox-thumb" width="1603" data-original="https://pic3.mg.com/_r.png">

4、國內的大數據魔鏡分析工具(魔鏡—行業領先的大數據可視化分析平台 6.0)
魔鏡的大數據平台主要提供的還是數據清洗和ETL、Hadoop數據倉庫以及一系列的數據分析服務,可提供的數據分析視圖工具類型豐富:
<img src="https://pic1.mg.com/_b.png" data-rawwidth="1256" data-rawheight="688" class="origin_image zh-lightbox-thumb" width="1256" data-original="https://pic1.mg.com/_r.png">

目前國外還時候有很多從事大數據業務的公司,像協助美國CIA找到本拉登的Panlatir,可以預測未來的Recorded Future和,6sence,ETL方向的Etleap,CRM系統方向的Salesforce等,如果說到可視化工具,它應該是大數據處理流程裡面的最後展現環節。

國內有個不錯的鏈接,實屬干貨呀。
盤點:55個最實用大數據可視化分析工具(http://tech.it168.com/a2015/0318/1712/000001712286.shtml

就寫到這里吧,分析的不到位的地方,還請指出,謝謝。

補充
----------------------
剛有人問,哪些是目前國內可以用得到的一些數據科學家分析的工具,正好公司有同事是這方面的專家,請教了下,如下:
1、SPSS:主要用於數據建模工作,功能穩定且強大,能夠滿足中小企業在業務模型建立過程中的需求。
2、BitDeli
BitDeli是今年11月份在舊金山成立的一家初創公司。它能衡量出任何使用Python腳本的應用程序的指標,聯合創始人兼CEO Ville Tuulos告訴Derrick,腳本可以很簡單,也可以很復雜——甚至未來可以延伸到機器學習。不過和「重量級選手」Hadoop相比,BitDeli自認為是一個輕量級的Ruby。
3. Continuuity
Continuuity是前Yahoo首席雲架構師Todd Papaioannou和Facebook HBase的工程師Jonathan Gray的心血結晶,Continuuity想讓所有的公司都能像Yahoo、Facebook一樣運營。該團隊創建了一個大數據工具,它可以簡化Hadoop以及HBase集群的復雜性,而且包含一系列開發套件,旨在幫助程序員開發大數據應用,該平台採用Hadoop技術,允許開發者在防火牆內外對大數據應用軟體進行部署、擴展和管理。公司聯合創始人兼首席執行官Todd Papaioannou表示,作為一家初創企業,Continuuity正在試圖掀起下一波大數據應用軟體的浪潮,公司所提供的工具能夠大大提高處於開發狀態的軟體不同部分與階段的擴展性。
4. Flurry
Flurry是移動應用統計分析領域里的標桿,正因為在行業內獨特的優勢,它每年的營收高達一億美元。Flurry擁有非常全面的功能,不僅僅只是幫助開發者構建移動應用,它還幫助開發者分析所有的數據,進而產生更大的效益。其實數據也支撐了該公司的廣告網路,他們通過數據分析可以幫助開發者推送准確的廣告到需要的用戶面前。不過單純從移動應用的數據統計功能來看,Flurry絕對是處於領先地位。其功能模塊設置合理,分析維度全面,分析流程也易於理解。

⑦ 大數據分析十八般工具

大數據分析,他們對企業的影響有一個興趣高漲。大數據分析是研究大量的數據的過程中尋找模式,相關性和其他有用的信息,可以幫助企業更好地適應變化,並做出更明智的決策。

一、Hadoop

Hadoop是一個開源框架,它允許在整個集群使用簡單編程模型計算機的分布式環境存儲並處理大數據。它的目的是從單一的伺服器到上千台機器的擴展,每一個台機都可以提供本地計算和存儲。

Hadoop 是一個能夠對大量數據進行分布式處理的軟體框架。但是 Hadoop 是以一種可靠、高效、可伸縮的方式進行處理的。Hadoop 是可靠的,即使計算元素和存儲會失敗,它維護多個工作數據副本,確保能夠針對失敗的節點重新分布處理。Hadoop是高效的,它採用並行的方式工作,通過並行處理加快處理速度。Hadoop 還是可伸縮的,能夠處理 PB 級數據。此外,Hadoop 依賴於社區伺服器,因此它的成本比較低,任何人都可以使用。

八、Ambari

大數據平台搭建、監控利器;類似的還有CDH

1、提供Hadoop集群

Ambari為在任意數量的主機上安裝Hadoop服務提供了一個逐步向導。

Ambari處理集群Hadoop服務的配置。

2、管理Hadoop集群

Ambari為整個集群提供啟動、停止和重新配置Hadoop服務的中央管理。

3、監視Hadoop集群

Ambari為監視Hadoop集群的健康狀況和狀態提供了一個儀錶板。

九、Spark

大規模數據處理框架(可以應付企業中常見的三種數據處理場景:復雜的批量數據處理(batch data processing);基於歷史數據的互動式查詢;基於實時數據流的數據處理,Ceph:Linux分布式文件系統。

十、Tableau Public

1、什麼是Tableau Public -大數據分析工具

這是一個簡單直觀的工具。因為它通過數據可視化提供了有趣的見解。Tableau Public的百萬行限制。因為它比數據分析市場中的大多數其他玩家更容易使用票價。使用Tableau的視覺效果,您可以調查一個假設。此外,瀏覽數據,並交叉核對您的見解。

2、Tableau Public的使用

您可以免費將互動式數據可視化發布到Web;無需編程技能;發布到Tableau Public的可視化可以嵌入到博客中。此外,還可以通過電子郵件或社交媒體分享網頁。共享的內容可以進行有效硫的下載。這使其成為最佳的大數據分析工具。

3、Tableau Public的限制

所有數據都是公開的,並且限制訪問的范圍很小;數據大小限制;無法連接到[R ;讀取的唯一方法是通過OData源,是Excel或txt。

十一、OpenRefine

1、什麼是OpenRefine - 數據分析工具

以前稱為GoogleRefine的數據清理軟體。因為它可以幫助您清理數據以進行分析。它對一行數據進行操作。此外,將列放在列下,與關系資料庫表非常相似。

2、OpenRefine的使用

清理凌亂的數據;數據轉換;從網站解析數據;通過從Web服務獲取數據將數據添加到數據集。例如,OpenRefine可用於將地址地理編碼到地理坐標。

3、OpenRefine的局限性

Open Refine不適用於大型數據集;精煉對大數據不起作用

十二、KNIME

1、什麼是KNIME - 數據分析工具

KNIME通過可視化編程幫助您操作,分析和建模數據。它用於集成各種組件,用於數據挖掘和機器學習。

2、KNIME的用途

不要寫代碼塊。相反,您必須在活動之間刪除和拖動連接點;該數據分析工具支持編程語言;事實上,分析工具,例如可擴展運行化學數據,文本挖掘,蟒蛇,和[R 。

3、KNIME的限制

數據可視化不佳

十三、Google Fusion Tables

1、什麼是Google Fusion Tables

對於數據工具,我們有更酷,更大版本的Google Spreadsheets。一個令人難以置信的數據分析,映射和大型數據集可視化工具。此外,Google Fusion Tables可以添加到業務分析工具列表中。這也是最好的大數據分析工具之一。

2、使用Google Fusion Tables

在線可視化更大的表格數據;跨越數十萬行進行過濾和總結;將表與Web上的其他數據組合在一起;您可以合並兩個或三個表以生成包含數據集的單個可視化;

3、Google Fusion Tables的限制

表中只有前100,000行數據包含在查詢結果中或已映射;在一次API調用中發送的數據總大小不能超過1MB。

十四、NodeXL

1、什麼是NodeXL

它是關系和網路的可視化和分析軟體。NodeXL提供精確的計算。它是一個免費的(不是專業的)和開源網路分析和可視化軟體。NodeXL是用於數據分析的最佳統計工具之一。其中包括高級網路指標。此外,訪問社交媒體網路數據導入程序和自動化。

2、NodeXL的用途

這是Excel中的一種數據分析工具,可幫助實現以下方面:

數據導入;圖形可視化;圖形分析;數據表示;該軟體集成到Microsoft Excel 2007,2010,2013和2016中。它作為工作簿打開,包含各種包含圖形結構元素的工作表。這就像節點和邊緣;該軟體可以導入各種圖形格式。這種鄰接矩陣,Pajek .net,UCINet .dl,GraphML和邊緣列表。

3、NodeXL的局限性

您需要為特定問題使用多個種子術語;在稍微不同的時間運行數據提取。

十五、Wolfram Alpha

1、什麼是Wolfram Alpha

它是Stephen Wolfram創建的計算知識引擎或應答引擎。

2、Wolfram Alpha的使用

是Apple的Siri的附加組件;提供技術搜索的詳細響應並解決微積分問題;幫助業務用戶獲取信息圖表和圖形。並有助於創建主題概述,商品信息和高級定價歷史記錄。

3、Wolfram Alpha的局限性

Wolfram Alpha只能處理公開數字和事實,而不能處理觀點;它限制了每個查詢的計算時間;這些數據分析統計工具有何疑問?

十六、Google搜索運營商

1、什麼是Google搜索運營商

它是一種強大的資源,可幫助您過濾Google結果。這立即得到最相關和有用的信息。

2、Google搜索運算符的使用

更快速地過濾Google搜索結果;Google強大的數據分析工具可以幫助發現新信息。

十七、Excel解算器

1、什麼是Excel解算器

Solver載入項是Microsoft Office Excel載入項程序。此外,它在您安裝Microsoft Excel或Office時可用。它是excel中的線性編程和優化工具。這允許您設置約束。它是一種先進的優化工具,有助於快速解決問題。

2、求解器的使用

Solver找到的最終值是相互關系和決策的解決方案;它採用了多種方法,來自非線性優化。還有線性規劃到進化演算法和遺傳演算法,以找到解決方案。

3、求解器的局限性

不良擴展是Excel Solver缺乏的領域之一;它會影響解決方案的時間和質量;求解器會影響模型的內在可解性;

十八、Dataiku DSS

1、什麼是Dataiku DSS

這是一個協作數據科學軟體平台。此外,它還有助於團隊構建,原型和探索。雖然,它可以更有效地提供自己的數據產品。

2、Dataiku DSS的使用

Dataiku DSS - 數據分析工具提供互動式可視化界面。因此,他們可以構建,單擊,指向或使用SQL等語言。

3、Dataiku DSS的局限性

有限的可視化功能;UI障礙:重新載入代碼/數據集;無法輕松地將整個代碼編譯到單個文檔/筆記本中;仍然需要與SPARK集成

相關推薦

大數據分析十八般工具

轉行大數據分析師後悔了

政府利用大數據分析技術的八個黃金案例:智慧政務

⑧ 做大數據分析一般用什麼工具呢

一、Hadoop

Hadoop是一個能夠對大量數據進行分布式處理的軟體框架。但是 Hadoop 是以一種可靠、高效、可伸縮的方式進行處理的。Hadoop 是可靠的,因為它假設計算元素和存儲會失敗,因此它維護多個工作數據副本,確保能夠針對失敗的節點重新分布處理。Hadoop 是高效的,因為它以並行的方式工作,通過並行處理加快處理速度。Hadoop 還是可伸縮的,能夠處理 PB 級數據。此外,Hadoop 依賴於社區伺服器,因此它的成本比較低,任何人都可以使用。

八、EverString

everstring主要是通過大數據的預測分析建模為企業提供業務和客戶推薦的SaaS服務,獲取和積累了兩個數據信息資源庫,一個行業外部的資源庫(公有SaaS收費形式),一個行業自己內部的資源庫(私有),然後再通過機器學習和人工智慧的方法對數據進行相應行業或是領域的建模,最後得到一個比較不錯的結果,優化於人工可以得到的結果,而且Everstring也成為了初創大數據公司裡面估值很高的公司。

⑨ 大數據分析工具推薦

簡單的可以用excel
復雜的用SAS SPSS
再復雜的用編程,Python + pandas