A. 如何使用SAP HANA Vora規劃HANA大數據戰略

從HANA本質來講大家都知道,就是一個資料庫,和Oracle,SQLServer沒啥本質的區別,內存計算、列式存儲也不是啥新玩意,所以學習HANA和學習一個新的資料庫從這個角度看也非常類似,當然HANA有其非常獨特的特性(其實哪個資料庫沒有),其中最重要最本質而且未來會一直延續的特性就是HANA和SAP其他產品之間千絲萬縷的聯系,這一點對學習HANA的人而言會存在一定的挑戰,當然挑戰就意味著機會。HANA的學習路線(roadmap)也可以從其共性和特性出發來設計,下面只是個人的一些設想,僅供參考。1.資料庫DBA大家都知道,行業里無論哪種資料庫一般都存在兩個角色,DBA和Developer,DBA負責資料庫的部署、設計、調試、監控和調優等等各項工作,類似SAP領域的Basis,Developer掌握資料庫的開發語言和邏輯,開發各種資料庫層面的內容。我們先從DBA說起,我本人原來就是做SAPBASIS的,DBA不敢說精通勉強也算了解,HANA的DBA和其他資料庫的DBA本質沒啥區別,但DBA向來是一個需求少但是要求高的角色,一般的DBA大多會和其他角色合並,例如SAP系統的DBA和BASIS就是不分家的,非SAP產品DBA可能和網管或者類似角色合並,只有在很大規模的企業里會有專職DBA存在。HANA的DBA入門不難,但DBA最值錢的部分-性能調優,這個需要靠時間積累和環境的培養,恐怕一時半會除了SAP不太會出現優秀的HANADBA。從這個角度出發,建議大家把HANADBA作為自己必須掌握的技能,除了調優以外的知識都需要儲備。以後出去做HANA,裝個HANA調個參數還需要別人,競爭力就明顯弱了。2.資料庫開發只會開發資料庫的Developer恐怕很難生存,因為目前絕大多數大型應用都不太會綁定某個資料庫,除了一些特殊產品以外,在資料庫層面做的開發都不會太多,絕大多數developer都是兼做資料庫的開發,但HANA不太一樣,由於其內存計算的特性,使用HANA必定要將應用邏輯下沉,這點造成了大量的HANA資料庫開發需求,舉個例子:未來隨著ECConHANA的普及,ECC本身的很多應用邏輯都不一定下沉到HANA重寫,別說客戶自己的定製開發了,而客戶自己的定製開發恰恰又以查詢類為主,光把ABAP報表改寫到HANA的事就夠多的了,加上基於HANA的新的開發,這些預計未來會有較大的需求。3.數據挖掘和分析這是HANA的強項,也是HANA最早版本發布時的目標,想想HANA本身這個名字就明白了。這個角色牽涉的方面很多我只談一下SAP領域的內容。數據分析也好挖掘也好,一般都會有幾個環節,一是獲取源數據,二是模型建立和開發三是展現。對於想從事這方面工作的同學以下產品是需要了解和掌握的:獲取數據:SAP一系列做數據復制的工具產品:SLT,BODS,DXCSybase(目測估計以後不大會用了),甚至第三方的ETL工具模型建立和開發:BW,BOE(包括IDT,Universe)以及關鍵的HANAStudio(其實是指HANA里模型建立和開發的技術),展現:BO的水晶報表,Explorer,dashboard等,或者第三方的展現工具,國外看到過有人用PowerBuilder開發HANA應用的。延伸部分:HANA內置了業務邏輯庫和預測演算法庫,還可以和RLanguage集成,這是數據挖掘領域非常有用的功能。4HANA原生開發HANA最有吸引力也是最有生命力的部分其實在於其原生的開發,HANA內置了一個輕量化的JAVAAppserver,可以開發server端的js,MVC模式的交互界面,甚至移動端的UI。同時和HANA資料庫內嵌集成,性能比外部系統訪問HANA還好。我們看到的SAPHANA的很多有意思的案例都是基於HANA的原生開發,例如NBA,環球帆船大賽,國內的農夫山泉等,這些案例幾乎都和SAP傳統的業務系統沒有任何關系,可以說已經超出了SAP的范疇,真正把HANA當一個平台類的軟體來使用,這里的想像空間是巨大的,同樣涉及到的技術也非常廣泛,例如HANA和開源平台的集成(hadoop)等等。這里個人能力有限,只能大致談一下HANA裡面的開發技術。主要有基於HTML5的SAPUI5界面開發,ServerSideJavaScript的業務邏輯開發,OData/RESTService的數據介面開發以及HANA資料庫本身的開發。建議學習資料:HANAAcademy,SAPHelp,SCNHANA開發專版適用對象:有JAVA開發經驗的開發人員,HANA開發人員以上答案來自於SAP中文學習網。

B. 數據挖掘和大數據、OLAP、數據統計

我們在大數據領域中總是聽說過數據挖掘、OLAP、數據統計等等的專業詞彙。但是很多人對這些詞彙不是很理解,在這篇文章中我們給大家介紹一下數據挖掘與大數據、OLAP、數據統計的相關知識,旨在幫助大家初步地理解這些技術。
1.數據分析的層面
數據分析是一個大的概念,理論上任何對數據進行計算、處理從而得出一些有意義的結論的過程,都叫數據分析。從數據本身的復雜程度、以及對數據進行處理的復雜度和深度來看,可以把數據分析分為4個層次,分別是數據統計、OLAP、數據挖掘、大數據。
2.數據統計
數據統計就是最基本、最傳統的數據分析,自古有之。是指通過統計學方法對數據進行排序、篩選、運算、統計等處理,從而得出一些有意義的結論。
3.OLAP
OLAP就是聯機分析處理(On-Line Analytical Processing,OLAP)是指基於數據倉庫的在線多維統計分析。它允許用戶在線地從多個維度觀察某個度量值,從而為決策提供支持。OLAP更進一步告訴你下一步會怎麼樣,如果我採取這樣的措施又會怎麼樣。
4.數據挖掘
數據挖掘是指從海量數據中找到人們未知的、可能有用的、隱藏的規則,可以通過關聯分析、聚類分析、時序分析等各種演算法發現一些無法通過觀察圖表得出的深層次原因。針對此可以採取有針對性的管理措施。
5.大數據
大數據是指用現有的計算機軟硬體設施難以採集、存儲、管理、分析和使用的超大規模的數據集。大數據具有規模大、種類雜、快速化、價值密度低等特點。大數據的「大」是一個相對概念,沒有具體標准,如果一定要給一個標准,那麼10-100TB通常稱為大數據的門檻。
由此可見,從數據分析的角度來看,目前絕大多數學校的數據應用產品都還處在數據統計和報表分析的階段,能夠實現有效的OLAP分析與數據挖掘的還很少,而能夠達到大數據應用階段的非常少,至少還沒有用過有效的大數據集。
關於數據挖掘與大數據、OLAP、數據統計的相關知識我們就給大家簡單介紹到這里了,其實這些知識並不是我們說的那麼簡單,我們要真正好好理解這些知識才能夠更好地了解數據分析,掌握數據分析。

C. SAP是怎麼利用大數據的

SAP可以記錄整理數據,但是數據的使用和數據挖掘分析需要人為執行,畢竟系統分析的結果比較死板,但是實際的業務是多樣性的,可以做簡單的數據處理,但是深度分析,我認為不可行

D. 大數據挖掘常用的方法有哪些

1. Analytic Visualizations(可視化分析)

不管是對數據分析專家還是普通用戶,數據可視化是數據分析工具最基本的要求。可視化可以直觀的展示數據,讓數據自己說話,讓觀眾聽到結果。

2. Data Mining Algorithms(數據挖掘演算法)
可視化是給人看的,數據挖掘就是給機器看的。集群、分割、孤立點分析還有其他的演算法讓我們深入數據內部,挖掘價值。這些演算法不僅要處理大數據的量,也要處理大數據的速度。

3. Predictive Analytic Capabilities(預測性分析能力)
數據挖掘可以讓分析員更好的理解數據,而預測性分析可以讓分析員根據可視化分析和數據挖掘的結果做出一些預測性的判斷。

4. Semantic Engines(語義引擎)
由於非結構化數據的多樣性帶來了數據分析的新的挑戰,需要一系列的工具去解析,提取,分析數據。語義引擎需要被設計成能夠從「文檔」中智能提取信息。

5. Data Quality and Master Data Management(數據質量和數據管理)

數據質量和數據管理是一些管理方面的最佳實踐。通過標准化的流程和工具對數據進行處理可以保證一個預先定義好的高質量的分析結果。

E. 如何對sap系統收集的大量數據進行分析

這個……太寬泛了吧!而且你提供的數據也並不全面。
你們是生產型企業還是銷售型企業?
你們SAP上線了多少個模塊?
你們業務部門亟待解決的問題是什麼?
你們是否還有其他費SAP的軟體?
你們用的BI系統是SAP的嗎?

F. 大數據和數據挖掘哪個更有發展前途

大數據是包含數據挖掘的,數據挖掘是大數據分支中的一項,也是基礎,學習BI方向的話,數據挖掘是基礎,兩者是息息相關的,數據挖掘的概念出來的比較早,啤酒和尿布的典故你應該知道,早期數據倉庫建模就已經用到了數據挖掘,而大數據是這幾年比較火的,趨勢很好,以後都是大數據時代了,目前很多大型企業都在做大數據(如解決方案供應商:IBM、ORACLE、SAP、EMC、華為等等;自研:淘寶、騰訊等等;甲方:移動、電信等等)擇業前景還是很好的,大數據內容很豐富,有hadoop、流處理、分布式、NAS/SAN等等,對你以後的發展幫助還是比較大的。我的建議是大數據。望點贊。

G. 數據挖掘和SAP有什麼關系

SAP有個工具叫BW,可以做數據挖掘。
SAP太大了,數據挖掘也太廣了,SAP里有數據挖掘,數據挖掘又在SAP有應用。

H. 大數據是什麼如何挖掘

數據挖掘(英語:Data mining),又譯為資料探勘、數據采礦。它是資料庫知識發現(英語:Knowledge-Discovery in Databases,簡稱:KDD)中的一個步驟。數據挖掘一般是指從大量的數據中通過演算法搜索隱藏於其中信息的過程。數據挖掘通常與計算機科學有關,並通過統計、在線分析處理、情報檢索、機器學習、專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現上述目標。

用於分析大數據的工具主要有開源與商用兩個生態圈。
開源大數據生態圈:
1、Hadoop HDFS、HadoopMapRece, HBase、Hive 漸次誕生,早期Hadoop生態圈逐步形成。
2、. Hypertable是另類。它存在於Hadoop生態圈之外,但也曾經有一些用戶。
3、NoSQL,membase、MongoDb
商用大數據生態圈:
1、一體機資料庫/數據倉庫:IBM PureData(Netezza), OracleExadata, SAP Hana等等。
2、數據倉庫:TeradataAsterData, EMC GreenPlum, HPVertica 等等。
3、數據集市:QlikView、 Tableau 、 以及國內的REU-BDS 大數據

I. 大數據,數據挖掘,BI,ERP之間的聯系,主要圍繞ERP,簡明扼要一點

大數來據:是數據基礎自,一切上層皆基於此。大數據,顧名思義,數據量大,會對後面的分析和挖掘造成一定難度。

數據挖掘:在數據基礎上繼續挖掘和分析,挖掘更多的是做分析和預測。

BI:一般是指商業智能工具,可進行數據分析和展示,BI工具可做一定的挖掘工作。

ERP:一般是ERP軟體,結合企業自身業務和平時管理需求定製的企業資源計劃系統。BI工具和數據挖掘工作可以幫助ERP做更多決策支持和分析功能。

大數據如果要進行BI分析,有一定難度,因為BI分析對實時性要求好,最好推薦使用永洪科技的Z-Suite等大數據實時分析BI工具,然後再結合ERP產品,ERP產品選擇面相對寬鬆些,可根據自身情況決定。

J. 大數據挖掘方法有哪些

謝邀。

大數據挖掘的方法:

  • 神經網路方法

神經網路由於本身良好的魯棒性、自組織自適應性、並行處理、分布存儲和高度容錯等特性非常適合解決數據挖掘的問題,因此近年來越來越受到人們的關注。


  • 遺傳演算法

遺傳演算法是一種基於生物自然選擇與遺傳機理的隨機搜索演算法,是一種仿生全局優化方法。遺傳演算法具有的隱含並行性、易於和其它模型結合等性質使得它在數據挖掘中被加以應用。


  • 決策樹方法

決策樹是一種常用於預測模型的演算法,它通過將大量數據有目的分類,從中找到一些有價值的,潛在的信息。它的主要優點是描述簡單,分類速度快,特別適合大規模的數據處理。


  • 粗集方法

粗集理論是一種研究不精確、不確定知識的數學工具。粗集方法有幾個優點:不需要給出額外信息;簡化輸入信息的表達空間;演算法簡單,易於操作。粗集處理的對象是類似二維關系表的信息表。


  • 覆蓋正例排斥反例方法

它是利用覆蓋所有正例、排斥所有反例的思想來尋找規則。首先在正例集合中任選一個種子,到反例集合中逐個比較。與欄位取值構成的選擇子相容則捨去,相反則保留。按此思想循環所有正例種子,將得到正例的規則(選擇子的合取式)。


  • 統計分析方法

在資料庫欄位項之間存在兩種關系:函數關系和相關關系,對它們的分析可採用統計學方法,即利用統計學原理對資料庫中的信息進行分析。可進行常用統計、回歸分析、相關分析、差異分析等。


  • 模糊集方法

即利用模糊集合理論對實際問題進行模糊評判、模糊決策、模糊模式識別和模糊聚類分析。系統的復雜性越高,模糊性越強,一般模糊集合理論是用隸屬度來刻畫模糊事物的亦此亦彼性的。