A. 如何使用SAP HANA Vora规划HANA大数据战略

从HANA本质来讲大家都知道,就是一个数据库,和Oracle,SQLServer没啥本质的区别,内存计算、列式存储也不是啥新玩意,所以学习HANA和学习一个新的数据库从这个角度看也非常类似,当然HANA有其非常独特的特性(其实哪个数据库没有),其中最重要最本质而且未来会一直延续的特性就是HANA和SAP其他产品之间千丝万缕的联系,这一点对学习HANA的人而言会存在一定的挑战,当然挑战就意味着机会。HANA的学习路线(roadmap)也可以从其共性和特性出发来设计,下面只是个人的一些设想,仅供参考。1.数据库DBA大家都知道,行业里无论哪种数据库一般都存在两个角色,DBA和Developer,DBA负责数据库的部署、设计、调试、监控和调优等等各项工作,类似SAP领域的Basis,Developer掌握数据库的开发语言和逻辑,开发各种数据库层面的内容。我们先从DBA说起,我本人原来就是做SAPBASIS的,DBA不敢说精通勉强也算了解,HANA的DBA和其他数据库的DBA本质没啥区别,但DBA向来是一个需求少但是要求高的角色,一般的DBA大多会和其他角色合并,例如SAP系统的DBA和BASIS就是不分家的,非SAP产品DBA可能和网管或者类似角色合并,只有在很大规模的企业里会有专职DBA存在。HANA的DBA入门不难,但DBA最值钱的部分-性能调优,这个需要靠时间积累和环境的培养,恐怕一时半会除了SAP不太会出现优秀的HANADBA。从这个角度出发,建议大家把HANADBA作为自己必须掌握的技能,除了调优以外的知识都需要储备。以后出去做HANA,装个HANA调个参数还需要别人,竞争力就明显弱了。2.数据库开发只会开发数据库的Developer恐怕很难生存,因为目前绝大多数大型应用都不太会绑定某个数据库,除了一些特殊产品以外,在数据库层面做的开发都不会太多,绝大多数developer都是兼做数据库的开发,但HANA不太一样,由于其内存计算的特性,使用HANA必定要将应用逻辑下沉,这点造成了大量的HANA数据库开发需求,举个例子:未来随着ECConHANA的普及,ECC本身的很多应用逻辑都不一定下沉到HANA重写,别说客户自己的定制开发了,而客户自己的定制开发恰恰又以查询类为主,光把ABAP报表改写到HANA的事就够多的了,加上基于HANA的新的开发,这些预计未来会有较大的需求。3.数据挖掘和分析这是HANA的强项,也是HANA最早版本发布时的目标,想想HANA本身这个名字就明白了。这个角色牵涉的方面很多我只谈一下SAP领域的内容。数据分析也好挖掘也好,一般都会有几个环节,一是获取源数据,二是模型建立和开发三是展现。对于想从事这方面工作的同学以下产品是需要了解和掌握的:获取数据:SAP一系列做数据复制的工具产品:SLT,BODS,DXCSybase(目测估计以后不大会用了),甚至第三方的ETL工具模型建立和开发:BW,BOE(包括IDT,Universe)以及关键的HANAStudio(其实是指HANA里模型建立和开发的技术),展现:BO的水晶报表,Explorer,dashboard等,或者第三方的展现工具,国外看到过有人用PowerBuilder开发HANA应用的。延伸部分:HANA内置了业务逻辑库和预测算法库,还可以和RLanguage集成,这是数据挖掘领域非常有用的功能。4HANA原生开发HANA最有吸引力也是最有生命力的部分其实在于其原生的开发,HANA内置了一个轻量化的JAVAAppserver,可以开发server端的js,MVC模式的交互界面,甚至移动端的UI。同时和HANA数据库内嵌集成,性能比外部系统访问HANA还好。我们看到的SAPHANA的很多有意思的案例都是基于HANA的原生开发,例如NBA,环球帆船大赛,国内的农夫山泉等,这些案例几乎都和SAP传统的业务系统没有任何关系,可以说已经超出了SAP的范畴,真正把HANA当一个平台类的软件来使用,这里的想象空间是巨大的,同样涉及到的技术也非常广泛,例如HANA和开源平台的集成(hadoop)等等。这里个人能力有限,只能大致谈一下HANA里面的开发技术。主要有基于HTML5的SAPUI5界面开发,ServerSideJavaScript的业务逻辑开发,OData/RESTService的数据接口开发以及HANA数据库本身的开发。建议学习资料:HANAAcademy,SAPHelp,SCNHANA开发专版适用对象:有JAVA开发经验的开发人员,HANA开发人员以上答案来自于SAP中文学习网。

B. 数据挖掘和大数据、OLAP、数据统计

我们在大数据领域中总是听说过数据挖掘、OLAP、数据统计等等的专业词汇。但是很多人对这些词汇不是很理解,在这篇文章中我们给大家介绍一下数据挖掘与大数据、OLAP、数据统计的相关知识,旨在帮助大家初步地理解这些技术。
1.数据分析的层面
数据分析是一个大的概念,理论上任何对数据进行计算、处理从而得出一些有意义的结论的过程,都叫数据分析。从数据本身的复杂程度、以及对数据进行处理的复杂度和深度来看,可以把数据分析分为4个层次,分别是数据统计、OLAP、数据挖掘、大数据。
2.数据统计
数据统计就是最基本、最传统的数据分析,自古有之。是指通过统计学方法对数据进行排序、筛选、运算、统计等处理,从而得出一些有意义的结论。
3.OLAP
OLAP就是联机分析处理(On-Line Analytical Processing,OLAP)是指基于数据仓库的在线多维统计分析。它允许用户在线地从多个维度观察某个度量值,从而为决策提供支持。OLAP更进一步告诉你下一步会怎么样,如果我采取这样的措施又会怎么样。
4.数据挖掘
数据挖掘是指从海量数据中找到人们未知的、可能有用的、隐藏的规则,可以通过关联分析、聚类分析、时序分析等各种算法发现一些无法通过观察图表得出的深层次原因。针对此可以采取有针对性的管理措施。
5.大数据
大数据是指用现有的计算机软硬件设施难以采集、存储、管理、分析和使用的超大规模的数据集。大数据具有规模大、种类杂、快速化、价值密度低等特点。大数据的“大”是一个相对概念,没有具体标准,如果一定要给一个标准,那么10-100TB通常称为大数据的门槛。
由此可见,从数据分析的角度来看,目前绝大多数学校的数据应用产品都还处在数据统计和报表分析的阶段,能够实现有效的OLAP分析与数据挖掘的还很少,而能够达到大数据应用阶段的非常少,至少还没有用过有效的大数据集。
关于数据挖掘与大数据、OLAP、数据统计的相关知识我们就给大家简单介绍到这里了,其实这些知识并不是我们说的那么简单,我们要真正好好理解这些知识才能够更好地了解数据分析,掌握数据分析。

C. SAP是怎么利用大数据的

SAP可以记录整理数据,但是数据的使用和数据挖掘分析需要人为执行,毕竟系统分析的结果比较死板,但是实际的业务是多样性的,可以做简单的数据处理,但是深度分析,我认为不可行

D. 大数据挖掘常用的方法有哪些

1. Analytic Visualizations(可视化分析)

不管是对数据分析专家还是普通用户,数据可视化是数据分析工具最基本的要求。可视化可以直观的展示数据,让数据自己说话,让观众听到结果。

2. Data Mining Algorithms(数据挖掘算法)
可视化是给人看的,数据挖掘就是给机器看的。集群、分割、孤立点分析还有其他的算法让我们深入数据内部,挖掘价值。这些算法不仅要处理大数据的量,也要处理大数据的速度。

3. Predictive Analytic Capabilities(预测性分析能力)
数据挖掘可以让分析员更好的理解数据,而预测性分析可以让分析员根据可视化分析和数据挖掘的结果做出一些预测性的判断。

4. Semantic Engines(语义引擎)
由于非结构化数据的多样性带来了数据分析的新的挑战,需要一系列的工具去解析,提取,分析数据。语义引擎需要被设计成能够从“文档”中智能提取信息。

5. Data Quality and Master Data Management(数据质量和数据管理)

数据质量和数据管理是一些管理方面的最佳实践。通过标准化的流程和工具对数据进行处理可以保证一个预先定义好的高质量的分析结果。

E. 如何对sap系统收集的大量数据进行分析

这个……太宽泛了吧!而且你提供的数据也并不全面。
你们是生产型企业还是销售型企业?
你们SAP上线了多少个模块?
你们业务部门亟待解决的问题是什么?
你们是否还有其他费SAP的软件?
你们用的BI系统是SAP的吗?

F. 大数据和数据挖掘哪个更有发展前途

大数据是包含数据挖掘的,数据挖掘是大数据分支中的一项,也是基础,学习BI方向的话,数据挖掘是基础,两者是息息相关的,数据挖掘的概念出来的比较早,啤酒和尿布的典故你应该知道,早期数据仓库建模就已经用到了数据挖掘,而大数据是这几年比较火的,趋势很好,以后都是大数据时代了,目前很多大型企业都在做大数据(如解决方案供应商:IBM、ORACLE、SAP、EMC、华为等等;自研:淘宝、腾讯等等;甲方:移动、电信等等)择业前景还是很好的,大数据内容很丰富,有hadoop、流处理、分布式、NAS/SAN等等,对你以后的发展帮助还是比较大的。我的建议是大数据。望点赞。

G. 数据挖掘和SAP有什么关系

SAP有个工具叫BW,可以做数据挖掘。
SAP太大了,数据挖掘也太广了,SAP里有数据挖掘,数据挖掘又在SAP有应用。

H. 大数据是什么如何挖掘

数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

用于分析大数据的工具主要有开源与商用两个生态圈。
开源大数据生态圈:
1、Hadoop HDFS、HadoopMapRece, HBase、Hive 渐次诞生,早期Hadoop生态圈逐步形成。
2、. Hypertable是另类。它存在于Hadoop生态圈之外,但也曾经有一些用户。
3、NoSQL,membase、MongoDb
商用大数据生态圈:
1、一体机数据库/数据仓库:IBM PureData(Netezza), OracleExadata, SAP Hana等等。
2、数据仓库:TeradataAsterData, EMC GreenPlum, HPVertica 等等。
3、数据集市:QlikView、 Tableau 、 以及国内的REU-BDS 大数据

I. 大数据,数据挖掘,BI,ERP之间的联系,主要围绕ERP,简明扼要一点

大数来据:是数据基础自,一切上层皆基于此。大数据,顾名思义,数据量大,会对后面的分析和挖掘造成一定难度。

数据挖掘:在数据基础上继续挖掘和分析,挖掘更多的是做分析和预测。

BI:一般是指商业智能工具,可进行数据分析和展示,BI工具可做一定的挖掘工作。

ERP:一般是ERP软件,结合企业自身业务和平时管理需求定制的企业资源计划系统。BI工具和数据挖掘工作可以帮助ERP做更多决策支持和分析功能。

大数据如果要进行BI分析,有一定难度,因为BI分析对实时性要求好,最好推荐使用永洪科技的Z-Suite等大数据实时分析BI工具,然后再结合ERP产品,ERP产品选择面相对宽松些,可根据自身情况决定。

J. 大数据挖掘方法有哪些

谢邀。

大数据挖掘的方法:

  • 神经网络方法

神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。


  • 遗传算法

遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法,是一种仿生全局优化方法。遗传算法具有的隐含并行性、易于和其它模型结合等性质使得它在数据挖掘中被加以应用。


  • 决策树方法

决策树是一种常用于预测模型的算法,它通过将大量数据有目的分类,从中找到一些有价值的,潜在的信息。它的主要优点是描述简单,分类速度快,特别适合大规模的数据处理。


  • 粗集方法

粗集理论是一种研究不精确、不确定知识的数学工具。粗集方法有几个优点:不需要给出额外信息;简化输入信息的表达空间;算法简单,易于操作。粗集处理的对象是类似二维关系表的信息表。


  • 覆盖正例排斥反例方法

它是利用覆盖所有正例、排斥所有反例的思想来寻找规则。首先在正例集合中任选一个种子,到反例集合中逐个比较。与字段取值构成的选择子相容则舍去,相反则保留。按此思想循环所有正例种子,将得到正例的规则(选择子的合取式)。


  • 统计分析方法

在数据库字段项之间存在两种关系:函数关系和相关关系,对它们的分析可采用统计学方法,即利用统计学原理对数据库中的信息进行分析。可进行常用统计、回归分析、相关分析、差异分析等。


  • 模糊集方法

即利用模糊集合理论对实际问题进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析。系统的复杂性越高,模糊性越强,一般模糊集合理论是用隶属度来刻画模糊事物的亦此亦彼性的。