大数据数据库有哪些

分享10个超好用的数据库:
1、CouchDB
CouchDB是一款完全拥抱互联网的数据库,它将数据存储在文档中,这种文档可以通过Web浏览器来查询,并且用JavaScript来处理。它易于使用,在分布式上网络上具有高可用性和高扩展性。支持的操作系统:Windows、Linux、OS X和安卓。
2、Blazegraph
Blazegraph是一种高度扩展、高性能的数据库。它既有使用开源许可证的版本,也有使用商业许可证的版本。
3、Cassandra
Cassandra数据库最初由Facebook开发,现已被1500多家企业组织使用,它能支持超大规模集群;比如 说,苹果部署的Cassandra系统就包括75000多个节点,拥有的数据量超过10 PB。
4、FlockDB
FlockDB是一种非常快、扩展性非常好的图形数据库,擅长存储社交网络数据。虽然这个项目的开源版已有一段时间没有更新了,但它仍可用于下载。
5、Neo4j
Neo4j是速度快、扩展性佳的原生图形数据库,它具有大规模扩展性、快速的密码查询性能和经过改进的开发效率。支持的操作系统:Windows和Linux。
6、Pivotal Greenplum Database
Greenplum是同类中不错的企业级分析数据库,能够非常快速地对庞大的海量数据进行功能强大的分析。它是Pivotal大数据库套件的一部分。支持的操作系统:Windows、Linux和OS X。
7、Impala
Cloudera基于SQL的Impala数据库是面向Apache Hadoop的开源分析数据库。它可以作为一款独立产品来下载,又是Cloudera的商业大数据产品的一部分。支持的操作系统:Linux和OS X。
8、InfoBright社区版
InfoBright为数据分析而设计,这是一种面向列的数据库,具有很高的压缩比。InfoBright.com提供基于同一代码的收费产品,提供支持服务。支持的操作系统:Windows和Linux。
9、Hibari
这个基于Erlang的项目是一种分布式有序键值存储系统,有很强的一致性。它最初是由Gemini Mobile Technologies开发的,现在已被欧洲和亚洲的几家电信运营商所使用。支持的操作系统:与操作系统无关。
10、MongoDB
mongoDB的下载量已超过1000万人次,是一款极其受欢迎的NoSQL数据库。MongoDB.com上提供了企业版、支持、培训及相关产品和服务。支持的操作系统:Windows、Linux、OS X和Solaris。

㈡ 大数据用什么数据库

大数据现在通常采用的都是云数据库。

㈢ 数据库大数据

传统数据库处理大数据很困难吧,不建议使用传统数据库来处理大数据。
建议研究下,Hadoop,Hive等,可处理大数据。
如果有预算,可以使用一些商业大数据产品,国内的譬如永洪科技的大数据BI产品,不仅能高性能处理大数据,还可做数据分析。

当然如果是简单的查询,传统数据库如果做好索引,可能可以提高性能。

㈣ 数据库有几大厂商

一、开放性

1. SQL Server

只能在windows上运行,没有丝毫的开放性,操作系统的系统的稳定对数据库是十分重要的。Windows9X系列产品是偏重于桌面应用,NT server只适合中小型企业。而且windows平台的可靠性,安全性和伸缩性是非常有限的。它不象unix那样久经考验,尤其是在处理大数据库。

2. Oracle

能在所有主流平台上运行(包括 windows)。完全支持所有的工业标准。采用完全开放策略。可以使客户选择最适合的解决方案。对开发商全力支持。

3. Sybase ASE

能在所有主流平台上运行(包括 windows)。 但由于早期Sybase与OS集成度不高,因此VERSION11.9.2以下版本需要较多OS和DB级补丁。在多平台的混合环境中,会有一定问题。

4. DB2

能在所有主流平台上运行(包括windows)。最适于海量数据。DB2在企业级的应用最为广泛,在全球的500家最大的企业中,几乎85%以上用DB2数据库服务器,而国内到97年约占5%。

二、可伸缩性,并行性

1. SQL server

并行实施和共存模型并不成熟,很难处理日益增多的用户数和数据卷,伸缩性有限。

2. Oracle

并行服务器通过使一组结点共享同一簇中的工作来扩展windownt的能力,提供高可用性和高伸缩性的簇的解决方案。如果windowsNT不能满足需要,用户可以把数据库移到UNIX中。Oracle的并行服务器对各种UNIX平台的集群机制都有着相当高的集成度。

3. Sybase ASE

虽然有DB SWITCH来支持其并行服务器,但DB SWITCH在技术层面还未成熟,且只支持版本12.5以上的ASE SERVER。DB SWITCH技术需要一台服务器充当SWITCH,从而在硬件上带来一些麻烦。

4. DB2

具有很好的并行性。DB2把数据库管理扩充到了并行的、多节点的环境。数据库分区是数据库的一部分,包含自己的数据、索引、配置文件、和事务日志。数据库分区有时被称为节点安全性。

三、安全认证

1. SQL server

没有获得任何安全证书。

2. Oracle Server

获得最高认证级别的ISO标准认证。

3. Sybase ASE

获得最高认证级别的ISO标准认证。

4. DB2

获得最高认证级别的ISO标准认证。

四、性能

1. SQL Server

多用户时性能不佳

2. Oracle

性能最高, 保持开放平台下的TPC-D和TPC-C的世界记录。

3. Sybase ASE

性能接近于SQL Server,但在UNIX平台下的并发性要优与 SQL Server。

4. DB2

性能较高适用于数据仓库和在线事物处理。

五、客户端支持及应用模式

1. SQL Server

C/S结构,只支持windows客户,可以用ADO、DAO、OLEDB、ODBC连接。

2. Oracle

多层次网络计算,支持多种工业标准,可以用ODBC、JDBC、OCI等网络客户连接。

3. Sybase ASE

C/S结构,可以用ODBC、Jconnect、Ct-library等网络客户连接。

4. DB2

跨平台,多层结构,支持ODBC、JDBC等客户。

六、操作简便

1. SQL Server

操作简单,但只有图形界面。

2. Oracle

较复杂,同时提供GUI和命令行,在windowsNT和unix下操作相同。

3. Sybase ASE

较复杂,同时提供GUI和命令行。但GUI较差,常常无法及时状态,建议使用命令行。

4. DB2

操作简单,同时提供GUI和命令行,在windowsNT和unix下操作相同。

七、使用风险

1. SQL server

完全重写的代码,经历了长期的测试,不断延迟,许多功能需要时间来证明。并不十分兼容。

2. Oracle

长时间的开发经验,完全向下兼容。得到广泛的应用。完全没有风险。

3. Sybase ASE

向下兼容, 但是ct-library 程序不益移植。

4. DB2

在巨型企业得到广泛的应用,向下兼容性好。风险小。

㈤ 有哪些类型大数据库

数据库划分
小型数据库:access,foxbase
中型数据库:mysql,sql server,Informix
大型数据库:sysbase,oracle,db2

如何考虑用什么类型的数据库(小型数据库)
1. 项目的规模
a. 负载量多大,用户多大
b. 成本
c. 安全性
负载量小 100人内
比如留言板,信息系统 选用小型数据库
成本在千元以内,对安全性要求不高。

中型数据库
比如在负载,日访问量 5000—15000
成本在万元内
比如 电子商务网站

大型数据库
负载可以处理 少量数据库
Sybase < Oracle < db2
安全性能高,价格昂贵

㈥ 几大数据库的区别

最商业的是ORACLE,做的最专业,然后是微软的SQL server,做的也很好,当然还有DB2等做得也不错,这些都是大型的数据库,,,如果掌握的全面的话,可以保证数据的安全. 然后就是些小的数据库access,mysql等,适合于中小企业的数据库100万数据一下的数据。

㈦ 企业的大数据库都包括什么

包括:
1 员工信息
2 经营信息
3 客户信息

㈧ 大数据常用哪些数据库

通常数据库分为关系型数据库和非关系型数据库,关系型数据库的优势到现在也是无可替代的,比如MySQL、SQL Server、Oracle、DB2、SyBase、Informix、PostgreSQL以及比较小型的Access等等数据库,这些数据库支持复杂的SQL操作和事务机制,适合小量数据读写场景;但是到了大数据时代,人们更多的数据和物联网加入的数据已经超出了关系数据库的承载范围。

大数据时代初期,随着数据请求并发量大不断增大,一般都是采用的集群同步数据的方式处理,就是将数据库分成了很多的小库,每个数据库的数据内容是不变的,都是保存了源数据库的数据副本,通过同步或者异步方式保证数据的一致性,每个库设定特定的读写方式,比如主数据库负责写操作,从数据库是负责读操作,等等根据业务复杂程度以此类推,将业务在物理层面上进行了分离,但是这种方式依旧存在一定的负载压力的问题,企业数据在不断的扩增中,后面就采用分库分表的方式解决,对读写负载进行分离,但是这种实现依旧存在不足,且需要不断进行数据库服务器扩容。
NoSQL数据库大致分为5种类型

1、列族数据库:BigTable、HBase、Cassandra、Amazon SimpleDB、HadoopDB等,下面简单介绍几个

(1)Cassandra:Cassandra是一个列存储数据库,支持跨数据中心的数据复制。它的数据模型提供列索引,log-structured修改,支持反规范化,实体化视图和嵌入超高速缓存。

(2)HBase:Apache Hbase源于Google的Bigtable,是一个开源、分布式、面向列存储的模型。在Hadoop和HDFS之上提供了像Bigtable一样的功能。

(3)Amazon SimpleDB:Amazon SimpleDB是一个非关系型数据存储,它卸下数据库管理的工作。开发者使用Web服务请求存储和查询数据项

(4)Apache Accumulo:Apache Accumulo的有序的、分布式键值数据存储,基于Google的BigTable设计,建立在Apache Hadoop、Zookeeper和Thrift技术之上。

(5)Hypertable:Hypertable是一个开源、可扩展的数据库,模仿Bigtable,支持分片。

(6)Azure Tables:Windows Azure Table Storage Service为要求大量非结构化数据存储的应用提供NoSQL性能。表能够自动扩展到TB级别,能通过REST和Managed API访问。

2、键值数据库:Redis、SimpleDB、Scalaris、Memcached等,下面简单介绍几个

(1)Riak:Riak是一个开源,分布式键值数据库,支持数据复制和容错。(2)Redis:Redis是一个开源的键值存储。支持主从式复制、事务,Pub/Sub、Lua脚本,还支持给Key添加时限。

(3)Dynamo:Dynamo是一个键值分布式数据存储。它直接由亚马逊Dynamo数据库实现;在亚马逊S3产品中使用。

(4)Oracle NoSQL Database:来自Oracle的键值NoSQL数据库。它支持事务ACID(原子性、一致性、持久性和独立性)和JSON。

(5)Oracle NoSQL Database:具备数据备份和分布式键值存储系统。

(6)Voldemort:具备数据备份和分布式键值存储系统。

(7)Aerospike:Aerospike数据库是一个键值存储,支持混合内存架构,通过强一致性和可调一致性保证数据的完整性。

3、文档数据库:MongoDB、CouchDB、Perservere、Terrastore、RavenDB等,下面简单介绍几个

(1)MongoDB:开源、面向文档,也是当下最人气的NoSQL数据库。

(2)CounchDB:Apache CounchDB是一个使用JSON的文档数据库,使用Javascript做MapRece查询,以及一个使用HTTP的API。

(3)Couchbase:NoSQL文档数据库基于JSON模型。

(4)RavenDB:RavenDB是一个基于.NET语言的面向文档数据库。

(5)MarkLogic:MarkLogic NoSQL数据库用来存储基于XML和以文档为中心的信息,支持灵活的模式。

4、图数据库:Neo4J、InfoGrid、OrientDB、GraphDB,下面简单介绍几个

(1)Neo4j:Neo4j是一个图数据库;支持ACID事务(原子性、独立性、持久性和一致性)。

(2)InfiniteGraph:一个图数据库用来维持和遍历对象间的关系,支持分布式数据存储。

(3)AllegroGraph:AllegroGraph是结合使用了内存和磁盘,提供了高可扩展性,支持SPARQ、RDFS++和Prolog推理。

5、内存数据网格:Hazelcast、Oracle Coherence、Terracotta BigMemorry、GemFire、Infinispan、GridGain、GigaSpaces,下面简单介绍几个

(1)Hazelcast:Hazelcast CE是一个开源数据分布平台,它允许开发者在数据库集群之上共享和分割数据。

(2)Oracle Coherence:Oracle的内存数据网格解决方案提供了常用数据的快速访问能力,一致性支持事务处理能力和数据的动态划分。

(3)Terracotta BigMemory:来自Terracotta的分布式内存管理解决方案。这项产品包括一个Ehcache界面、Terracotta管理控制台和BigMemory-Hadoop连接器。

(4)GemFire:Vmware vFabric GemFire是一个分布式数据管理平台,也是一个分布式的数据网格平台,支持内存数据管理、复制、划分、数据识别路由和连续查询。

(5)Infinispan:Infinispan是一个基于Java的开源键值NoSQL数据存储,和分布式数据节点平台,支持事务,peer-to-peer 及client/server 架构。

(6)GridGain:分布式、面向对象、基于内存、SQL+NoSQL键值数据库。支持ACID事务。

(7)GigaSpaces:GigaSpaces内存数据网格能够充当应用的记录系统,并支持各种各样的高速缓存场景。