4大資料庫
『壹』 常用資料庫有哪些
1、MS SQL資料庫
MS指的是微軟Microsoft,SQL是結構化查詢語言.結合起來就是說:MS SQL是指微軟的SQL Server資料庫伺服器,它是一個資料庫平台,提供資料庫的從伺服器到終端的完整的解決方案,其中資料庫伺服器部分,是一個資料庫管理系統,用於建立、使用和維護資料庫。
2、ACCESS資料庫
美國Microsoft公司於1994年推出的微機資料庫管理系統。它具有界面友好、易學易用、開發簡單、介面靈活等特點,是典型的新一代桌面資料庫管理系統。其主要特點如下:
(1)完善地管理各種資料庫對象,具有強大的數據組織、用戶管理、安全檢查等功能。
(2)強大的數據處理功能,在一個工作組級別的網路環境中,使用Access開發的多用戶資料庫管理系統具有傳統的XBASE(DBASE、FoxBASE的統稱)資料庫系統所無法實現的客戶伺服器(Cient/Server)結構和相應的資料庫安全機制,Access具備了許多先進的大型資料庫管理系統所具備的特徵,如事務處理/出錯回滾能力等。
(3)可以方便地生成各種數據對象,利用存儲的數據建立窗體和報表,可視性好。
(4)作為Office套件的一部分,可以與Office集成,實現無縫連接。
(5)能夠利用Web檢索和發布數據,實現與Internet的連接。 Access主要適用於中小型應用系統,或作為客戶機/伺服器系統中的客戶端資料庫。
提示:只有你的空間支持ASP,一般都支持ACCESS,ACCESS資料庫一般免費,適合中小型網站。
3、My SQL資料庫
My SQL是一個多用戶、多線程的SQL資料庫,是一個客戶機/伺服器結構的應用,它由一個伺服器守護程序mysqld和很多不同的客戶程序和庫組成。
4、Oracle資料庫
Oracle Database,又名Oracle RDBMS,或簡稱Oracle。是甲骨文公司的一款關系資料庫管理系統。到目前仍在資料庫市場上佔有主要份額。勞倫斯·埃里森和他的朋友,之前的同事Bob Miner和Ed Oates在1977年建立了軟體開發實驗室咨詢公司(SDL,Software Development Laboratories)
5、DB2
IBM公司研製的一種關系型資料庫系統。DB2主要應用於大型應用系統,具有較好的可伸縮性,可支持從大型機到單用戶環境,應用於OS/2、Windows等平台下。 DB2提供了高層次的數據利用性、完整性、安全性、可恢復性,以及小規模到大規模應用程序的執行能力,具有與平台無關的基本功能和SQL命令。
DB2採用了數據分級技術,能夠使大型機數據很方便地下載到LAN資料庫伺服器,使得客戶機/伺服器用戶和基於LAN的應用程序可以訪問大型機數據,並使資料庫本地化及遠程連接透明化。它以擁有一個非常完備的查詢優化器而著稱,其外部連接改善了查詢性能,並支持多任務並行查詢。 DB2具有很好的網路支持能力,每個子系統可以連接十幾萬個分布式用戶,可同時激活上千個活動線程,對大型分布式應用系統尤為適用。
『貳』 什麼是大數據它有哪四個基本特徵
簡言之,大數據源是指大數據集,這些數據集經過計算分析可以用於揭示某個方面相關的模式和趨勢。大數據技術的戰略意義不在於掌握龐大的數據信息,而在於對這些含有意義的數據進行專業化處理。
大數據的特點:數據量大、數據種類多、 要求實時性強、數據所蘊藏的價值大。
大數據的5V特性:
『叄』 大數據和資料庫的區別
大數據和以前的數據相比,有4個特點(4V):Volume(大量)、內Velocity(高速)、Variety(多樣)、value(價值容)。volume指量,數據量大,這是大數據的基礎;Velocity是指處理的速度;Variety指數據的維度;value指大數據能展現的價值,這是大數據的目的。
『肆』 大數據常用哪些資料庫
通常資料庫分為關系型資料庫和非關系型資料庫,關系型資料庫的優勢到現在也是無可替代的,比如MySQL、SQL Server、Oracle、DB2、SyBase、Informix、PostgreSQL以及比較小型的Access等等資料庫,這些資料庫支持復雜的SQL操作和事務機制,適合小量數據讀寫場景;但是到了大數據時代,人們更多的數據和物聯網加入的數據已經超出了關系資料庫的承載范圍。
大數據時代初期,隨著數據請求並發量大不斷增大,一般都是採用的集群同步數據的方式處理,就是將資料庫分成了很多的小庫,每個資料庫的數據內容是不變的,都是保存了源資料庫的數據副本,通過同步或者非同步方式保證數據的一致性,每個庫設定特定的讀寫方式,比如主資料庫負責寫操作,從資料庫是負責讀操作,等等根據業務復雜程度以此類推,將業務在物理層面上進行了分離,但是這種方式依舊存在一定的負載壓力的問題,企業數據在不斷的擴增中,後面就採用分庫分表的方式解決,對讀寫負載進行分離,但是這種實現依舊存在不足,且需要不斷進行資料庫伺服器擴容。
NoSQL資料庫大致分為5種類型
1、列族資料庫:BigTable、HBase、Cassandra、Amazon SimpleDB、HadoopDB等,下面簡單介紹幾個
(1)Cassandra:Cassandra是一個列存儲資料庫,支持跨數據中心的數據復制。它的數據模型提供列索引,log-structured修改,支持反規范化,實體化視圖和嵌入超高速緩存。
(2)HBase:Apache Hbase源於Google的Bigtable,是一個開源、分布式、面向列存儲的模型。在Hadoop和HDFS之上提供了像Bigtable一樣的功能。
(3)Amazon SimpleDB:Amazon SimpleDB是一個非關系型數據存儲,它卸下資料庫管理的工作。開發者使用Web服務請求存儲和查詢數據項
(4)Apache Accumulo:Apache Accumulo的有序的、分布式鍵值數據存儲,基於Google的BigTable設計,建立在Apache Hadoop、Zookeeper和Thrift技術之上。
(5)Hypertable:Hypertable是一個開源、可擴展的資料庫,模仿Bigtable,支持分片。
(6)Azure Tables:Windows Azure Table Storage Service為要求大量非結構化數據存儲的應用提供NoSQL性能。表能夠自動擴展到TB級別,能通過REST和Managed API訪問。
2、鍵值資料庫:Redis、SimpleDB、Scalaris、Memcached等,下面簡單介紹幾個
(1)Riak:Riak是一個開源,分布式鍵值資料庫,支持數據復制和容錯。(2)Redis:Redis是一個開源的鍵值存儲。支持主從式復制、事務,Pub/Sub、Lua腳本,還支持給Key添加時限。
(3)Dynamo:Dynamo是一個鍵值分布式數據存儲。它直接由亞馬遜Dynamo資料庫實現;在亞馬遜S3產品中使用。
(4)Oracle NoSQL Database:來自Oracle的鍵值NoSQL資料庫。它支持事務ACID(原子性、一致性、持久性和獨立性)和JSON。
(5)Oracle NoSQL Database:具備數據備份和分布式鍵值存儲系統。
(6)Voldemort:具備數據備份和分布式鍵值存儲系統。
(7)Aerospike:Aerospike資料庫是一個鍵值存儲,支持混合內存架構,通過強一致性和可調一致性保證數據的完整性。
3、文檔資料庫:MongoDB、CouchDB、Perservere、Terrastore、RavenDB等,下面簡單介紹幾個
(1)MongoDB:開源、面向文檔,也是當下最人氣的NoSQL資料庫。
(2)CounchDB:Apache CounchDB是一個使用JSON的文檔資料庫,使用Javascript做MapRece查詢,以及一個使用HTTP的API。
(3)Couchbase:NoSQL文檔資料庫基於JSON模型。
(4)RavenDB:RavenDB是一個基於.NET語言的面向文檔資料庫。
(5)MarkLogic:MarkLogic NoSQL資料庫用來存儲基於XML和以文檔為中心的信息,支持靈活的模式。
4、圖資料庫:Neo4J、InfoGrid、OrientDB、GraphDB,下面簡單介紹幾個
(1)Neo4j:Neo4j是一個圖資料庫;支持ACID事務(原子性、獨立性、持久性和一致性)。
(2)InfiniteGraph:一個圖資料庫用來維持和遍歷對象間的關系,支持分布式數據存儲。
(3)AllegroGraph:AllegroGraph是結合使用了內存和磁碟,提供了高可擴展性,支持SPARQ、RDFS++和Prolog推理。
5、內存數據網格:Hazelcast、Oracle Coherence、Terracotta BigMemorry、GemFire、Infinispan、GridGain、GigaSpaces,下面簡單介紹幾個
(1)Hazelcast:Hazelcast CE是一個開源數據分布平台,它允許開發者在資料庫集群之上共享和分割數據。
(2)Oracle Coherence:Oracle的內存數據網格解決方案提供了常用數據的快速訪問能力,一致性支持事務處理能力和數據的動態劃分。
(3)Terracotta BigMemory:來自Terracotta的分布式內存管理解決方案。這項產品包括一個Ehcache界面、Terracotta管理控制台和BigMemory-Hadoop連接器。
(4)GemFire:Vmware vFabric GemFire是一個分布式數據管理平台,也是一個分布式的數據網格平台,支持內存數據管理、復制、劃分、數據識別路由和連續查詢。
(5)Infinispan:Infinispan是一個基於Java的開源鍵值NoSQL數據存儲,和分布式數據節點平台,支持事務,peer-to-peer 及client/server 架構。
(6)GridGain:分布式、面向對象、基於內存、SQL+NoSQL鍵值資料庫。支持ACID事務。
(7)GigaSpaces:GigaSpaces內存數據網格能夠充當應用的記錄系統,並支持各種各樣的高速緩存場景。
『伍』 什麼是四大國家基礎資料庫
「四大基礎資料庫」在國家電子政務建設中具有重要的地位和作用,是國家信息化和電子政務建設的一項重要基礎設施。無論在政務領域,還在企業領域,「四大基礎資料庫」有著廣泛的應用場景和共享需求,四大基礎資料庫的建設不僅能實現數據的共享,同時在建設的過程本身也推進著各業務流程的整合及優化。
四大基礎庫分別是:人口基礎資料庫、法人資料庫、宏觀經濟資料庫,自然資源與空間地理資料庫,也有的專家稱「四大基礎資料庫」是國家層面四大主資料庫。
1、人口信息資料庫
人口信息庫的主體包括公民身份號碼、姓名、性別、民族、出生地等基本信息,還包括各部門業務系統在利用人口基本信息過程中產生的、其他部門存在共享需求的人口信息。
人口信息資料庫主要來自公安局、人社局、民政局、衛生局、教育局等,另外我市在綜治辦、市民卡中心、便民服務中心也有部分數據。
2、法人單位信息資料庫
法人單位信息資料庫的數據主要來源於市場監督局的企業注冊登記庫和組織機構代碼庫,編辦的事業單位注冊登記、民政局的社會團體登記庫、國稅地稅的稅務資料庫,以及統計局的基本單位普查庫等。
3、自然資源和空間地理信息資料庫
自然資源和空間地理信息資料庫是以電子地圖為基礎,整合道路、行政區劃、建築、植被、地下管線等基礎數據,以及土地利用、規劃用地、園林綠化、生態環境、自然資源等專題數據。
4、宏觀經濟基礎信息資料庫
宏觀經濟基礎信息數據包括全市主要經濟指標、地方財政收入、稅收完成情況、金融機構信貸情況、各鎮(區)主要經濟指標等信息,以統計經濟信息為基礎。
(5)4大資料庫擴展閱讀
近年來,全國各地都已開始積極建設「四大基礎資料庫」,並在「四大基礎資料庫」基礎上建設「數字城市」,有些發達地區的地方政府已開始從「數字城市」向「智慧城市」轉型升級,進入「大數據」時代。
習近平總書記指出「沒有信息安全,就沒有國家安全,沒有信息化就沒有現代化」,李克強總理也提出了「互聯網+」概念,這充分說明了信息化的重要性。
「四大基礎資料庫」正是政府信息化建設的基礎,對電子政務具有非常重要意義,既能加強政務資源的整合、共享與交換,打破信息孤島,避免重復建設,又能推進政府職能部門業務協同,強化服務意識,通過數據加工和挖掘還能為政府決策提供知識依據和大數據的支持。
『陸』 大數據和傳統資料庫的區別是什麼
現在的大數據分析,跟傳統意義的分析有一個本質區別,就是傳統的分析是基於結構化、關系性的數據。
而且往往是取一個很小的數據集,來對整個數據進行預測和判斷。但現在是大數據時代,理念已經完全改變了,現在的大數據分析,是對整個數據全集直接進行存儲和管理分析
『柒』 資料庫有幾大廠商
一、開放性
1. SQL Server
只能在windows上運行,沒有絲毫的開放性,操作系統的系統的穩定對資料庫是十分重要的。Windows9X系列產品是偏重於桌面應用,NT server只適合中小型企業。而且windows平台的可靠性,安全性和伸縮性是非常有限的。它不象unix那樣久經考驗,尤其是在處理大資料庫。
2. Oracle
能在所有主流平台上運行(包括 windows)。完全支持所有的工業標准。採用完全開放策略。可以使客戶選擇最適合的解決方案。對開發商全力支持。
3. Sybase ASE
能在所有主流平台上運行(包括 windows)。 但由於早期Sybase與OS集成度不高,因此VERSION11.9.2以下版本需要較多OS和DB級補丁。在多平台的混合環境中,會有一定問題。
4. DB2
能在所有主流平台上運行(包括windows)。最適於海量數據。DB2在企業級的應用最為廣泛,在全球的500家最大的企業中,幾乎85%以上用DB2資料庫伺服器,而國內到97年約佔5%。
二、可伸縮性,並行性
1. SQL server
並行實施和共存模型並不成熟,很難處理日益增多的用戶數和數據卷,伸縮性有限。
2. Oracle
並行伺服器通過使一組結點共享同一簇中的工作來擴展windownt的能力,提供高可用性和高伸縮性的簇的解決方案。如果windowsNT不能滿足需要,用戶可以把資料庫移到UNIX中。Oracle的並行伺服器對各種UNIX平台的集群機制都有著相當高的集成度。
3. Sybase ASE
雖然有DB SWITCH來支持其並行伺服器,但DB SWITCH在技術層面還未成熟,且只支持版本12.5以上的ASE SERVER。DB SWITCH技術需要一台伺服器充當SWITCH,從而在硬體上帶來一些麻煩。
4. DB2
具有很好的並行性。DB2把資料庫管理擴充到了並行的、多節點的環境。資料庫分區是資料庫的一部分,包含自己的數據、索引、配置文件、和事務日誌。資料庫分區有時被稱為節點安全性。
三、安全認證
1. SQL server
沒有獲得任何安全證書。
2. Oracle Server
獲得最高認證級別的ISO標准認證。
3. Sybase ASE
獲得最高認證級別的ISO標准認證。
4. DB2
獲得最高認證級別的ISO標准認證。
四、性能
1. SQL Server
多用戶時性能不佳
2. Oracle
性能最高, 保持開放平台下的TPC-D和TPC-C的世界記錄。
3. Sybase ASE
性能接近於SQL Server,但在UNIX平台下的並發性要優與 SQL Server。
4. DB2
性能較高適用於數據倉庫和在線事物處理。
五、客戶端支持及應用模式
1. SQL Server
C/S結構,只支持windows客戶,可以用ADO、DAO、OLEDB、ODBC連接。
2. Oracle
多層次網路計算,支持多種工業標准,可以用ODBC、JDBC、OCI等網路客戶連接。
3. Sybase ASE
C/S結構,可以用ODBC、Jconnect、Ct-library等網路客戶連接。
4. DB2
跨平台,多層結構,支持ODBC、JDBC等客戶。
六、操作簡便
1. SQL Server
操作簡單,但只有圖形界面。
2. Oracle
較復雜,同時提供GUI和命令行,在windowsNT和unix下操作相同。
3. Sybase ASE
較復雜,同時提供GUI和命令行。但GUI較差,常常無法及時狀態,建議使用命令行。
4. DB2
操作簡單,同時提供GUI和命令行,在windowsNT和unix下操作相同。
七、使用風險
1. SQL server
完全重寫的代碼,經歷了長期的測試,不斷延遲,許多功能需要時間來證明。並不十分兼容。
2. Oracle
長時間的開發經驗,完全向下兼容。得到廣泛的應用。完全沒有風險。
3. Sybase ASE
向下兼容, 但是ct-library 程序不益移植。
4. DB2
在巨型企業得到廣泛的應用,向下兼容性好。風險小。
『捌』 資料庫大數據
傳統資料庫處理大數據很困難吧,不建議使用傳統資料庫來處理大數據。
建議研究下,Hadoop,Hive等,可處理大數據。
如果有預算,可以使用一些商業大數據產品,國內的譬如永洪科技的大數據BI產品,不僅能高性能處理大數據,還可做數據分析。
當然如果是簡單的查詢,傳統資料庫如果做好索引,可能可以提高性能。
『玖』 比較常見的資料庫系統都有哪些請至少列舉4個以上。
Mysql, Oracle, SQL Server, Access, DB2
一、開放性
1. SQL Server
只能在windows上運行,沒有絲毫的開放性,操作系統的系統的穩定對資料庫是十分重要的。Windows9X系列產品是偏重於桌面應用,NT server只適合中小型企業。而且windows平台的可靠性,安全性和伸縮性是非常有限的。它不象unix那樣久經考驗,尤其是在處理大資料庫。
2. Oracle
能在所有主流平台上運行(包括 windows)。完全支持所有的工業標准。採用完全開放策略。可以使客戶選擇最適合的解決方案。對開發商全力支持。
3. Sybase ASE
能在所有主流平台上運行(包括 windows)。 但由於早期Sybase與OS集成度不高,因此VERSION11.9.2以下版本需要較多OS和DB級補丁。在多平台的混合環境中,會有一定問題。
4. DB2
能在所有主流平台上運行(包括windows)。最適於海量數據。DB2在企業級的應用最為廣泛,在全球的500家最大的企業中,幾乎85%以上用DB2資料庫伺服器,而國內到97年約佔5%。
二、可伸縮性,並行性
1. SQL server
並行實施和共存模型並不成熟,很難處理日益增多的用戶數和數據卷,伸縮性有限。
2. Oracle
並行伺服器通過使一組結點共享同一簇中的工作來擴展windownt的能力,提供高可用性和高伸縮性的簇的解決方案。如果windowsNT不能滿足需要,用戶可以把資料庫移到UNIX中。Oracle的並行伺服器對各種UNIX平台的集群機制都有著相當高的集成度。
3. Sybase ASE
雖然有DB SWITCH來支持其並行伺服器,但DB SWITCH在技術層面還未成熟,且只支持版本12.5以上的ASE SERVER。DB SWITCH技術需要一台伺服器充當SWITCH,從而在硬體上帶來一些麻煩。
4. DB2
具有很好的並行性。DB2把資料庫管理擴充到了並行的、多節點的環境。資料庫分區是資料庫的一部分,包含自己的數據、索引、配置文件、和事務日誌。資料庫分區有時被稱為節點安全性。
三、安全認證
1. SQL server
沒有獲得任何安全證書。
2. Oracle Server
獲得最高認證級別的ISO標准認證。
3. Sybase ASE
獲得最高認證級別的ISO標准認證。
4. DB2
獲得最高認證級別的ISO標准認證。
四、性能
1. SQL Server
多用戶時性能不佳
2. Oracle
性能最高, 保持開放平台下的TPC-D和TPC-C的世界記錄。
3. Sybase ASE
性能接近於SQL Server,但在UNIX平台下的並發性要優與 SQL Server。
4. DB2
性能較高適用於數據倉庫和在線事物處理。
五、客戶端支持及應用模式
1. SQL Server
C/S結構,只支持windows客戶,可以用ADO、DAO、OLEDB、ODBC連接。
2. Oracle
多層次網路計算,支持多種工業標准,可以用ODBC、JDBC、OCI等網路客戶連接。
3. Sybase ASE
C/S結構,可以用ODBC、Jconnect、Ct-library等網路客戶連接。
4. DB2
跨平台,多層結構,支持ODBC、JDBC等客戶。
六、操作簡便
1. SQL Server
操作簡單,但只有圖形界面。
2. Oracle
較復雜,同時提供GUI和命令行,在windowsNT和unix下操作相同。
3. Sybase ASE
較復雜,同時提供GUI和命令行。但GUI較差,常常無法及時狀態,建議使用命令行。
4. DB2
操作簡單,同時提供GUI和命令行,在windowsNT和unix下操作相同。
七、使用風險
1. SQL server
完全重寫的代碼,經歷了長期的測試,不斷延遲,許多功能需要時間來證明。並不十分兼容。
2. Oracle
長時間的開發經驗,完全向下兼容。得到廣泛的應用。完全沒有風險。
3. Sybase ASE
向下兼容, 但是ct-library 程序不益移植。
4. DB2
在巨型企業得到廣泛的應用,向下兼容性好。風險小。
『拾』 大數據包括哪些
大數據技術龐大復雜,基礎的技術包含數據的採集、數據預處理、分布式存回儲、NoSQL資料庫答、數據倉庫、機器學習、並行計算、可視化等各種技術范疇和不同的技術層面。
大數據主要技術組件:Hadoop、HBase、kafka、Hive、MongoDB、Redis、Spark 、Storm、Flink等。
大數據技術包括數據採集,數據管理,數據分析,數據可視化,數據安全等內容。數據的採集包括感測器採集,系統日誌採集以及網路爬蟲等。數據管理包括傳統的資料庫技術,nosql技術,以及對於針對大規模數據的大數據平台,例如hadoop,spark,storm等。數據分析的核心是機器學習,當然也包括深度學習和強化學習,以及自然語言處理,圖與網路分析等。