中國資訊類客戶端大資料庫
A. 國內現在有哪幾大數據庫
國內?現在幾個主流的都是國外的吧 mysql 、sql server、 oracle
B. 哪一個新聞類app比較好
比較好的新聞類app有:騰訊新聞、南方周末、網易新聞、搜狐新聞、今日頭條。下面分別來介紹這些APP。
1、騰訊新聞
網易新聞提供極具網易特色的新聞閱讀、跟貼蓋樓、圖片瀏覽、話題投票、要聞推送、離線閱讀、流量提醒等功能,實現比電腦上看新聞更方便的優異體驗,充分滿足超過1億網易網友的手機新聞、娛樂、體育、財經、科技等多種資訊內容需求。
4、搜狐新聞
搜狐新聞客戶端是搜狐公司出品的一款為智能手機用戶量身打造的「訂閱平台+實時新聞」閱讀應用,通過將優質媒體資源聚合成適合方寸之間閱讀的圖文報紙並定時推送,讓智能手機用戶隨時隨地「搜狐新聞 先知道」。
5、今日頭條
今日頭條是北京位元組跳動科技有限公司開發的一款基於數據挖掘的推薦引擎產品,為用戶推薦信息、提供連接人與信息的服務的產品。由張一鳴於2012年3月創建,2012年8月發布第一個版本。基於個性化推薦引擎技術,根據每個用戶的興趣、位置等多個維度進行個性化推薦,推薦內容不僅包括狹義上的新聞,還包括音樂、電影、游戲、購物等資訊。
C. 請問中國最有影響力的資料庫是哪個ISTIC、CNKI、維普
「中國知網」是集知識資源大規模整合出版、原創性學術文獻出版、多媒體出版和專業化、個性化數字圖書館為一體的數字出版平台,全面整合了我國90%以上的學術文獻和海外重要的學術文獻資料庫資源,文獻類型包括:學術期刊、博士學位論文、優秀碩士學位論文、工具書、 重要會議論文、年鑒、專著、報紙、專利、標准、科技成果、知識元、哈佛商業評論資料庫、古籍等;以網路出版和數字圖書館相結合的巨大優勢,實現了知識資源的增值服務和學術文獻的個性化與專業化的實時出版,面向全社會各行各業創新與創新管理提供知識管理服務。目前,《中國知識資源總庫》中的各類文獻資源已推廣至海內外高等院校、政府、企事業單位、醫療衛生機構、情報服務機構以及農村等各個領域,帶動了學術資源在黨政領導機關管理決策、基礎教育改革、城鄉社區公共知識服務、農村文化建設中的大量普及與應用,產生了良好的社會效益和經濟效益。為我國數字與網路出版產業的高速發展和國際化奠定了重要的基礎。
CNKI工程
中國知識基礎設施工程(China National Knowledge Infrastructure),簡稱CNKI工程,始建於1995年,是以實現全社會知識信息資源傳播共享與增值利用為目標的國家信息化重點工程,由清華大學發起,同方知網技術產業集團承擔建設,是「十一五」國家重大出版工程項目。
在黨和國家領導以及教育部、中宣部、科技部、新聞出版總署、國家版權局、國家計委的大力支持下,在全國學術界、教育界、出版界、圖書情報界等社會各界的密切配合和清華大學的直接領導下,同方知網技術產業集團經過多年努力,採用自主開發並具有國際領先水平的數字圖書館技術,建成了超大型全文資料庫《中國知識資源總庫》,以「中國知網(www.cnki.net)」為網路出版與知識服務平台,通過產業化運作,為全社會知識資源高效共享提供豐富的知識信息資源和有效的知識傳播與數字化學習平台。
「中國知網」的數字出版產品總稱為《中國知識資源總庫》,是一個採用符合國際、國家和行業技術標準的CNKI網路出版產品與技術服務標准,對各種文獻資源進行規范化、標准化加工和集成化整合而成的超大型全文資料庫。
其中,國家重點出版項目---《中國學術文獻網路出版總庫》,遵循「權威性文獻檢索工具、集成化增值性整合傳播媒體、數字化學習與研究平台、智能化專業知識倉庫、規范化學術文獻與科研績效評價工具、可二次開發的數字化資源戰略館藏」六大建設標准,按照知識網路建構模式,大規模集成整合了我國學術期刊、博碩士學位論文、會議論文、報紙、年鑒、工具書、學術圖書、專利、標准、科技成果等各類文獻資源,內容涵蓋各學科、各行業領域,囊括基礎研究、工程技術、高級科普、政策指導、行業指導、實用技術、職業指導、科技信息等各個層面,連續累積出版文獻5600多萬篇,並大量整合了互聯網上外文科技資源。此外,《中國知識資源總庫》還收錄出版了大量高等教育、基礎教育、黨建、大眾科普、政策法規、經濟信息、大眾文化、文藝作品類文獻。尤其是基於《總庫》的行業、專業與個性化數字圖書館,融合了各類先進的知識服務模式,為高效率創新、學習和管理決策創造了理想的信息化環境。
不管怎麼樣,有你自己需要的東西才是最實在的,來龍去脈沒有必要搞清楚。
D. 大數據的網站有哪些包括知識類、新聞類、文獻類等等。
目前好的網站沒有多少哈,不過微信公眾號上的文章還是有不少大數據公司在做的!內大數據文摘、騰容訊大數據、燈塔大數據等等吧,可以去搜狗的微信搜索搜搜,還是有不少課參考的。什麼知網啊,這類的都太學術了,不落地。
E. 大數據常用哪些資料庫
通常資料庫分為關系型資料庫和非關系型資料庫,關系型資料庫的優勢到現在也是無可替代的,比如MySQL、SQL Server、Oracle、DB2、SyBase、Informix、PostgreSQL以及比較小型的Access等等資料庫,這些資料庫支持復雜的SQL操作和事務機制,適合小量數據讀寫場景;但是到了大數據時代,人們更多的數據和物聯網加入的數據已經超出了關系資料庫的承載范圍。
大數據時代初期,隨著數據請求並發量大不斷增大,一般都是採用的集群同步數據的方式處理,就是將資料庫分成了很多的小庫,每個資料庫的數據內容是不變的,都是保存了源資料庫的數據副本,通過同步或者非同步方式保證數據的一致性,每個庫設定特定的讀寫方式,比如主資料庫負責寫操作,從資料庫是負責讀操作,等等根據業務復雜程度以此類推,將業務在物理層面上進行了分離,但是這種方式依舊存在一定的負載壓力的問題,企業數據在不斷的擴增中,後面就採用分庫分表的方式解決,對讀寫負載進行分離,但是這種實現依舊存在不足,且需要不斷進行資料庫伺服器擴容。
NoSQL資料庫大致分為5種類型
1、列族資料庫:BigTable、HBase、Cassandra、Amazon SimpleDB、HadoopDB等,下面簡單介紹幾個
(1)Cassandra:Cassandra是一個列存儲資料庫,支持跨數據中心的數據復制。它的數據模型提供列索引,log-structured修改,支持反規范化,實體化視圖和嵌入超高速緩存。
(2)HBase:Apache Hbase源於Google的Bigtable,是一個開源、分布式、面向列存儲的模型。在Hadoop和HDFS之上提供了像Bigtable一樣的功能。
(3)Amazon SimpleDB:Amazon SimpleDB是一個非關系型數據存儲,它卸下資料庫管理的工作。開發者使用Web服務請求存儲和查詢數據項
(4)Apache Accumulo:Apache Accumulo的有序的、分布式鍵值數據存儲,基於Google的BigTable設計,建立在Apache Hadoop、Zookeeper和Thrift技術之上。
(5)Hypertable:Hypertable是一個開源、可擴展的資料庫,模仿Bigtable,支持分片。
(6)Azure Tables:Windows Azure Table Storage Service為要求大量非結構化數據存儲的應用提供NoSQL性能。表能夠自動擴展到TB級別,能通過REST和Managed API訪問。
2、鍵值資料庫:Redis、SimpleDB、Scalaris、Memcached等,下面簡單介紹幾個
(1)Riak:Riak是一個開源,分布式鍵值資料庫,支持數據復制和容錯。(2)Redis:Redis是一個開源的鍵值存儲。支持主從式復制、事務,Pub/Sub、Lua腳本,還支持給Key添加時限。
(3)Dynamo:Dynamo是一個鍵值分布式數據存儲。它直接由亞馬遜Dynamo資料庫實現;在亞馬遜S3產品中使用。
(4)Oracle NoSQL Database:來自Oracle的鍵值NoSQL資料庫。它支持事務ACID(原子性、一致性、持久性和獨立性)和JSON。
(5)Oracle NoSQL Database:具備數據備份和分布式鍵值存儲系統。
(6)Voldemort:具備數據備份和分布式鍵值存儲系統。
(7)Aerospike:Aerospike資料庫是一個鍵值存儲,支持混合內存架構,通過強一致性和可調一致性保證數據的完整性。
3、文檔資料庫:MongoDB、CouchDB、Perservere、Terrastore、RavenDB等,下面簡單介紹幾個
(1)MongoDB:開源、面向文檔,也是當下最人氣的NoSQL資料庫。
(2)CounchDB:Apache CounchDB是一個使用JSON的文檔資料庫,使用Javascript做MapRece查詢,以及一個使用HTTP的API。
(3)Couchbase:NoSQL文檔資料庫基於JSON模型。
(4)RavenDB:RavenDB是一個基於.NET語言的面向文檔資料庫。
(5)MarkLogic:MarkLogic NoSQL資料庫用來存儲基於XML和以文檔為中心的信息,支持靈活的模式。
4、圖資料庫:Neo4J、InfoGrid、OrientDB、GraphDB,下面簡單介紹幾個
(1)Neo4j:Neo4j是一個圖資料庫;支持ACID事務(原子性、獨立性、持久性和一致性)。
(2)InfiniteGraph:一個圖資料庫用來維持和遍歷對象間的關系,支持分布式數據存儲。
(3)AllegroGraph:AllegroGraph是結合使用了內存和磁碟,提供了高可擴展性,支持SPARQ、RDFS++和Prolog推理。
5、內存數據網格:Hazelcast、Oracle Coherence、Terracotta BigMemorry、GemFire、Infinispan、GridGain、GigaSpaces,下面簡單介紹幾個
(1)Hazelcast:Hazelcast CE是一個開源數據分布平台,它允許開發者在資料庫集群之上共享和分割數據。
(2)Oracle Coherence:Oracle的內存數據網格解決方案提供了常用數據的快速訪問能力,一致性支持事務處理能力和數據的動態劃分。
(3)Terracotta BigMemory:來自Terracotta的分布式內存管理解決方案。這項產品包括一個Ehcache界面、Terracotta管理控制台和BigMemory-Hadoop連接器。
(4)GemFire:Vmware vFabric GemFire是一個分布式數據管理平台,也是一個分布式的數據網格平台,支持內存數據管理、復制、劃分、數據識別路由和連續查詢。
(5)Infinispan:Infinispan是一個基於Java的開源鍵值NoSQL數據存儲,和分布式數據節點平台,支持事務,peer-to-peer 及client/server 架構。
(6)GridGain:分布式、面向對象、基於內存、SQL+NoSQL鍵值資料庫。支持ACID事務。
(7)GigaSpaces:GigaSpaces內存數據網格能夠充當應用的記錄系統,並支持各種各樣的高速緩存場景。
F. 大數據資料庫有哪些
分享10個超好用的資料庫:
1、CouchDB
CouchDB是一款完全擁抱互聯網的資料庫,它將數據存儲在文檔中,這種文檔可以通過Web瀏覽器來查詢,並且用JavaScript來處理。它易於使用,在分布式上網路上具有高可用性和高擴展性。支持的操作系統:Windows、Linux、OS X和安卓。
2、Blazegraph
Blazegraph是一種高度擴展、高性能的資料庫。它既有使用開源許可證的版本,也有使用商業許可證的版本。
3、Cassandra
Cassandra資料庫最初由Facebook開發,現已被1500多家企業組織使用,它能支持超大規模集群;比如 說,蘋果部署的Cassandra系統就包括75000多個節點,擁有的數據量超過10 PB。
4、FlockDB
FlockDB是一種非常快、擴展性非常好的圖形資料庫,擅長存儲社交網路數據。雖然這個項目的開源版已有一段時間沒有更新了,但它仍可用於下載。
5、Neo4j
Neo4j是速度快、擴展性佳的原生圖形資料庫,它具有大規模擴展性、快速的密碼查詢性能和經過改進的開發效率。支持的操作系統:Windows和Linux。
6、Pivotal Greenplum Database
Greenplum是同類中不錯的企業級分析資料庫,能夠非常快速地對龐大的海量數據進行功能強大的分析。它是Pivotal大資料庫套件的一部分。支持的操作系統:Windows、Linux和OS X。
7、Impala
Cloudera基於SQL的Impala資料庫是面向Apache Hadoop的開源分析資料庫。它可以作為一款獨立產品來下載,又是Cloudera的商業大數據產品的一部分。支持的操作系統:Linux和OS X。
8、InfoBright社區版
InfoBright為數據分析而設計,這是一種面向列的資料庫,具有很高的壓縮比。InfoBright.com提供基於同一代碼的收費產品,提供支持服務。支持的操作系統:Windows和Linux。
9、Hibari
這個基於Erlang的項目是一種分布式有序鍵值存儲系統,有很強的一致性。它最初是由Gemini Mobile Technologies開發的,現在已被歐洲和亞洲的幾家電信運營商所使用。支持的操作系統:與操作系統無關。
10、MongoDB
mongoDB的下載量已超過1000萬人次,是一款極其受歡迎的NoSQL資料庫。MongoDB.com上提供了企業版、支持、培訓及相關產品和服務。支持的操作系統:Windows、Linux、OS X和Solaris。