Ⅰ 談談我國大數據發展面臨著哪些制約因素

1.很少有優質可用的數據
這幾年數據交易機構如雨後春筍,「數據變現」成為很多擁有數據積累的傳統企業的新的生財法。目前,我國大數據需求端以互聯網企業為主,覆蓋面不廣,在O2O趨勢下,大型互聯網廠商嘗試引入外部數據支撐金融、生活、語音、旅遊、健康和教育等多種服務。
然而在具體的領域或行業內,我國普遍未形成成型的數據採集、加工、分析和應用鏈條,大量數據源未被激活,大多數數據擁有者沒有數據價值外化的路徑。比如,各醫療健康類應用收集了大量的數據,但沒有像那樣面向醫葯公司售賣數據。與國外相比我國的政府、公共服務、農業應用基本缺位,電信和銀行業更缺少與外部數據的碰撞。
另外,其實數據交易這件事本身就是一個悖論。數據作為一種商品有一定的特殊性,我用了別人也可以用,沒有任何消耗,可以在市場賣很多遍。這就產生一個問題,你這個數據到市場賣,根據經濟學觀點它的價值是零,你賣給我我可以用更低的價格賣給別人,所以數據交易理論上來說也是不可行的。
大數據概念火了以後,很多機構覺得數據存起來就是寶,於是積攢了大量零碎數據放在那裡,到底能發揮什麼作用也未可知。而在和許多真正想用數據做些事情的機構的合作中我們發現,即便是政府機構這樣的權威數據持有方,也存在很多數據缺失、數據錯誤、噪音多各方面的問題。
我們常常在講大數據就用大數據方法,小數據就用小數據方法,完美的數據是永遠等不來的。但這樣會導致什麼問題呢?在實際項目實施過程中,我們的數據科學家們不得不花費大量時間在數據清洗上,這其實是對本來就緊缺的數據人員的一種浪費。
理論上我們中國有很多數據,但不同部門數據存在在不同的地方,格式也不一樣。政府內部本身整合各部門的數據就已經是一件很頭大的事情,更不要提大規模的數據開放。同時數據開放面臨一個嚴重問題就是隱私問題,脫敏遠遠不夠,隱私問題是一個無底洞。比如我們把一個人的支付寶3個月數據拿過來,就可以很輕易的知道這個人今天在門口便利店買了一瓶水,昨天在淘寶買了沙發,每隔三個月會有一筆萬元的支出。那我們就可以很容易推斷這個人剛換了一個租房子的地方,就能了解他的消費習慣。這個數據其實完全是脫敏的,沒有名字、沒有號碼,但絲毫不妨礙我們通過演算法完全的勾勒出這個人的畫像。
2.實際技術與業務之間還有很大距離
大數據行業發展至今,技術與業務之間依然存在巨大著鴻溝。首先,就是數據分析技術本身。數據源企業為實現數據價值變現,嘗試多種方法,甚至自己組建數據分析團隊,可是數據分析是個技術活,1%的誤差都會極大地影響市場份額,術業有專攻,數據變現還是需要專業的數據分析人才來實現。
大數據概念的火熱,做大數據的公司越來越多,產品做得五花八門,數據建模看似誰都可以涉足,但現在數據分析的技術,方法,模型,演算法都有了非常大的改進,跟過去六七十年代完全不一樣,不是說做幾個SAAS軟體或者RAAS軟體就是大數據了,雖然短期看市場火熱,但長遠來說這條路是走不通的,大數據行業發展,技術才是真正的發力點,提高行業准入門檻尤為重要。
其次中國的數據有它的特色,例如在金融行業,目前大部分銀行採用的是風險評分卡,運用專家經驗定義風險變數,基於定性認識進行評分,通過事後風險回檢優化評分卡,風險預警功能較差。雖然央行徵信中心與國內少數技術領先銀行使用的是風險評分模型,但模型方法相對陳舊,如央行所用FICO評分模型為上世紀80年代基於邏輯回歸演算法構建的評分體系,邏輯回歸演算法適合處理線性數據,但實際問題往往是非線性的,特別是信用風險評估場景下。此外,FICO模型沒有針對我國具體業務進行場景細分,建模邏輯並不完全符合我國實際情況,因此導致准確率不足,風險預警能力差。基於此,中國人民銀行徵信中心首次與國內大數據公司合作,這次合作中普林科技應用國際領先的大數據建模分析技術運用決策樹隨機森林,AdaBOOST,GBDT,SVM等演算法,通過對信用報告的數字化解讀與深入洞察,准確預測了違約風險,對貸款審批、貸中管理形成指導,新模型對好壞賬戶的區分度遠高於行業平均水平。此次合作表明我國的大數據難題更需要適應國情的解決方案與本土的技術人才,這對我們的市場提出了一個新問題。
3.人才稀缺
我們國家大數據發展最大的優勢就是市場大,最大的劣勢恰巧就是缺乏相應人才,人才缺乏的程度非常嚴重。首先在國際市場方面,我們要跟國外公司爭人才,然而國外大數據行業同樣十分火熱。而不論在國內還是國外,跟企業競爭人才都是一項艱巨的事業,比如在世界上最好的大學之一的美國普林斯頓大學,想找數學家也是非常困難,人才很容易被大公司挖走,每年都有非常好的數據分析人才被企業挖走。所以人才難覓不只是口頭說說,更是一個亟待解決的問題 大數據是一個交叉學科,涉及統計學,管理編程等多學科,知識點復雜,缺乏系統的學習教程。

Ⅱ 運用經濟生活的相關知識,分析國家重視大數據的理論依據

大數據是先進技術,科技是第一生產力,重視大數據,就是重視科技,有利於推動生產力發展。
大數據是現代信息技術,是技術創新,有利於我國貫徹落實科學發展觀,實施創新驅動戰略,調整產業結構,推進信息化、工業化,有利於經濟發展方式的轉變。

Ⅲ 近幾年來我國大數據市場發展為何如此迅速

流式處理佔主導地位,Kafka和Spark成為主流應用

根據數據處理的時效性,大數據處理系統可以分為批式(batch)大數據和流式(streaming)大數據兩類。其中,批式大數據又被稱為歷史大數據,流式大數據又被稱為實時大數據。

以Hadoop為代表的批處理大數據系統需先將數據匯聚成批,經批量預處理後載入至分析型數據倉庫中,以進行高性能實時查詢。這類系統雖然可對完整大數據集實現高效的即席查詢,但無法查詢到最新的實時數據,存在數據遲滯高等問題。

以Spark Streaming、Storm、Flink為代表的流處理大數據系統將實時數據通過流處理,逐條載入至高性能內存資料庫中進行查詢。此類系統可以對最新實時數據實現高效預設分析處理模型的查詢,數據遲滯低。

隨著互聯網、計算機行業快速發展,企業對數據的時效性越發重視,企業應用也逐漸由批處理數據平台向實時的流數據數據平台轉移。以流數據處理為代表的Spark、kafka大數據系統近年來大放異彩,取代了Hadoop的主導地位。

更多數據參考前瞻產業研究院發布的《中國大數據產業發展前景與投資戰略規劃分析報告》

Ⅳ 中國品牌為什麼要重視大數據

「一杯牛奶強壯一個民族」,讓缺少乳製品食用習慣的東亞民族堅持每天一杯奶,硬是促使日本國民在不到兩代人的時間里,男性平均身高向上躥升10餘厘米,超過中國,牛奶作為這背後的助推力量難以讓人忽略,國家對國民的乳製品尤其是液態奶消費也愈加重視與鼓勵。

除了政策與習慣,經濟水平也在一定程度上決定了液態奶的消費,人均GDP的增長也會推升液態奶的消費,目前,人均GDP超過1.5萬美元的世界主要發達國家液態奶平均消費超過中國的3倍,隨著我國經濟的進一步發展,我國的液態奶消費將有一個巨大的增長空間。

龐大的市場,長距離運輸需求讓UHT奶占據了市場主導,從而促使基地型奶企迅速成長,誕生了以蒙牛、伊利為第一梯隊的四大梯隊格局。

目前,液態奶的消費人群總體來看,呈現明顯的年輕化、高知化,分布上主要集中於發達的東部地區。未來,中老年群體、東北與西部、中低線城市都是液態奶的增量與潛在市場。

01、液態奶市場及用戶概況

消費潛力

中國人均液態奶消費遠低於全球主要國家平均水平,液態奶消費增長空間巨大。

區域分布

華東地區是特侖蘇與金典兩大品牌最重要的消費市場,借力靳東特倫蘇可再開拓東北,金典則可倚靠王菲深挖華東地區潛力。

關注特侖蘇的360用戶與靳東粉絲主要集中在華東地區,但東北地區特侖蘇關注者與區分度均遠低於靳東粉絲。關注金典的360用戶與王菲粉絲主要集中於華東地區,但關注度上與王菲粉絲還有較大差距。

城市分布

中高線城市是特侖蘇與金典存量市場,借力靳東可進一步下沉低線城市,金典則可依靠王菲進一步深挖中線城市潛力,打造增量市場。

關注特侖蘇的360用戶主要集中在高線城市,在低線城市特侖蘇關注者與區分度均遠低於靳東粉絲。

關注金典的360用戶與王菲粉絲主要集中於中高線,在中線城市關注度上與王菲粉絲還有較大差距。

搜索關鍵詞

搜特侖蘇主要關注內涵與廣告,搜金典則更關注與特侖蘇對比及相關產品。

活躍APP

除了通訊社交,關注特侖蘇360用戶熱衷新聞閱讀,金典用戶則鍾愛系統工具。

蒙牛領先緣由

推出時機、品牌命名、營銷定位與市場潛力四大因素助力率先佔領國內UHT奶市場份額並持續領先。

推出時機好:特侖蘇的進入市場時機恰當,液態奶05年之前一味大打價格戰,蒙牛則推出高端產品,脫離價格戰,率先進入高端市場。

品牌命名好:特侖蘇,金牌牛奶之意,作為高端產品,使用蒙語區別於普通產品的通俗名稱,讓消費者有距離感,並容易產生主動探究的慾望,一旦清楚含義就印象深刻。

營銷定位好:特侖蘇,廣告語是「不是所有牛奶都叫特侖蘇」,然後用「澳亞牧場」先進硬體基礎、高質牧草、進口乳牛來背書,市場大獲成功。

市場廣闊:高端定位,使特侖蘇成為春節禮品市場的搶手貨。2017年銷售額達到120億,仍是高端白奶當之無愧的王者。

03、酸奶用戶畫像

光明率先推出莫斯利安高端常溫酸奶品牌,蒙牛、伊利則順勢推出純甄、安慕希,三大高端品牌格局形成。

關注度趨勢

常溫酸奶呈節日周期性,且廣告效應顯著,安慕希受到360用戶最高的關注度。

首位度明顯:伊利安慕希作為市場上一款主要的常溫酸奶,受到360用戶的關注最高,是其他兩款年平均關注度的3倍。

廣告效應顯著:冠名贊助熱門綜藝節目與演唱會的安慕希與莫斯利安,通常能在這期間受到360用戶極高的關注度。

節日周期性:三款常溫酸奶作為高端酸奶,在360用戶中禮品屬性顯現,在春節期間關注度均會有大幅上揚。

年齡

年輕化顯著,三大常溫酸奶品牌及代言人覆蓋人群均以年輕人為主,尤其是張藝興、楊穎粉絲,年輕人市場廣闊。

學歷

三大常溫酸奶覆蓋人群學歷差異明顯,莫斯利安、純甄以高學歷為主,安慕希則覆蓋均勻,楊穎的粉絲學歷以中低學歷為主,安慕希下沉空間廣闊。

區域分布

東北、西南地區是三大常溫酸奶共同的增量市場,莫斯利安還可進軍華南與華北,純甄則可繼續深挖華東

Ⅳ 大數據發展面臨的挑戰是什麼

現在大數據是世界都關注的事情,這是因為大數據能夠幫助人們做很多的事情,大數據的發展也是很多國家重視的地方,當然,我國也不例外。我國對大數據還是比較重視的,現在我國的大數據產業發展已經有了一定的基礎,但是我們還不能放鬆,還需要努力,這是因為我國的數據產業還面臨著眾多的挑戰,在這篇文章中我們就給大家詳細介紹一下大數據發展面臨的挑戰,希望這篇文章能夠更好地幫助大家理解大數據知識。
我國發展大數據產業是一定要向數據強國轉變,現在我國只能說是個數據大國,但是要實現從「數據大國」向「數據強國」轉變,還面臨諸多挑戰。具體面臨的挑戰有五個。
第一個挑戰就是對數據資源及其價值的認識不足。這是因為全社會尚未形成對大數據客觀、科學的認識,對數據資源及其在人類生產、生活和社會管理方面的價值利用認識不足,存在盲目追逐硬體設施投資、輕視數據資源積累和價值挖掘利用等現象。所以說這是我國大數據長期內最大的挑戰,但也是比較容易實現的目標。
第二個挑戰就是技術創新與支撐能力不夠。這主要是因為大數據需要從底層晶元到基礎軟體再到應用分析軟體等信息產業全產業鏈的支撐,無論是新型計算平台、分布式計算架構,還是大數據處理、分析和呈現方面與國外均存在較大差距,對開源技術和相關生態系統的影響力仍然較弱,總體上難以滿足各行各業大數據應用需求。而這是大數據短期內最大的挑戰。
第三個挑戰就是數據資源建設和應用水平不高。這是因為用戶普遍不重視數據資源的建設,即使有數據意識的機構也大多隻重視數據的簡單存儲,很少針對後續應用需求進行加工整理。而且數據資源普遍存在質量差,標准規范缺乏,管理能力弱等現象。在很多跨部門、跨行業的數據共享仍不順暢,有價值的公共信息資源和商業數據開放程度低。數據價值難以被有效挖掘利用,所以說,大數據應用整體上處於起步階段,潛力遠未釋放。
第四個挑戰就是信息安全和數據管理體系尚未建立。數據所有權、隱私權等相關法律法規和信息安全、開放共享等標准規范缺乏,技術安全防範和管理能力不夠,尚未建立起兼顧安全與發展的數據開放、管理和信息安全保障體系。
第五個挑戰就是人才隊伍建設還需加強。就目前而言,我國的綜合掌握數學、統計學、計算機等相關學科及應用領域知識的綜合性數據科學人才缺乏,遠不能滿足發展需要,尤其是缺乏既熟悉行業業務需求,又掌握大數據技術與管理的綜合型人才。
我們在這篇文章中給大家介紹了我國大數據發展需要面臨的挑戰,通過這些內容我們不難發現我國要想成為數據強國還有很長的路要走。所以說,我國從數據大國轉變為數據強國還需要我們共同的努力。

Ⅵ 大數據產業迎來大發展時代

大數據產業迎來大發展時代

日前,國務院印發《促進大數據發展行動綱要》(以下簡稱《綱要》),提出將全面推進我國大數據發展和應用,加快建設數據強國,2017年底前形成跨部門數據資源共享共用格局;2018年底前建成國家政府數據統一開放平台。

業內專家分析認為,此次發布的《綱要》與7月初國務院發布的《關於積極推進「互聯網+」行動的指導意見》,構成規范發展中國互聯網新經濟發展和社會轉型升級的「姊妹篇」,其發布和實施對於促進中國大數據產業和互聯網新經濟的持續健康發展將產生深遠的影響。

上升至國家戰略高度

從《綱要》內容分析,大數據建設已經被上升到了「推動經濟轉型發展的新動力」高度。從政策落實的角度看,此次《綱要》既給出了時間表,又給出了路線圖。其明確提出「2017年底前形成跨部門數據資源共享共用格局」,「2018年底前建成國家政府數據統一開放平台」,這些都讓開放的政府大數據變得觸手可及。

貴陽大數據交易所總裁王叄壽是《促進大數據發展行動綱要》的起草人之一。在他看來,《綱要》的作用是要激活中國大數據的資產價值,未來我國大數據的市場規模將達到上萬億元。

北京賽智時代信息技術咨詢有限公司總經理、合夥人趙剛認為,《綱要》的發布標志著大數據發展上升到了強國戰略的高度。《綱要》明確提出,數據已成為國家基礎性戰略資源,中國將致力於建設數據強國,網路空間數據主權保護是國家安全的重要組成部分。「這個高度的提法是首次提出,彰顯和強化了大數據發展和應用在國家戰略中的地位。」

易觀智庫分析師任偉巍也表示:「《綱要》的發布標志著國家從頂層開始重視大數據的建設與應用,對大數據的發展方向起到了非常明確的引導作用,否則完全憑市場需求逆向推動,進程會比較緩慢。」不過他同時也提出建議,那就是應避免口號化,要注重最終能否對各行業產生天然吸引力,並充分為各行業所用,避免建的人多、用的人少。

行業分析人士姜偉超認為,近年來,業界一直在提倡大數據,此次《綱要》的發布將會使大數據在更大的領域內開放共享,將在多個方面產生重大影響。

「《綱要》的發布,一是有助於提高整個社會的效率,為政府決策、經濟發展提供重要、科學的參考依據。二是從宏觀經濟層面對優化產業結構起到推動作用。三是在當前提倡大眾創業、萬眾創新的環境下,有利於推動大數據產業向前發展,增加更多的創新機會。四是在全球化的大環境下,我國以更大的力度、更高的視角推動大數據建設,對我國未來在全球化競爭中搶佔先機有著重要意義。」姜偉超說。

企業抓住機遇謀求發展

《綱要》提出,促進大數據發展應以企業為主體,深化大數據在各行業的創新應用。對此,DCCI互聯網研究院院長劉興亮認為,《綱要》強調企業在大數據發展中的主體地位,一方面是因為大數據的相關技術大多掌握在企業手中,而且企業掌握著更龐大的資料庫;另一方面是因為促進大數據發展能夠推動產業和企業的創新發展,提供客觀且科學的決策參考。

阿里巴巴研究院高級專家孟曄認為,大數據的發展更重要的價值在於將數據資源向中小企業開放。「如果能讓中小企業和大企業站在同一個起跑線上,就能夠更大地發揮它們的創新能力,以後也將會形成『大數據平台+中小企業/個人』的創新模式。」但他也提醒,大數據最大的效力體現在各行各業的交叉、融合中,並且需要相互共享和開放。「不光是政府數據的共享和開放,企業和企業之間、行業和行業之間的數據也需要共享和開放」。

盡管《綱要》的發布對行業和企業發展有不小的推動作用,但任偉巍建議,要給企業發展創造足夠寬松的競爭環境。現在的大數據廠商都不是靠政策優勢做起來的,僅憑政策不能打造優秀的廠商,一定要靠競爭、靠技術研發。

姜偉超認為,《綱要》的發布再一次明確彰顯了政府對於推動大數據建設的決心和目標,這對相關企業來說也是一個很好的機會。

大數據建設實際上涉及諸多相關領域。企業一方面需要藉助大數據提升自身的競爭力,另一方面要積極尋找新的機會,參與大數據建設。「未來可能會有更多的領域,以及之前企業所難觸碰到的領域向社會開放,這也從側面展示了政府繼續深化市場經濟的決心,對企業來說也預示著更多的機會。」姜偉超表示,《綱要》將對我國未來經濟發展產生重要影響,作為企業也應該及早適應這種變化。

十大工程引領行業發展

《綱要》規劃了十大重點工程,包括政府數據資源共享開放工程、國家大數據資源統籌發展工程、公共服務大數據工程、萬眾創新大數據工程以及網路和大數據安全保障工程等。

趙剛認為,《綱要》提出十大工程,是推進大數據發展的抓手。圍繞工程的推進,將建立起政府數據統一共享交換平台、政府數據統一開放平台、國家大數據平台、數據中心等一系列國家和地方大數據平台,並在經濟社會各個領域推進大數據應用示範和試點,這將興起大數據建設的熱潮,政府和社會將投入大量資金發展大數據,並以大投資來帶動大數據市場的繁榮。

姜偉超表示,《綱要》提出的十大工程涉及諸多領域,同時又是系統化的,體現了政府在我國大數據建設方面的力度和決心。十大工程有助於對我國整體的產業結構進行升級,有助於全面提升我國的信息化水平,有助於挖掘新的經濟增長點。十大工程既關系宏觀戰略,又深入民生領域,無論是對國家政府,對行業發展,還是對普通民眾都具有一定的積極意義。「未來社會必將是一個更加信息化的,同時又密切聯系在一起的社會。大數據的共享與科學有效應用將起到重要作用。」他說。

此外,《綱要》還提出,立足我國國情和現實需要,推動大數據發展和應用在未來5年至10年內逐步實現以下目標:打造精準治理、多方協作的社會治理新模式;建立運行平穩、安全高效的經濟運行新機制;構建以人為本、惠及全民的民生服務新體系;開啟大眾創業、萬眾創新的創新驅動新格局;培育高端智能、新興繁榮的產業發展新生態。

任偉巍認為:「這些發展目標在細分行業是能實現的,比如金融、旅遊等,畢竟還有至少5年時間。而現在的細分領域大數據廠商活躍起來都還沒有5年,時間還是有的。」

趙剛認為,《促進大數據發展行動綱要》將引領我國進入大數據的大發展時代。

以上是小編為大家分享的關於大數據產業迎來大發展時代的相關內容,更多信息可以關注環球青藤分享更多干貨

Ⅶ 在如此重視大數據的時代,我國能否率先統計病人手術後有多少可以恢復到或超過「人均預期健康壽命」的

已經有人在做了,不過中國的醫療數據分散而不統一,就算大數據整合起來也很麻煩。
但一些研究生正在做,相信未來我們看病就更加便捷高效,有可能不出門就治好病了。

Ⅷ 大數據時代,我國數據量究竟有多大

從2013年初開始,對於大數據爆發的焦慮感,緊迫感,不由自主地被捲入的甚至無力的感覺,驅動眾多行業、企業和團體去關注和開始接觸和了解大 數據,自覺或不自覺的,主動或不得已地去融入這波洪流。但是,真的說到大數據,我們中國到底有多少數據量,它們都分布在哪些行業,哪些數據是目 前可用的,哪些行業已經在使用數據,進入產業互聯網和數據引導的變革了?
可能看到的版圖依舊模糊。因此,我們懷抱很好的希望,以第一個吃螃蟹並期待來自行業的矯正和拍磚的態度,首先嘗試對於國內各個領域,行業以 及機構的數據擁有情況,使用情況以及未來路徑做一個粗獷地調研、梳理和判斷,對大數據時代我國各個領域數據資產的擁有和使用情況,也就是我們數 據資產的家底做個盤點,也對各個行業、系統進軍大數據,以及擁抱產業互聯網的進度和未來做個簡單判斷。事實上,大數據之題無疑繁若星辰,然而只 有在相對完整的視圖下,繁星若塵,我們才可得以一窺天機。
從我們手頭掌握的數據來看,2013年度,中國存儲市場出貨容量超過1個EB(1EB=多少),存儲總量而IDC曾經發布的預測表明在未來的3-4年,中國存儲總 容量可能達到18個EB。從數據存儲市場的需求來看,互聯網、醫療健康、通信、公共安全以及軍工等行業的需求是主要的,且上升態勢明顯。
鑒於存儲和伺服器的緊密相關,我們從已經獲得的資料可以知道,目前全球運行的伺服器總量超過5000萬台,美國國內運行的伺服器總體容量接近 1000萬台。從各種市場公開數據來看,2013年中國內地伺服器銷售總數接近為100萬台。大體估算,截止到2013年底,中國內地整體在運行的伺服器總數 量在300萬台以上。
從現有存儲容量看,中國目前可存儲數據容量大約在8EB-10EB左右,現有的可以保存下來的數據容量大約在5EB左右,且每兩年左右會翻上一倍。這些 被存儲數據的大體分布為:媒體/互聯網占據現有容量的1/3,政府部門/電信企業占據1/3,其他的金融、教育、製造、服務業各部分佔據剩餘1/3數據量 。
公開數據顯示,互聯網搜索巨頭網路2013年擁有數據量接近EB級別、阿里、騰訊聲明自己存儲的數據總量都達到了百PB以上。此外,電信、醫療、金 融、公共安全、交通、氣象等各個方面保存的數據量也都達到數十或者上百PB級別。
在目前被廣泛引用的IDC和EMC聯合發布的「2020年的數字宇宙」報告 預測到2020年,全球數字宇宙將會膨脹到40ZB,均攤每個人身上是5200GB以上,這個量將會如何被有效存儲和應用,我們眼下還很難想像。然而我們 看到該報告指出,從現在起到2020年,全球數字宇宙的膨脹率大約為每兩年翻一番。事實上,根據上述調查結論和伺服器容量調查,我們也能做出個相對 合理的推斷:目前,全球產生的數據量中僅有1%左右的數據能夠被保存下來,也就是說今天全球能夠被保存下來的數據也就是在50EB左右,而其中被標記 並用於分析的數據更是不到10%。
作為全球人口和計算設備保有量的大國,我國每年所能產生的數據量也極為龐大,有數據說2014年甚至可能達到ZB級別,但是真正被有效存儲下來的 數據僅僅是其中極微少部分,中國保存下來數據佔全球數據的比例大約在10%左右,也就是上面說的5EB。這些數據中,目前已被標記並用於分析的數據僅 達到500PB左右,也是接近10%的一個比例。
伴隨著雲計算迅速普及和各行業,各企業和部門對於數據資產保存和利用意識的增強,以及通過互聯網、大數據對產業進行變革的意願,未來2-3年一 定會有越來越多的行業、大企業步入到PB、百PB、甚至EB級別數據俱樂部,未來3-3年中國的數據總量也將呈翻倍上升態勢,我們預測2015年中國就可能 突破10EB數據保有量,被標簽和分析利用數據量也將上升到EB級別,這些數據增長中互聯網、政務、醫療、教育、安全等行業和領域所做貢獻最大,而相 對傳統的物流、生產製造、甚至農業等領域數據擁有量的增長將更加明顯。