1. 為什麼紙牌屋被稱為用大數據「算」出來的美劇

國Netflix公司是一家在線影片租賃提供商,該公司的網站收集了大量用戶內行為偏好數據,經分析後發容現,喜歡觀看BBC老版《紙牌屋》的用戶,大多喜歡
大衛·芬奇導演或凱文·史派西主演的電視劇。於是,Netflix投資一億美元拍攝了新版 《紙牌屋》,請大衛·芬奇執導、凱文·史派西做主演。結果,大
數據技術讓Netflix賺得盆滿缽滿。

2. 奈飛公司的創新的大數據推薦演算法

第一個Netflix大獎成功的解決了一個巨大的挑戰,為提供了50個以上評級的觀眾准確的預測他們的口味。下一個百萬大獎目標是,為那些不經常做影片評級或者根本不做評級的顧客推薦影片,要求使用一些隱藏著觀眾口味的地理數據和行為數據來進行預測。同樣,獲勝者需要公開他們的演算法。如果能解決這個問題,Netflix就能夠很快開始向新客戶推薦影片,而不需要等待客戶提供大量的評級數據後才能做出推薦。
新的比賽用數據集有1億條數據,包括評級數據,顧客年齡,性別,居住地區郵編,和以前觀看過的影片。所有的數據都是匿名的,沒有辦法關聯到netflix的任何一個顧客。
與第一個大獎賽不同,這次比賽沒有設定比賽目標。50萬美金首先獎勵給6個月內取得領先的團隊,另外50萬美金獎勵給18個月後取得領先的團隊。
推薦引擎是Netflix公司的一個關鍵服務,1千多萬顧客都能在一個個性化網頁上對影片做出1-5的評級。Netflix將這些評級放在一個巨大的數據集里,該數據集容量超過了30億條。Netflix使用推薦演算法和軟體來標識具有相似品味的觀眾對影片可能做出的評級。兩年來,Netflix 已經使用參賽選手的方法提高了影片推薦的效率,這已經得到了很多影片評論家和用戶的好評。
Strands推薦引擎的首席科學家裡克·漢加特納博士寫道:「在短期內,搜索引擎將會越來越多地加入簡單的推薦技術,以處理接近的查詢詞(例如,「您要找的是這個,根據類似查詢/其他人的搜索,你可能要尋找的是這個。」)但從長期來說,而比起搜索行業和搜索技術,推薦技術會更加地無孔不入。」

3. 告訴你如何用大數據推動影視產業

關於大數據在影視方面的案例,Netflix 這個詞估計大家都快聽到耳朵起繭了,頻繁被提及。比如《紙牌屋》的成功 。
大數據技術在電影方面的應用,主要在於於電影劇本分析、電影營銷分析、電影用戶行為分析。

4. Netflix一年花了65億拍美劇,高成本的劇都是哪些

說起Netflix,也就是網飛,可能大家最先想到的就是他出的許多精品劇,甚至有很出名的劇集剛出就一次播完的“網飛行為”梗。不過縱使網飛製作美劇成本高、產量大,但人家相比起中國的某些電視劇來說,可以算是精品高產似母豬了。

為什麼網飛的劇這么受歡迎呢?最主要的原因是他們有做大數據分析,知道做什麼樣的原創劇集可以吸引到大批的流量。就比如改編自經典名著《綠山牆的安妮》的《小小安妮》,雖然也是一部青春片,但相比國產劇給人以更多的真實感,即使主角是個加拿大的小女孩,她在成長中遇到的一些困難是非常能引起我們的回憶和共鳴的。而這種共鳴,也是網飛的劇除了投入成本大之外,受歡迎又賺錢的原因了。

那麼,網飛一年花了65億拍美劇,高成本的劇都有哪些呢?小編就帶大家去觀看一下!

(1)《王冠

《王冠》是Netflix製作的一部歷史劇,劇情是關於現在還在為的英國女王,伊麗莎白二世的生平故事。

這部劇的第一季單價就創下了當時的最高紀錄1.3億美元,如果這個數據是真的的話,那麼算下來也就是說這部劇差不多每小時一集耗資高達650萬到1300萬美元了!

那麼錢都花在哪了呢?光是為各個角色,就准備了將近7000套服裝,如果這筆開支還不夠大的花,就要好好看看那個接近1:1比例的白金漢宮復製品拍攝地了。

由此我們可以看出網飛的劇受歡迎不是沒有原因的,人家除了劇本不錯之外,在各方面的細節上也做的非常到位,經費也用在了正確的地方上去了。

以上就是我推薦的三部網飛比較燒錢的劇了,雖然網飛出品的劇大部分質量都很好,但是也是有失手的時候。不過網飛看樣子似乎並不太在意花了這么多錢,畢竟他們很多的劇大部分時候的回報都很高。

5. 大數據是什麼概念

大數據是什麼?
在很多人的眼裡大數據可能是一個很模糊的概念,但是,在日常生活中大數據有離我們很近,我們無時無刻不再享受著大數據所給我們帶來的便利,個性化,人性化。全面的了解大數據我們應該從四個方面簡單了解。定義,結構特點,我們身邊有哪些大數據,大數據帶來了什麼,這四個方面了解。
那麼「大數據」到底是什麼呢?

在麥肯錫全球研究所給出的定義中指出:大數據即是一種規模大到在獲取,存儲,管理,分析方面大大超出了傳統資料庫軟體工具能力范圍的數據集合。簡單而言大數據是數據多到爆表。大數據的單位一般以PB衡量。那麼PB是多大呢?1GB=1024MB ,1PB=1024GB才足以稱為大數據。

如圖:

衡量單位一覽表
其次,大數據具有什麼樣的特點和結構呢?

大數據從整體上看分為四個特點,
第一,大量。

衡量單位PB級別,存儲內容多。
第二,高速。

大數據需要在獲取速度和分析速度上要及時迅速。保證在短時間內更多的人接收到信息。
第二,多樣。

數據的來源是各種渠道上獲取的,有文本數據,圖片數據,視頻數據等。因此數據是多種多樣的。
第三,價值。

大數據不僅僅擁有本身的信息價值,還擁有商業價值。大數據在結構上還分為:結構化,半結構化,非結構化。結構化簡單來講是資料庫,是由二維表來邏輯表達和實現的數據。非結構化即數據結構不規則或不完整,沒有預定義的數據模型。由人類產生的數據大部分是非結構化數據。

6. 如何創建一個大數據平台

所謂的大數據平台不是獨立存在的,比如百度是依賴搜索引擎獲得大數據並開展業務的,阿里是通過電子商務交易獲得大數據並開展業務的,騰訊是通過社交獲得大數據並開始業務的,所以說大數據平台不是獨立存在的,重點是如何搜集和沉澱數據,如何分析數據並挖掘數據的價值。

我可能還不夠資格回答這個問題,沒有經歷過一個公司大數據平台從無到有到復雜的過程。不過說說看法吧,也算是梳理一下想法找找噴。
這是個需求驅動的過程。
曾經聽過spotify的分享,印象很深的是,他們分享說,他們的hadoop集群第一次故障是因為,機器放在靠窗的地方,太陽曬了當機了(笑)。從簡單的沒有機房放在自家窗前的集群到一直到現在復雜的數據平台,這是一個不斷演進的過程。
對小公司來說,大概自己找一兩台機器架個集群算算,也算是大數據平台了。在初創階段,數據量會很小,不需要多大的規模。這時候組件選擇也很隨意,Hadoop一套,任務調度用腳本或者輕量的框架比如luigi之類的,數據分析可能hive還不如導入RMDB快。監控和部署也許都沒時間整理,用腳本或者輕量的監控,大約是沒有ganglia、nagios,puppet什麼的。這個階段也許算是技術積累,用傳統手段還是真大數據平台都是兩可的事情,但是為了今後的擴展性,這時候上Hadoop也許是不錯的選擇。
當進入高速發展期,也許擴容會跟不上計劃,不少公司可能會遷移平台到雲上,比如AWS阿里雲什麼的。小規模高速發展的平台,這種方式應該是經濟實惠的,省了運維和管理的成本,擴容比較省心。要解決的是選擇平台本身提供的服務,計算成本,打通數據出入的通道。整個數據平台本身如果走這條路,可能就已經基本成型了。走這條路的比較有名的應該是netflix。
也有一個階段,你發現雲服務的費用太高,雖然省了你很多事,但是花錢嗖嗖的。幾個老闆一合計,再玩下去下個月工資發布出來了。然後無奈之下公司開始往私有集群遷移。這時候你大概需要一群靠譜的運維,幫你監管機器,之前兩三台機器登錄上去看看狀態換個磁碟什麼的也許就不可能了,你面對的是成百上千台主機,有些關鍵服務必須保證穩定,有些是數據節點,磁碟三天兩頭損耗,網路可能被壓得不堪重負。你需要一個靠譜的人設計網路布局,設計運維規范,架設監控,值班團隊走起7*24小時隨時准備出台。然後上面再有平台組真的大數據平台走起。
然後是選型,如果有技術實力,可以直接用社區的一整套,自己管起來,監控部署什麼的自己走起。這個階段部署監控和用戶管理什麼的都不可能像兩三個節點那樣人肉搞了,配置管理,部署管理都需要專門的平台和組件;定期Review用戶的作業和使用情況,決定是否擴容,清理數據等等。否則等機器和業務進一步增加,團隊可能會死的很慘,疲於奔命,每天事故不斷,進入惡性循環。
當然有金錢實力的大戶可以找Cloudera,Hortonworks,國內可以找華為星環,會省不少事,適合非互聯網土豪。當然互聯網公司也有用這些東西的,比如Ebay。
接下去你可能需要一些重量的組件幫你做一些事情。
比如你的數據接入,之前可能找個定時腳本或者爬log發包找個伺服器接收寫入HDFS,現在可能不行了,這些大概沒有高性能,沒有異常保障,你需要更強壯的解決方案,比如Flume之類的。
你的業務不斷壯大,老闆需要看的報表越來越多,需要訓練的數據也需要清洗,你就需要任務調度,比如oozie或者azkaban之類的,這些系統幫你管理關鍵任務的調度和監控。
數據分析人員的數據大概可能漸漸從RDBMS搬遷到集群了,因為傳統資料庫已經完全hold不住了,但他們不會寫代碼,所以你上馬了Hive。然後很多用戶用了Hive覺得太慢,你就又上馬交互分析系統,比如Presto,Impala或者SparkSQL。
你的數據科學家需要寫ML代碼,他們跟你說你需要Mahout或者Spark MLLib,於是你也部署了這些。
至此可能數據平台已經是工程師的日常工作場所了,大多數業務都會遷移過來。這時候你可能面臨很多不同的問題。
比如各個業務線數據各種數據表多的一塌糊塗,不管是你還是寫數據的人大概都不知道數據從哪兒來,接下去到哪兒去。你就自己搞了一套元數據管理的系統。
你分析性能,發現你們的數據都是上百Column,各種復雜的Query,裸存的Text格式即便壓縮了也還是慢的要死,於是你主推用戶都使用列存,Parquet,ORC之類的。
又或者你發現你們的ETL很長,中間生成好多臨時數據,於是你下狠心把pipeline改寫成Spark了。
再接下來也許你會想到花時間去維護一個門戶,把這些零散的組件都整合到一起,提供統一的用戶體驗,比如一鍵就能把數據從資料庫chua一下拉到HDFS導入Hive,也能一鍵就chua一下再搞回去;點幾下就能設定一個定時任務,每天跑了給老闆自動推送報表;或者點一下就能起一個Storm的topology;或者界面上寫幾個Query就能查詢Hbase的數據。這時候你的數據平台算是成型了。
當然,磕磕碰碰免不了。每天你都有新的問題和挑戰,否則你就要失業了不是?
你發現社區不斷在解決你遇到過的問題,於是你們架構師每天分出很多時間去看社區的進展,有了什麼新工具,有什麼公司發布了什麼項目解決了什麼問題,興許你就能用上。
上了這些亂七八糟的東西,你以為就安生了?Hadoop平台的一個大特點就是坑多。尤其是新做的功能新起的項目。對於平台組的人,老闆如果知道這是天然坑多的平台,那他也許會很高興,因為跟進社區,幫忙修bug,一起互動其實是很提升公司影響力的實情。當然如果老闆不理解,你就自求多福吧,招幾個老司機,出了問題能馬上帶路才是正道。當然團隊的技術積累不能不跟上,因為數據平台還是亂世,三天不跟進你就不知道世界是什麼樣了。任何一個新技術,都是坑啊坑啊修啊修啊才完善的。如果是關鍵業務換技術,那需要小心再小心,技術主管也要有足夠的積累,能夠駕馭,知道收益和風險。

7. Netflix的核心競爭力是什麼

創新模式,消除關鍵制約因素

在Netflix出現之前,美國有一個公司叫做Blockbuster,當年在美國風靡一時,曾經在全美有9000多家門店與接近6萬的雇員,專門提供給碟片租賃服務。Netflix的創始人Hasting當時經常在那裡租碟,有一次租碟之後,由於超過了歸還時間,交了約40美元的逾期費用。這件事情引起了Hasting的反思,如果有一家沒有逾期費用的租賃商,是不是給用戶的感官體驗會更好呢?

其實早期的Blockbuster也不僅僅只是一個單純租借音像製品的店,它也有它很鮮明的特點,不然也不能風靡全美。其最主要的特點是運用數據分析幹掉了一大批零散的競爭者,通過數據分析周圍用戶的人口特徵、喜好,以此來決定開店的位置以及藏碟的種類。

Netflix創始人看到了Blockbuster的優勢與不足,在商業模式上借鑒了Blockbuster優秀的數據分析模式,並且運用更高技術的分析方式。而與之不同的是,首先,Netflix採用網上租賃的形式,說白了就是O2O的方式,只要客戶在網上下單,隔夜之後就可以將光碟郵寄到用戶手中,用戶完全不用出門就可以拿到想看的碟片,看完之後,再將碟片郵寄回公司。其次,Netflix完全採用輕資產的形式,擺脫了重資產的束縛,大大降低了人力成本。最重要的是,1999年開始,Netflix上租借光碟只需要按照時間繳納會員費用,就可以租碟,並不存在逾期費用,當然,租碟的次數是有限制的。Netflix風靡之後,以絕對優勢將Blockbuster打垮,很快便占據了光碟租賃市場的霸主地位。

抓住偶然的機會,勇於顛覆自我

在2005年Netflix已經擁有了450萬的用戶群體,這對當時的流媒體來說,已經是非常了不起的用戶量了。2006年開始,由於寬頻業務的普及,用戶逐漸從電視轉向網路。Netflix嗅到了一絲危機,但同時,這也是巨大的商機,網路化用戶的急劇增長開始加大對流媒體的需求。於是,Netflix轉身進入了流媒體行業。與租賃業務相比,流媒體業務不僅能夠保證內容的實時性,而且換了平台仍舊能夠靠用戶記憶點播。這樣,就可以降低用戶每月的費用,且能夠更加精準大量的拿到用戶數據,以此將更精準的內容推給用戶。與此同時,Netflix開始發展內容產品,內容上的創新依靠內部員工。

依靠技術更加貼近用戶

如果讓您給Netflix定義,那麼您會認為它是一家什麼樣的公司呢?答案可能是娛樂公司,其實不然,Netflix是一家依賴技術的公司。上面我們講過,Netflix的創始人吸取了Blockbuster利用數據達到的優勢,並將其不斷擴大,時至今日,其仍然為優秀IT工程師開著業內最高的薪水。其技術解決的問題主要有二:一是通過技術手段更加貼近用戶口味;二是提高用戶感官體驗。通過技術手段貼近用戶的主要方式是依賴大數據,依賴用戶每日的觀看內容與操作方式得出數據,給與觀眾最適合的推薦。提高用戶體驗主要是利用壓縮其視頻的技術達到用戶在較慢網速下仍能得到較好的清晰度效果。

Netflix的商業邏輯,不僅僅是由於其消除了一些關鍵因素,也在於其前瞻性的眼界和不斷顛覆自身的勇氣。

8. 《怪奇物語2》開播,Netflix憑什麼五年反超HBO

《怪奇物語2》將在美國開播。作為Netflix眼中唯一的對手,還在苦等《權力游戲》的HBO也許該顫抖了。


9. 大數據行業的數據精準嗎

第一,用戶行為與特徵分析。顯然,只要積累足夠的用戶數據,就能分析出用戶的喜好與購買習慣,甚至做到「比用戶更了解用戶自己」。有了這一點,才是許多大數據營銷的前提與出發點。無論如何,那些過去將「一切以客戶為中心」作為口號的企業可以想想,過去你們真的能及時全面地了解客戶的需求與所想嗎?或許只有大數據時代這個問題的答案才更明確。

第二,精準營銷信息推送支撐。過去多少年了,精準營銷總在被許多公司提及,但是真正做到的少之又少,反而是垃圾信息泛濫。究其原因,主要就是過去名義上的精準營銷並不怎麼精準,因為其缺少用戶特徵數據支撐及詳細准確的分析。相對而言,現在的RTB廣告等應用則向我們展示了比以前更好的精準性,而其背後靠的即是大數據支撐。

第三,引導產品及營銷活動投用戶所好。如果能在產品生產之前了解潛在用戶的主要特徵,以及他們對產品的期待,那麼你的產品生產即可投其所好。例如,Netflix在近投拍《紙牌屋》之前,即通過大數據分析知道了潛在觀眾最喜歡的導演與演員,結果果然捕獲了觀眾的心。又比如,《小時代》在預告片投放後,即從微博上通過大數據分析得知其電影的主要觀眾群為90後女性,因此後續的營銷活動則主要針對這些人群展開。

第四,競爭對手監測與品牌傳播。競爭對手在干什麼是許多企業想了解的,即使對方不會告訴你,但你卻可以通過大數據監測分析得知。品牌傳播的有效性亦可通過大數據分析找准方向。例如,可以進行傳播趨勢分析、內容特徵分析、互動用戶分析、正負情緒分類、口碑品類分析、產品屬性分布等,可以通過監測掌握競爭對手傳播態勢,並可以參考行業標桿用戶策劃,根據用戶聲音策劃內容,甚至可以評估微博矩陣運營效果。

第五,品牌危機監測及管理支持。新媒體時代,品牌危機使許多企業談虎色變,然而大數據可以讓企業提前有所洞悉。在危機爆發過程中,最需要的是跟蹤危機傳播趨勢,識別重要參與人員,方便快速應對。大數據可以採集負面定義內容,及時啟動危機跟蹤和報警,按照人群社會屬性分析,聚類事件過程中的觀點,識別關鍵人物及傳播路徑,進而可以保護企業、產品的聲譽,抓住源頭和關鍵節點,快速有效地處理危機。

第六,企業重點客戶篩選。許多企業家糾結的事是:在企業的用戶、好友與粉絲中,哪些是最有價值的用戶?有了大數據,或許這一切都可以更加有事實支撐。從用戶訪問的各種網站可判斷其最近關心的東西是否與你的企業相關;從用戶在社會化媒體上所發布的各類內容及與他人互動的內容中,可以找出千絲萬縷的信息,利用某種規則關聯及綜合起來,就可以幫助企業篩選重點的目標用戶。

第七,大數據用於改善用戶體驗。要改善用戶體驗,關鍵在於真正了解用戶及他們所使用的你的產品的狀況,做最適時的提醒。例如,在大數據時代或許你正駕駛的汽車可提前救你一命。只要通過遍布全車的感測器收集車輛運行信息,在你的汽車關鍵部件發生問題之前,就會提前向你或4S店預警,這決不僅僅是節省金錢,而且對保護生命大有裨益。事實上,美國的UPS快遞公司早在2000年就利用這種基於大數據的預測性分析系統來檢測全美60000輛車輛的實時車況,以便及時地進行防禦性修理

第八,SCRM中的客戶分級管理支持。面對日新月異的新媒體,許多企業想通過對粉絲的公開內容和互動記錄分析,將粉絲轉化為潛在用戶,激活社會化資產價值,並對潛在用戶進行多個維度的畫像。大數據可以分析活躍粉絲的互動內容,設定消費者畫像各種規則,關聯潛在用戶與會員數據,關聯潛在用戶與客服數據,篩選目標群體做精準營銷,進而可以使傳統客戶關系管理結合社會化數據,豐富用戶不同維度的標簽,並可動態更新消費者生命周期數據,保持信息新鮮有效。

第九,發現新市場與新趨勢。基於大數據的分析與預測,對於企業家提供洞察新市場與把握經濟走向都是極大的支持。例如,阿里巴巴從大量交易數據中更早地發現了國際金融危機的到來。又如,在2012年美國總統選舉中,微軟研究院的David Rothschild就曾使用大數據模型,准確預測了美國50個州和哥倫比亞特區共計51個選區中50個地區的選舉結果,准確性高於98%。之後,他又通過大數據分析,對第85屆屆奧斯卡各獎項的歸屬進行了預測,除最佳導演外,其它各項獎預測全部命中。

第十,市場預測與決策分析支持。對於數據對市場預測及決策分析的支持,過去早就在數據分析與數據挖掘盛行的年代被提出過。沃爾瑪著名的「啤酒與尿布」案例即是那時的傑作。只是由於大數據時代上述Volume(規模大)及Variety(類型多)對數據分析與數據挖掘提出了新要求。更全面、速度更及時的大數據,必然對市場預測及決策分析進一步上台階提供更好的支撐。要知道,似是而非或錯誤的、過時的數據對決策者而言簡直就是災難。