???? 在新技術(shù)浪潮下,“倫敦眼燈光秀”只是人們現(xiàn)在身處的大數(shù)據(jù)時代的一個小魔術(shù)而已。 2012年倫敦奧運(yùn)會讓全世界觀眾都因為激烈的比賽而心潮起伏,如何知道大家對于奧運(yùn)是什么樣的心情?很簡單,只要你去看一眼世界上最大的摩天輪之一——“倫敦眼”,答案就可了然于胸。 用“倫敦眼”的燈光秀來展示觀眾對于奧運(yùn)比賽的情緒,這是EDF Energy公司和美國麻省理工學(xué)院的合作項目。這個項目實時過濾人們在Twitter上發(fā)布的微博,根據(jù)一些與奧運(yùn)有關(guān)的詞匯,比如“2012 London Olympic”、“Olympic Game”等,將與之相關(guān)的微博從海量數(shù)據(jù)中過濾出來,之后采用被稱作“SentiStrength”的情感計算程序自動對每條微博表達(dá)的情緒作出判斷,將其分為“積極情緒”、“消極情緒”或者“中性情緒”。每天數(shù)十萬的奧運(yùn)相關(guān)微博經(jīng)過分析匯總后,就可以知道當(dāng)天觀眾對于奧運(yùn)的整體情緒是怎樣的,將這個統(tǒng)計結(jié)果以倫敦眼上不同顏色燈光投射,人們一眼就可以知道其他人的心情。如果你看到四分之三的倫敦眼轉(zhuǎn)輪上的燈光是橙色的,那么這代表了75%的奧運(yùn)相關(guān)微博是積極情緒,而悲觀情緒則以藍(lán)色燈光來表示。 從PB到EB的遷越 大數(shù)據(jù)時代呼喚新技術(shù) 多大的數(shù)據(jù)量才能稱得上“大數(shù)據(jù)”?這其實是頗為令人困惑的一個問題。在談?wù)摂?shù)據(jù)大小之前,我們先來了解數(shù)據(jù)量的衡量單位,從小到大依次為KB、MB、GB、TB、PB、EP和ZB,其相互之間的轉(zhuǎn)換公式為:1024K=1MB、1024MB=1GB、1024GB=1TB、1024TB=1PB、1024PB=1EB、1024EB=1ZB。數(shù)據(jù)大小是相對而言的一個變化的概念,在20世紀(jì)末,MB是最常用的存儲單位,那時1GB就可以稱得上“大數(shù)據(jù)”了。而隨著IT技術(shù)的快速發(fā)展,我們逐步邁入了GB時代、TB時代,而現(xiàn)在正處于從PB到EB的遷越階段。 為了對數(shù)據(jù)之大獲得更感性的認(rèn)識,讓我們來看一組數(shù)據(jù):Facebook管理了超過400億張圖片,所需存儲空間超過100PB,每天發(fā)布的新消息超過60億條,所需存儲空間超過10TB;Twitter一天產(chǎn)生1.9億條微博;搜索引擎一天產(chǎn)生的日志高達(dá)35TB,Google一天處理的數(shù)據(jù)量超過25PB;YouTube一天上傳的視頻總時長為5萬個小時……如果愿意的話,這個單子還可以拉得很長。 我們正處于電子數(shù)據(jù)暴漲的時代,統(tǒng)計數(shù)據(jù)表明:2010年全世界信息總量是1ZB,最近三年人類產(chǎn)生的信息量已經(jīng)超過了之前人類歷史上所產(chǎn)生的所有信息之和,如果再過10年回過頭來看,這個數(shù)字其實也不算體量巨大,要知道,數(shù)字信息量正在以每五年增加10倍的速度加速擴(kuò)張。 為何數(shù)據(jù)會發(fā)生井噴式的增長?這與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)大潮的高速發(fā)展以及IT技術(shù)的快速進(jìn)步有直接關(guān)聯(lián)?;ヂ?lián)網(wǎng)的普及、智能手機(jī)等手持設(shè)備的廣泛使用使得越來越多的人能夠?qū)⒖芍鋾r間投入到網(wǎng)站點擊行為中,而物聯(lián)網(wǎng)尚處于萌芽期,其發(fā)展的結(jié)果是:任意物品和設(shè)施都有可能24小時不間斷地產(chǎn)生狀態(tài)信息。而這背后的推動力,則是硬件成本的快速下降:每年存儲每GB信息的存儲成本降低50%,這使得電子設(shè)備的無所不在成為可能。電子信息的表現(xiàn)形式多種多樣,用戶訪問網(wǎng)站的海量點擊記錄數(shù)據(jù)、用戶UGC(全稱User Generated Content,即用戶生成內(nèi)容)產(chǎn)生的大量圖片和視頻、電子商務(wù)網(wǎng)站的在線購買記錄、通信數(shù)據(jù)、RFID(全稱Radio Frequency Identification,即射頻識別)、醫(yī)療信息……數(shù)據(jù)無處不在,無時不在。 毫無疑問,我們已經(jīng)身處一個真正的“大數(shù)據(jù)”時代,但關(guān)于大數(shù)據(jù)的確切定義,目前尚無統(tǒng)一獲得公認(rèn)的說法。Wikipedia里給出的頗具實用主義色彩的定義為:所謂“大數(shù)據(jù)”,是指數(shù)據(jù)量太大以至于目前手頭的數(shù)據(jù)管理工具已經(jīng)不便于管理數(shù)據(jù)。 IBM則用3V(Volume、Velocity、Variety)來描述大數(shù)據(jù)所擁有的特點。大容量(Volume)指數(shù)據(jù)體量巨大,這是一般人最直觀的感受;多形式(Velocity)是從數(shù)據(jù)類型的角度來看的,數(shù)據(jù)的存在形式從過去結(jié)構(gòu)化數(shù)據(jù)為主轉(zhuǎn)換為形式多樣,既包含傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),也包含類似于XML/JSON形式的半結(jié)構(gòu)化形式和更多的非結(jié)構(gòu)化數(shù)據(jù);高速率(Variaty)則是從數(shù)據(jù)產(chǎn)生效率角度來說明問題:數(shù)據(jù)以非常高的速率到達(dá)系統(tǒng)內(nèi)部,比如大量傳感器的實時數(shù)據(jù)傳輸,股票的實時交易數(shù)據(jù)等。 后來,在3V的基礎(chǔ)上,又增加了Value(價值)這個維度來描述大數(shù)據(jù)的特點,即數(shù)據(jù)價值密度低,因此需要從低價值的原始海量數(shù)據(jù)中進(jìn)行深度挖掘和計算,總結(jié)出具備高價值的數(shù)據(jù)。 IDC更側(cè)重于從技術(shù)角度來說明“大數(shù)據(jù)”概念:大數(shù)據(jù)處理技術(shù)代表了新一代的技術(shù)架構(gòu),這種架構(gòu)通過高速獲取數(shù)據(jù)并對其進(jìn)行分析和挖掘,從海量形式各異的數(shù)據(jù)源中更有效地抽取出富含價值的信息。 Google是大數(shù)據(jù)潮流的重要推動者,Google首席經(jīng)濟(jì)學(xué)家Hal Varian是這樣闡述大數(shù)據(jù)作用的:海量數(shù)據(jù)可廣泛獲得,所稀缺的是如何從中挖掘出智慧和觀點。 綜合上面各種觀點可以看出,從具備4V特性的大量數(shù)據(jù)中挖掘高價值知識是各界對于大數(shù)據(jù)的一個共識。 美國政府在2012年初提出了“大數(shù)據(jù)研究發(fā)展計劃”,這是可以和克林頓執(zhí)政時期提出的“數(shù)字高速公路”計劃相媲美的戰(zhàn)略性引導(dǎo)規(guī)劃,旨在提高美國從大型復(fù)雜數(shù)據(jù)集中提取知識和觀點的能力。在這個計劃里,包括美國國防部在內(nèi)的六個聯(lián)邦政府的部門和機(jī)構(gòu)宣布新的2億美元投資,以提高從大量數(shù)據(jù)中收集、訪問、組織和發(fā)現(xiàn)信息的工具和技術(shù)水平。相信其他國家包括中國促進(jìn)相關(guān)產(chǎn)業(yè)的政策也會很快到來。 由于數(shù)據(jù)量增長速度太快,傳統(tǒng)的數(shù)據(jù)管理工具已經(jīng)不能高效地對其存儲和處理,新時代呼喚新技術(shù)。 最近三年人類產(chǎn)生的信息量已經(jīng)超過了之前人類歷史上所產(chǎn)生的所有信息之和,如果再過10年回過頭來看,這個數(shù)字其實也不算體量巨大,要知道,數(shù)字信息量正在以每五年增加10倍的速度加速擴(kuò)張。 技術(shù)范型轉(zhuǎn)換 大數(shù)據(jù)之翼 傳統(tǒng)的數(shù)據(jù)處理主要使用關(guān)系型數(shù)據(jù)庫技術(shù),數(shù)據(jù)庫企業(yè)巨頭Oracle是這一時期的代表企業(yè)。隨著大數(shù)據(jù)時代的到來,傳統(tǒng)關(guān)系型數(shù)據(jù)庫在可擴(kuò)展性方面的缺陷逐漸暴露出來,即使采用并行數(shù)據(jù)庫集群,最多也只能管理百臺左右的機(jī)器,而且這種并行數(shù)據(jù)庫要求高配置服務(wù)器才可正常運(yùn)轉(zhuǎn),因此,以其管理海量數(shù)據(jù)成本之高可以想見。 對于很多應(yīng)用場景,尤其是互聯(lián)網(wǎng)相關(guān)應(yīng)用,并不像銀行業(yè)務(wù)等對數(shù)據(jù)的一致性有很高的要求,更看重數(shù)據(jù)的高可用性以及架構(gòu)的可擴(kuò)展性等技術(shù)因素。NoSQL數(shù)據(jù)庫應(yīng)運(yùn)而生,作為適應(yīng)不同應(yīng)用場景要求的新型數(shù)據(jù)存儲與處理架構(gòu),其和傳統(tǒng)數(shù)據(jù)庫有很強(qiáng)的互補(bǔ)作用,而且應(yīng)用場景更加廣泛。Yahoo!公司部署了包含4000臺普通服務(wù)器的Hadoop集群,可以存儲和處理高達(dá)4PB的數(shù)據(jù),整個分布式架構(gòu)具有非常強(qiáng)的可擴(kuò)展性。NoSQL數(shù)據(jù)庫的廣泛使用代表了一種技術(shù)范型的轉(zhuǎn)換。 大數(shù)據(jù)處理的目標(biāo)是從海量異質(zhì)數(shù)據(jù)中挖掘知識,包含了數(shù)據(jù)源收集、數(shù)據(jù)存儲管理、數(shù)據(jù)分析與挖掘以及數(shù)據(jù)展現(xiàn)與獲取等幾個序列進(jìn)行的步驟。 原始數(shù)據(jù)源來源各異,就是說既包含傳統(tǒng)的企業(yè)結(jié)構(gòu)化數(shù)據(jù),也包含從移動設(shè)備、互聯(lián)網(wǎng)用戶數(shù)據(jù)、傳感器等收集到的半結(jié)構(gòu)化或者非結(jié)構(gòu)化數(shù)據(jù)。由于很多數(shù)據(jù)形式不規(guī)整,包含噪音,首先需要從原始數(shù)據(jù)中進(jìn)行數(shù)據(jù)抽取,獲得后續(xù)分析所需的信息。之后對于海量數(shù)據(jù),將其存儲進(jìn)入NoSQL數(shù)據(jù)庫中,與傳統(tǒng)數(shù)據(jù)庫不同的是:NoSQL數(shù)據(jù)庫不追求應(yīng)用場景的統(tǒng)一,而是針對不同類型的應(yīng)用有專門的NoSQL數(shù)據(jù)庫來進(jìn)行存儲管理,這種類似于垂直定制的技術(shù)方案更能適應(yīng)具體的應(yīng)用場合,比如對于社交網(wǎng)絡(luò)數(shù)據(jù)的存儲就更適合使用Neo4j等圖式數(shù)據(jù)庫;對于實時響應(yīng)要求高的場合使用HBase等列式數(shù)據(jù)庫更好,等等。對于海量數(shù)據(jù)的后臺批處理任務(wù),目前Hadoop是獲得最廣泛使用的分布式存儲與計算系統(tǒng),通過HDFS分布式文件系統(tǒng)來對數(shù)據(jù)進(jìn)行存儲,使用MapReduce計算框架對數(shù)據(jù)進(jìn)行處理,系統(tǒng)本身負(fù)責(zé)數(shù)據(jù)的高可用性以及系統(tǒng)的可擴(kuò)展性、容錯性等復(fù)雜管理任務(wù),具體應(yīng)用開發(fā)人員只要關(guān)注業(yè)務(wù)邏輯本身即可,大大促進(jìn)了相關(guān)應(yīng)用的開發(fā)效率。 在數(shù)據(jù)存儲與基本處理層之上,是數(shù)據(jù)挖掘與分析技術(shù)層。大數(shù)據(jù)處理的目標(biāo)是沙里淘金,從海量原始數(shù)據(jù)中挖掘領(lǐng)域知識是其根本目的,盡管NoSQL數(shù)據(jù)庫提供了數(shù)據(jù)存儲場所與簡單的讀寫處理,但要挖掘更深層的知識,更依賴于利用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、時空序列分享等復(fù)雜技術(shù)手段來從數(shù)據(jù)中獲取知識。 數(shù)據(jù)可視化也是大數(shù)據(jù)處理中的關(guān)鍵一環(huán),其主要目的是將挖掘出來的知識以形象、易于理解的形式呈現(xiàn)給用戶,是所挖掘知識的具體表現(xiàn)方法。之后,就可以在各種不同的數(shù)據(jù)接收設(shè)備上來對挖掘出的知識進(jìn)行獲取。 海量原始數(shù)據(jù)經(jīng)過上述層次處理步驟,就轉(zhuǎn)換為用戶易于理解和接受的知識,目前各種層次的相關(guān)技術(shù)與系統(tǒng)方興未艾,都處于高速發(fā)展過程中。 無分行業(yè) 新技術(shù)下的商業(yè)“煉金術(shù)” 對于大數(shù)據(jù)潮流而言,新的數(shù)據(jù)形式和數(shù)據(jù)需求催生了新的技術(shù)范型,而新的技術(shù)范型引發(fā)了新的商業(yè)機(jī)遇。這種影響是深刻而廣泛的,從引導(dǎo)潮流的互聯(lián)網(wǎng)公司到傳統(tǒng)IT行業(yè)企業(yè),從金融行業(yè)到傳統(tǒng)零售行業(yè),無不受其影響。 互聯(lián)網(wǎng)公司:Netflix Netflix是在線網(wǎng)絡(luò)視頻點播互聯(lián)網(wǎng)公司,根據(jù)美國市場研究公司IHS測算,Netflix 2011年在美國的在線電影收入已經(jīng)超過蘋果,市場份額達(dá)到45%,蘋果則從61%下滑至32%。Netflix從本質(zhì)上說是一家大數(shù)據(jù)公司。以2011年的數(shù)據(jù)為例,Netflix用戶超過2500萬;每天大約3000萬劇集;僅在2011年最后3個月中,被觀看的視頻流就超過了20億個小時;每天大約400萬次用戶打分;每天大約300萬搜索。此外,Netflix還會嘗試分析用戶的地理定位數(shù)據(jù)、設(shè)備信息,以及從Facebook和Twitter獲得的社會媒體數(shù)據(jù)來為更加準(zhǔn)確的個性化推薦打下基礎(chǔ)。Netflix公司高級數(shù)據(jù)科學(xué)家Mohammad Sabah曾對媒體表示,Netflix正在采集并分析驚人的數(shù)據(jù)來試驗算出下一步你想要看什么電影。他還說,用戶選擇的電影已經(jīng)有75%來自Netflix的推薦。 傳統(tǒng)IT公司:IBM 2011年2月,IBM新推出的超級電腦“沃森”(Watson)在美國最受歡迎的老牌智力問答競猜節(jié)目《危險邊緣》(Jeopardy!)的人機(jī)智能問答比賽中,大比分超過人類參賽者贏得了比賽。要知道,《危險邊緣》節(jié)目中提出的問題五花八門、無所不包,幾乎覆蓋了人類的所有知識領(lǐng)域,“沃森”在節(jié)目中表現(xiàn)出色,戰(zhàn)勝了該節(jié)目歷史上兩位最成功的選手詹寧斯和魯特。 “沃森”采用分布式計算架構(gòu),整個系統(tǒng)擁有15TB內(nèi)存、2880個處理器、每秒可進(jìn)行80萬億次運(yùn)算。沃森的海量“知識庫”是其能夠戰(zhàn)勝人類的關(guān)鍵,它不僅包含了語義詞典等結(jié)構(gòu)化信息,更多的知識要依賴系統(tǒng)從互聯(lián)網(wǎng)網(wǎng)頁等大量非結(jié)構(gòu)化數(shù)據(jù)中進(jìn)行挖掘,比如通過挖掘可以知道《勇敢的心》是一部1995年發(fā)行的電影,其導(dǎo)演是梅爾吉布森,主要演員包括梅爾·吉布森、蘇菲·瑪索等。 “沃森”在接收到主持人的問題后,利用深層語言分析技術(shù)分析問題所屬于的類型(電影、圖書、謎題、地理等)以及問題的焦點所在,并通過問題分解算法把復(fù)雜問題分解為若干單一問題,之后利用搜索技術(shù)和自然語言處理技術(shù)從海量知識庫中產(chǎn)生多個候選答案,根據(jù)諸多不同尺度評估這些候選答案匹配問題的程度。IBM研發(fā)團(tuán)隊為“沃森”開發(fā)的100多套算法可以在3秒內(nèi)解析問題并檢索知識庫,然后再篩選出最可能的答案并輸出成人類語言,形成最終答案。 “沃森”在《危險邊緣》中的成功獲得了廣泛關(guān)注,其商業(yè)化舉措將被首先應(yīng)用在醫(yī)療和金融行業(yè)。美國哥倫比亞大學(xué)醫(yī)療中心和馬里蘭大學(xué)醫(yī)學(xué)院已與IBM公司簽訂合同,兩所大學(xué)的醫(yī)療人員將利用沃森更快、更準(zhǔn)確地診病和治病。 金融:Derwent基金 基金公司可以從大數(shù)據(jù)中窺探并預(yù)測股市走向嗎?英國倫敦基金公司Derwent Capital Markets認(rèn)為這個問題的答案是肯定的。他們啟動了金額為2500萬英鎊的專項基金,通過分析Twitter上發(fā)表的微博內(nèi)容,統(tǒng)計大眾對于股市的信心和情緒,依此來預(yù)測股市走向,并在實際運(yùn)作中獲得了較好的收益。在2010年7月的股災(zāi)中,該基金能夠維持1.85%的報酬率,領(lǐng)先于S&P 500指數(shù)和基金研究公司Hedge Fund Research的收益率。 這一基金采納了美國印第安納大學(xué)Johan Bollen等人的研究結(jié)果:研究者采用兩種情緒追蹤工具來分析Twitter中展現(xiàn)的公眾情緒,其一是比較Twitter中正面和負(fù)面評論的比例,其二則利用了Google設(shè)計的一款工具,評價人們的6種心理狀態(tài),包括冷靜、警惕、確定、充滿活力、善意、愉快。Bollen發(fā)布的一項研究結(jié)果中,使用社交網(wǎng)絡(luò)去預(yù)測道瓊斯指數(shù)的走勢,準(zhǔn)確率達(dá)到87.6%。此外,美國麻省理工學(xué)院的研究人員根據(jù)情緒詞將Twitter內(nèi)容標(biāo)定為正面或負(fù)面情緒。結(jié)果發(fā)現(xiàn),無論是如“希望”的正面情緒,還是如“害怕”、“擔(dān)憂”的負(fù)面情緒,其占總數(shù)的比例,都預(yù)示著道瓊斯指數(shù)、標(biāo)準(zhǔn)普爾500指數(shù)、納斯達(dá)克指數(shù)的下跌。研究者據(jù)此認(rèn)為,只要是情緒的突然爆發(fā),無論希望或擔(dān)憂,都反映出人們對于市場的不確定性,因此能預(yù)測股市之后的走向。 傳統(tǒng)零售企業(yè):沃爾瑪

傳統(tǒng)零售商巨頭沃爾瑪和惠普公司進(jìn)行合作,構(gòu)建能夠存儲4PB信息的數(shù)據(jù)倉庫,用來記錄全球6000多個銷售終端獲得的每日超過2.6億筆交易數(shù)據(jù)。通過應(yīng)用機(jī)器學(xué)習(xí)技術(shù),沃爾瑪可以從零售數(shù)據(jù)中挖掘出相關(guān)知識,用于評估其定價策略的合理性和廣告投放的效益,并更好地指導(dǎo)其全球供應(yīng)鏈的配置。 大數(shù)據(jù)處理技術(shù)代表了新一代的技術(shù)架構(gòu),這種架構(gòu)能從海量形式各異的數(shù)據(jù)源中更有效地抽取出富含價值的信息。 張俊林,新浪微博研發(fā)人員,中科院軟件所博士,《這就是搜索引擎:核心技術(shù)詳解》一書作者。 “大數(shù)據(jù)”,在路上 大數(shù)據(jù)概念最早由麥肯錫提出,之后獲得了全球范圍內(nèi)工業(yè)界、學(xué)術(shù)界、商業(yè)界的追捧與推動,形成了產(chǎn)業(yè)共振。大量初創(chuàng)公司、老牌互聯(lián)網(wǎng)與IT公司、商業(yè)機(jī)構(gòu)都轟轟烈烈地投入其中。 財大氣粗的巨型公司致力于提供“大數(shù)據(jù)”存儲與計算的基礎(chǔ)架構(gòu)與平臺,Amazon的云存儲與彈性計算平臺(AWS/EC2)、微軟的Azure云計算平臺、Google的App Engine都是其中的佼佼者。 通用的云存儲與計算平臺可以對其他企業(yè)和機(jī)構(gòu)提供按需服務(wù),這對于初創(chuàng)企業(yè)節(jié)省創(chuàng)業(yè)成本起到了很大的推動與促進(jìn)效用,在創(chuàng)業(yè)初期用戶較少的情況下,可以花費較少的租金租用云平臺的基礎(chǔ)設(shè)施,一旦流量激增,只需擴(kuò)大資源租用數(shù)量就可以快速滿足暴增的用戶請求。相較于傳統(tǒng)的創(chuàng)業(yè)企業(yè)自己維護(hù)存儲與計算系統(tǒng)的方式,這種平臺租用的方式不僅能夠節(jié)省創(chuàng)業(yè)成本,也增加了IT資源管理的快速響應(yīng)和靈活性。Amazon公司云平臺已經(jīng)為成千上萬家創(chuàng)業(yè)公司和機(jī)構(gòu)提供相關(guān)服務(wù),比如近兩年名聲大噪的圖片共享型社交網(wǎng)站Pinterest就租用了亞馬遜AWS存儲服務(wù),納斯達(dá)克每天會上傳超過50萬個文件到Amazon云存儲平臺。游戲化平臺服務(wù)公司BigDoor表示:“AWS平臺幫助我們以極低的成本快速升級系統(tǒng)。在任何時候,我們都有運(yùn)轉(zhuǎn)良好的12臺數(shù)據(jù)庫服務(wù)器、45臺應(yīng)用服務(wù)器、6臺靜態(tài)服務(wù)器和6臺分析服務(wù)器。如果流量或處理能力超過了目前的服務(wù)能力,我們的系統(tǒng)會自動升級;如果不需要就會自動降級,從而節(jié)省費用?!?p> 在這波“大數(shù)據(jù)”浪潮中,更多的中小型創(chuàng)業(yè)公司逐浪起航,其中既有Cloudera、MapR、HortonWorks這種完善分布式計算生態(tài)系統(tǒng)的技術(shù)型公司,也有Dropbox、Zillabyte、Decide這種面向企業(yè)和消費者直接提供“大數(shù)據(jù)”服務(wù)的初創(chuàng)公司。 Cloudera、MapR和HortonWorks都是目前維護(hù)與改進(jìn)Hadoop平臺的主力技術(shù)公司,它們一方面改進(jìn)現(xiàn)有系統(tǒng)的性能和功能方面的缺點,同時也在Hadoop平臺的易用性方面下了很大功夫,以促進(jìn)這個平臺的更廣泛流行。類似的技術(shù)公司還包括文檔NoSQL工具M(jìn)ongoDB的開發(fā)方10gen等很多新型技術(shù)創(chuàng)業(yè)公司,它們?yōu)檎麄€“大數(shù)據(jù)”生態(tài)體系提供了基礎(chǔ)的技術(shù)平臺。 Dropbox是免費網(wǎng)絡(luò)文件同步工具,用戶可以方便地存儲和共享感興趣的各種類型的文件,自2007年創(chuàng)立以來,Dropbox正以年用戶增長10倍的數(shù)據(jù)獲得用戶的廣泛歡迎;Zillabyte提供了一系列大數(shù)據(jù)分析算法和工具,幫助企業(yè)用戶對海量數(shù)據(jù)進(jìn)行深入挖掘以輔助企業(yè)決策;而Decide.com則為消費者提供了對大數(shù)據(jù)進(jìn)行實時商業(yè)分析服務(wù),比如它會通過大量數(shù)據(jù)的趨勢分析,告知用戶何時以什么價格買入某類電子產(chǎn)品是最適宜的。 這里只列舉了少量有代表性的“大數(shù)據(jù)”相關(guān)商業(yè)公司,事實上越來越多的商業(yè)公司已經(jīng)意識到“大數(shù)據(jù)”所蘊(yùn)含的商業(yè)機(jī)遇并陸續(xù)投入其中。就目前“大數(shù)據(jù)”相關(guān)的整個生態(tài)系統(tǒng)而言,我們可以說,是數(shù)據(jù)爆炸催生了新的技術(shù)范型與挑戰(zhàn),而新的技術(shù)范型引發(fā)了新的商業(yè)機(jī)遇。 “大數(shù)據(jù)”對技術(shù)的高要求以及“數(shù)據(jù)資產(chǎn)”的私密性,決定了“大數(shù)據(jù)”最終只能是少數(shù)人的游戲,但好消息是,這場華麗游戲才揭開序幕,在游戲結(jié)束之前,至少每個人都有加入的權(quán)利。
愛華網(wǎng)本文地址 » http://www.klfzs.com/a/9101032201/55372.html
愛華網(wǎng)



