系列專題:大數(shù)據(jù)營銷
???? 凱文·凱利來了。 這位被人們親昵地稱為“KK”的互聯(lián)網(wǎng)思想者,前不久飛抵北京進行學術交流。有意思的是,KK隨身攜帶一個小型傳感器,據(jù)說能隨時隨地搜集信息,包括他的地理位置、體溫、心跳、血壓等,然后傳到他的筆記本上,再由筆記本傳到云上。 在這個信息爆炸的大數(shù)據(jù)時代,一個人的所有行為和軌跡都能被跟蹤、記錄、存儲、分析,在西方世界,它有一個非常成熟的名字,翻譯成中文是“量化你自己”。 當然,這是非常高級的數(shù)據(jù)研究和應用?!俺松系?,都必須用數(shù)據(jù)來說話”。剛剛出版面世的《大數(shù)據(jù)》作者徐子沛旅美多年,也是信息學方面的專家。 在龐大和復雜的數(shù)據(jù)運轉中,幾乎所有的行業(yè)都與數(shù)據(jù)沾上了關系,互聯(lián)網(wǎng)亦如此。據(jù)悉,一分鐘內,Twitter上新發(fā)的數(shù)據(jù)量超過10萬,F(xiàn)acebook上的瀏覽量超過600萬…… 目前在中國,大數(shù)據(jù)很熱,就像夏天徘徊在35度左右的高溫。不可否認,大數(shù)據(jù)的爆發(fā)正在改變企業(yè)的傳統(tǒng)商業(yè)模式。尤其在互聯(lián)網(wǎng)領域,基于數(shù)據(jù)挖掘的業(yè)務方興未艾,第三方數(shù)據(jù)開發(fā)的基礎建設平臺異軍突起,也吸引了不少資金競相獵食此類公司。 凱鵬華盈創(chuàng)投基金(KPCB)主管合伙人周煒一直在尋找創(chuàng)新型的互聯(lián)網(wǎng)廣告公司,在“鐘情”秒針之前,周煒尋覓了兩個月?!懊脶樧龅帽容^純粹,有獨到之處。絕大多數(shù)互聯(lián)網(wǎng)廣告公司其實沒有太多技術含量,雖然大家都在做精準的數(shù)據(jù)挖掘,但是沒有太多實際的東西?!奔夹g出身的周煒說。 而IDG資本也早已布局。去年夏天,IDG資本和名力中國成長基金高調投資百分點科技720萬美元?!盎ヂ?lián)網(wǎng)信息爆炸會帶來有關數(shù)據(jù)處理、數(shù)據(jù)分析挖掘等領域新的發(fā)展機會,同時,也看好電子商務延伸產(chǎn)業(yè)鏈條、移動互聯(lián)網(wǎng)以及如八百客公司那樣面向中小企業(yè)提供在線軟件和信息服務的模式。”IDG資本合伙人、副總裁李豐認為。 數(shù)據(jù)挖掘公司真的是投資人眼中的富礦?“大數(shù)據(jù)”似乎看上去很美,但在從“海量數(shù)據(jù)”到“可用數(shù)據(jù)”的嬗變中,還需解決怎樣的難題沖突?關鍵是,處于粗放經(jīng)營的中國企業(yè),如何真正釋放數(shù)據(jù)價值,如何真正由數(shù)據(jù)轉化為效能? “大數(shù)據(jù)”偽命題? 數(shù)據(jù)不準確、取數(shù)難、維護難 大數(shù)據(jù)(Big Data),已經(jīng)是炙手可熱的流行語。 世界經(jīng)濟論壇去年發(fā)布報告,認定社交大數(shù)據(jù)為新財富,價值堪比石油。 以下是一則典型的在大數(shù)據(jù)“富礦”中掘金的財富故事:華爾街“德溫特資本市場”公司CEO霍廷利用電腦程序分析全球3.4億微博賬戶留言,進而判斷民眾情緒,并依據(jù)分析結果決定如何處理手中數(shù)以百萬美元計的股票,原則很簡單:如果所有人似乎都高興,買入;如果大家的焦慮情緒上升,拋售。這招收效顯著,霍廷的公司今年第一季度獲得7%的收益率。 在美國,一些社交網(wǎng)站產(chǎn)生的數(shù)據(jù)不僅為金融機構作出決策提供線索,同時也為總統(tǒng)競選團隊了解選民和衛(wèi)生機構分析疾病傳播狀況提供支持。谷歌公司與美國疾病控制和預防中心等機構合作,依據(jù)網(wǎng)民搜索內容分析全球范圍內流感等病疫傳播情況。 似乎,“大數(shù)據(jù)”時代已經(jīng)到來。 根據(jù)市場研究機構IDC的研究結果顯示,2011年創(chuàng)造的信息數(shù)量達到1800EB,并且還在以每年60%的速度高速增長,到2020年,全球每年產(chǎn)生的數(shù)字信息將達到35ZB。而其中更多的數(shù)據(jù)增長來自非結構化數(shù)據(jù)(每個ZB=1024EB=10萬億GB)。 超大量的數(shù)據(jù),到底多大才算大呢?徐子沛對此有個形象的比喻:我們一般認為按π為單位的數(shù)據(jù)就是大數(shù)據(jù),π下面的單位是GB,一部電影大約一個GB,一π就等于1024個GB,也就是說,一千多部電影那就算大數(shù)據(jù)了。再比如,美國國會圖書館是比較大的圖書館,它所有的印刷品如果都輸入電腦的話,也才是幾十個π。 但并非大數(shù)據(jù)就有價值?!霸诘厍蛉我獾胤綋炱鹨粔K石頭,都可以驗出鐵元素。但是,說世界遍地都是鐵礦一定是胡扯。只有石頭中鐵含量超過一定比例,而石頭數(shù)量又達到相當規(guī)模,這堆石頭才能稱為鐵礦,人們才會對它產(chǎn)生投資開采的興趣?!?知名IT評論人,曾任雅虎中國總經(jīng)理的謝文如此點評“數(shù)據(jù)大”與“大數(shù)據(jù)”的區(qū)別和價值。 中國的大數(shù)據(jù)領域到底有多少活躍跡象? 在謝文看來,當下該領域的商業(yè)前景有被過分夸大的嫌疑。 “目前盡管一些公司里有些專家在做數(shù)據(jù)整合與分析,也有一些專門從事數(shù)據(jù)發(fā)掘的公司、工具和專業(yè)服務,但總的看起來,數(shù)據(jù)收集、整理、挖掘所需的成本與產(chǎn)生的效益相比,性價比不高,吸引力不大。”他認為,現(xiàn)在國內數(shù)據(jù)挖掘行業(yè)的尷尬在于,“就像前面說到的貧鐵礦一樣,含金量不高的數(shù)據(jù)無論規(guī)模多大,挖掘多深,也是形同雞肋,食之無味,棄之可惜”。 一方面是熱鬧的有關大數(shù)據(jù)價值的研討會一場接一場,各類公司對外宣布進軍大數(shù)據(jù)領域的決心,這里也是投資人最活躍的領域,是技術和服務供應商最熱心的話題。 另一方面置身其中的業(yè)者很苦惱,為什么大數(shù)據(jù)只打雷不下雨?“不是沒有業(yè)務需求,而是需求還是不可實現(xiàn)的!”支付寶首席商業(yè)智能官車品覺認為,搞數(shù)據(jù)的人最苦惱的是數(shù)據(jù)不準確、取數(shù)難、維護難。 在他看來,BI(Business Intelligence,商業(yè)智能BI)的首要任務是用好數(shù)據(jù)科學決策。商業(yè)智能通常被理解為將企業(yè)中現(xiàn)有的數(shù)據(jù)轉化為知識,幫助企業(yè)做出明智的業(yè)務經(jīng)營決策的工具,包括搭建數(shù)據(jù)倉庫、數(shù)據(jù)分析、數(shù)據(jù)挖掘等?!靶」尽⑿F隊還好;規(guī)模大了,數(shù)據(jù)倉庫治理是個大難題。”他認為,現(xiàn)在的BI離業(yè)務遠了點,若是能和產(chǎn)品經(jīng)理結合到一起就更為強大,但苦惱的是,“現(xiàn)在一般產(chǎn)品經(jīng)理的數(shù)據(jù)分析做得太差,往往是拍腦袋做決策”。 徐子沛對此也頗有感觸。國內已有各種數(shù)據(jù)庫的基礎比較薄弱,由于數(shù)據(jù)作假、數(shù)據(jù)泡沫等現(xiàn)象,很多數(shù)據(jù)的真實性、有效性有待考驗。 事實上,大數(shù)據(jù)在中國遠沒有落地,目前很多問題還沒有解決。 在謝文看來,即便是谷歌,直到Google+誕生前,也不能聲稱自己是個大數(shù)據(jù)公司。 急功近利 掘金“大數(shù)據(jù)”的絆腳石 好萊塢電影《點球成金》(Moneyball),在美國掀起了一陣數(shù)據(jù)挖掘熱,就連默默無名的數(shù)據(jù)分析師的工作也成為了影迷們好奇的焦點。 比利·比恩(Billy Beane)是美國奧克蘭運動家棒球隊的總經(jīng)理,這支棒球隊在競爭激烈的美國職業(yè)棒球聯(lián)盟里只是“下三流”的,然而,在耶魯大學數(shù)據(jù)分析高材生胖子彼得的幫助下,比恩經(jīng)過分析數(shù)據(jù)和晦澀難解的棒球統(tǒng)計學,找到了一批在棒球運動某方面具備超強能力、但卻被價值低估的棒球手,最終以突破傳統(tǒng)的數(shù)據(jù)經(jīng)營模式,取得驕人的比賽成績,甚至達到了比肩實力雄厚的紐約揚基隊的程度。 美國麻省理工學院斯隆管理學院經(jīng)濟學教授埃里克·布呂諾爾夫松曾把“大數(shù)據(jù)”的潛在影響力比喻成“顯微鏡式的一場數(shù)據(jù)測量革命”。 不過,大數(shù)據(jù)到底能給企業(yè)帶來什么價值呢?本質上說,大數(shù)據(jù)本身沒有太多價值,基于大數(shù)據(jù)的處理和分析才能為企業(yè)帶來巨大的增量價值。 海比科技公司總經(jīng)理、中國軟件網(wǎng)總編輯曹開彬認為,大數(shù)據(jù)里面包含企業(yè)運營的各種信息,如果能對它們進行及時有效充分地整理和分析,才可以很好地、迅速地幫助企業(yè)進行業(yè)務決策,響應客戶需求,提升競爭力。 Teradata天睿公司大中華區(qū)首席執(zhí)行官辛兒倫認為,隨著大數(shù)據(jù)時代的到來,企業(yè)應該在內部培養(yǎng)三種能力:第一,整合企業(yè)數(shù)據(jù)的能力;第二,探索數(shù)據(jù)背后價值和制定精確行動綱領的能力;第三,進行精確快速實時行動的能力。Teradata天睿公司是一家智能分析解決方案廠商,主要為企業(yè)和政府機構做數(shù)據(jù)整合、分析,探索、挖掘數(shù)據(jù)背后的價值,從而提高客戶生產(chǎn)的競爭力。 數(shù)據(jù)分析和挖掘的前提,長時間的用戶積累,收集、維護數(shù)據(jù),聚沙成塔、集腋成裘。國內較早從事數(shù)據(jù)挖掘的國雙科技副總裁續(xù)揚認為,在這個過程中,長期記錄用戶的社會屬性、行為規(guī)律和互動特征等要素,在此基礎上,進而深入分析并探索有效的廣告?zhèn)鞑デ篮湍J健?p> 在謝文看來,即便是谷歌,直到Google+誕生前,它也不能聲稱自己是個大數(shù)據(jù)公司。 “它的海量搜索數(shù)據(jù)雖然規(guī)模龐大,但結構簡單。盡管聽說它的搜索算法已經(jīng)囊括了六萬多個變量,成千上萬的數(shù)學和統(tǒng)計學模型,上千的博士和工程師參與分析,但在數(shù)據(jù)挖掘深度、搜索結果個人化、搜索結果與廣告之間的相關度上進展有限,只有改良,沒有突破。更嚴重的是,谷歌數(shù)百個產(chǎn)品和服務之間相互關聯(lián)度極低,各干各的,無數(shù)數(shù)據(jù)庫互不相干。各個部門之間以鄰為壑,互不配合,更不整合。”謝文認為,大數(shù)據(jù)與否取決于數(shù)據(jù)規(guī)模,結構復雜性和關聯(lián)性,換句話說某個公司的數(shù)據(jù)量大并不等于說這個公司具備擁有和利用大數(shù)據(jù)的前景。 比如眼下熱門的微博數(shù)據(jù)挖掘,事實上還處在相當早期的投入階段。 國內目前最大的微博平臺新浪微博,正試圖將微博平臺做更多的商業(yè)化嘗試:積極通過社交興趣圖譜將品牌內容推薦給可能感興趣的用戶,利用廣告對應的應用頁面吸引粉絲互動,激勵用戶分享創(chuàng)造口碑效應;建立和完善微博的基礎設施,如微博信用系統(tǒng)、微博支付系統(tǒng)、微博數(shù)據(jù)挖掘系統(tǒng),推進商業(yè)化進程;推出商業(yè)開放平臺,在技術和接口層面為開發(fā)者提供支持,共同打造服務企業(yè)的App Store(應用商店),創(chuàng)建利益分享機制。 但是,也有分析認為,即便坐擁大量數(shù)據(jù)信息,但新浪微博現(xiàn)在要產(chǎn)生商業(yè)價值,還為時尚早,所面臨的問題比如:新浪的后臺技術能力相對偏弱,微博客戶的復雜性和數(shù)據(jù)分析差異化需要新浪花更多時間、精力去進行摸索。同時,由于社會化媒體廣告是相對較新的領域,國內專業(yè)人才相對匱乏。 在徐子沛看來,可能阻礙國內數(shù)據(jù)分析、挖掘領域健康發(fā)展的,是當下急功近利的心態(tài):客戶急于通過數(shù)據(jù)挖掘對銷售產(chǎn)生立竿見影的拉動效果;數(shù)據(jù)挖掘公司耐不住寂寞做一些比如建模等基礎性的工作,難得靜下心來在數(shù)據(jù)挖掘工具上開發(fā)、創(chuàng)新;投資機構希望在3~5年內見到投資成效等等。 已經(jīng)做了三年時間數(shù)據(jù)挖掘的締元信公司,其CEO秦雯曾表示,作為一個數(shù)據(jù)公司,從哪個角度,用什么方法挖掘大數(shù)據(jù)的價值,體現(xiàn)行業(yè)應用價值,他們一直還在摸索中。 近期,阿里巴巴頻頻表態(tài)啟動大數(shù)據(jù)布局,并將其提升至戰(zhàn)略高度。 大家伙出沒 大數(shù)據(jù)是大公司的壟斷? 微軟最近的一次小動作,引起了輿論的關注。它在最新IE10瀏覽器中,默認開啟“禁止追蹤”功能。 “禁止追蹤”(簡稱DNT)能夠防止第三方網(wǎng)站跟蹤用戶活動。接受“禁止追蹤”協(xié)議的網(wǎng)站不可以追蹤用戶活動,就像電話推銷員不可以向登記過“禁止推銷”的人推銷一樣。能夠了解到用戶的去處和行為令很多用戶和隱私保護倡導者擔憂,但廣告商卻可以利用這些信息決定以什么樣的方式在哪里定點展示其廣告。 微軟這個簡單而且看似微不足道的修改,被認為“表面上是有利于用戶隱私保護,實際上是壟斷用戶數(shù)據(jù)”,甚至認為“可能會對最基本的網(wǎng)絡商業(yè)環(huán)境造成非常大的影響甚至是滅頂之災”。

一個很自然的問題是,擁有大數(shù)據(jù)的公司會不會形成壟斷?擠壓其他中小企業(yè)的生存面包? 在《大數(shù)據(jù)》一書中,徐子沛列舉過不少案例,在他看來,大企業(yè)的數(shù)據(jù)壟斷不符合數(shù)據(jù)開放潮流,因為數(shù)據(jù)只有開放使用,才可以有更大的效率。大數(shù)據(jù)其實是鼓勵數(shù)據(jù)開放,競爭也是數(shù)據(jù)開放下的競爭。數(shù)據(jù)開放就會自然而然地衍生多樣性。 秒針創(chuàng)始人兼CTO吳明輝將互聯(lián)網(wǎng)上的數(shù)據(jù)分為兩種:第一種是可以公開獲取的數(shù)據(jù)。例如新聞、微博、博客上的每一篇文章,京東和當當上的商品信息,這些數(shù)據(jù)不會被壟斷,因為這些數(shù)據(jù)必須對普通消費者開放,即使大公司因為某些原因禁止蜘蛛的抓取,本質上也無法禁止每一個消費者獲取這些數(shù)據(jù),這些數(shù)據(jù)抓取公司可以通過在上百萬個普通消費者的電腦上安裝爬蟲,分散抓取的方式來獲得這些數(shù)據(jù)。第二種是用戶行為數(shù)據(jù)。例如哪一個用戶訪問過哪個內容,這種數(shù)據(jù)并不是對外公開的,也無從抓取,這些數(shù)據(jù)只能被大的平臺性公司所壟斷。 “但所有數(shù)據(jù)的利用都是需要符合商業(yè)利益本身的,如果一個小公司能夠充分利用大公司私有數(shù)據(jù),為大公司服務,那么大公司也會愿意共享一些數(shù)據(jù)出來?!?0后的吳明輝志向遠大。 百分點創(chuàng)始人蘇萌同樣認為,真正構成壁壘的并非大數(shù)據(jù)本身,而是大數(shù)據(jù)價值挖掘的技術能力和大數(shù)據(jù)應用的商業(yè)能力?!拔磥泶髷?shù)據(jù)的方向會在整合結構化與非結構化的數(shù)據(jù)、標準化與非標準化的數(shù)據(jù)、單渠道與跨渠道的數(shù)據(jù)三個方面。” 謝文從另一個視角對記者分析,“在現(xiàn)有情況下,誰有可能擁有比較多的數(shù)據(jù),能夠產(chǎn)生一些大數(shù)據(jù)時代初級的應用、發(fā)展和機會?顯然大公司有優(yōu)勢。但真正的挑戰(zhàn)不在于數(shù)據(jù)多少,而在于你是用什么嶄新的方法、思路、工具去分析數(shù)據(jù)。比如Facebook出現(xiàn)的時候還沒有用戶,而那時雅虎卻有幾十億用戶了,F(xiàn)acebook為什么取而代之?因為它用了一個新的思路,更符合現(xiàn)在的發(fā)展潮流?!?p> 對于已經(jīng)坐擁海量用戶、用戶數(shù)據(jù)的互聯(lián)網(wǎng)大公司,自然不愿錯失“大數(shù)據(jù)”時代的機會。近期,騰訊、阿里巴巴等互聯(lián)網(wǎng)公司頻頻表態(tài)啟動大數(shù)據(jù)布局,并將其提升至戰(zhàn)略高度。 阿里集團剛剛設立首席數(shù)據(jù)官崗位(CDO),負責推進“數(shù)據(jù)分享平臺”戰(zhàn)略。同時,阿里還發(fā)布“聚石塔”平臺,為天貓、淘寶平臺上的電商及電商服務商等提供數(shù)據(jù)云服務。 此前,騰訊也發(fā)布了面向營銷的大數(shù)據(jù)戰(zhàn)略,稱將調動騰訊7億活躍賬戶數(shù)據(jù)去服務門戶,來打造基于用戶社交關系鏈的“下一代騰訊網(wǎng)”。 天貓總裁逍遙子表示,聚石塔的推出,通過開放的電商云工作平臺將整合電商生態(tài)系統(tǒng)的全鏈路數(shù)據(jù),幫助商家提高運營管理效率、降低成本,從“繁”電商轉變?yōu)椤耙住彪娚蹋愿p盈的姿態(tài)最終為消費者提供更確定性的服務。 “這是一個連續(xù)的過程,突變還沒有發(fā)生?!敝x文告訴記者,“現(xiàn)在大家還是用歷史上積累的數(shù)據(jù)、方法、工具,實際上中國互聯(lián)網(wǎng)公司對數(shù)據(jù)是不會投資,也不會用的。在互聯(lián)網(wǎng)領域,應該說搜索是最依賴數(shù)據(jù)的,其次是電子商務,至于做新聞或做垂直服務的,基本上不太在乎?!?p> 其實縱觀全球互聯(lián)網(wǎng)領域,包括歐美的數(shù)據(jù)挖掘工作也并沒有完全發(fā)展起來。美國著名社交游戲公司Zynga在一次采訪中說,他們的游戲用戶數(shù)據(jù)還沒有很好地利用起來,這些數(shù)據(jù)如果充分利用起來,未來可以獲得更多的數(shù)據(jù)。 吳明輝認為,Big Data未來是一定可以幫助企業(yè)拉動銷售的,在Big Data到Useful Data的演進過程中首先需要解決的是Visible Data,也就是可視化呈現(xiàn)的Data,需要通過一些分析系統(tǒng)和報表系統(tǒng)幫助企業(yè)在Big Data中發(fā)現(xiàn)問題,然后才是解決??赡苡袝r候發(fā)現(xiàn)了問題不能簡單通過Data去解決,而是需要通過改變整個運營系統(tǒng)才能把銷售或運營效率提高起來,發(fā)現(xiàn)問題是第一步,但解決問題更難。 在數(shù)據(jù)分析里有個詞叫“數(shù)據(jù)清晰”,意思是有很多數(shù)據(jù)是過時的,沒有及時更新的,不但沒有價值,反而會破壞數(shù)據(jù)的精細度。看來,Big Data 到Useful Data,還有很長的路要走。
愛華網(wǎng)本文地址 » http://www.klfzs.com/a/9101032201/56528.html
愛華網(wǎng)



