系列專(zhuān)題:大數(shù)據(jù)營(yíng)銷(xiāo)
???? 宅男們總幻想為自己“定制”一個(gè)女友,也許他們的愿望將不日達(dá)成。不是借助3D打印,而是靠大數(shù)據(jù)時(shí)代的婚戀網(wǎng)站。 網(wǎng)易又被抄襲了。 4月7日,網(wǎng)易旗下婚戀交友網(wǎng)站“花田”發(fā)布微博稱(chēng),從產(chǎn)品中的UI、交互細(xì)節(jié)、文案、首頁(yè)和個(gè)人頁(yè)布局、功能、消息通知機(jī)制規(guī)則到微博運(yùn)營(yíng),被世紀(jì)佳緣旗下的“愛(ài)真心網(wǎng)”“抄了個(gè)透”。 雖然是2012年11月才上的線,花田的起點(diǎn)卻不低:以免費(fèi)溝通為賣(mài)點(diǎn),主打一二線城市中高端市場(chǎng)。摒棄傳統(tǒng)婚戀網(wǎng)站的“人工紅娘”,不提供任何人工服務(wù),從推薦到搜索全由系統(tǒng)自動(dòng)完成。而世紀(jì)佳緣也在換帥之后摩拳擦掌,試圖用大數(shù)據(jù)的精準(zhǔn)化運(yùn)營(yíng),為在海量異性資料中疲于搜索的用戶(hù)“指一條明路”。 宅男們總幻想為自己“定制”一個(gè)女友。如何實(shí)現(xiàn)“定制”,盡管很難說(shuō)世紀(jì)佳緣的嘗試究竟是在對(duì)花田照貓畫(huà)虎還是純屬巧合,但不可否認(rèn),大數(shù)據(jù)精準(zhǔn)化運(yùn)營(yíng)已經(jīng)成為婚戀網(wǎng)站的發(fā)展共識(shí)。 戀愛(ài)也有模型 一年前,婚戀網(wǎng)站最?lèi)?ài)喊“實(shí)名制”。如今,各家都有了用戶(hù)的基本實(shí)名信息,這種傳統(tǒng)打法就過(guò)氣了。畢竟有身份證的人,不一定是有身份的人。當(dāng)你將身高、體重、年齡、學(xué)歷等一一框定,一看還有2000個(gè)姑娘(小伙)符合要求,是時(shí)候讓理性回歸感性了。而這感性,又是建立在理性的數(shù)據(jù)分析之上。 花田界面采用類(lèi)似微博的信息流展示形式。首頁(yè)是異性用戶(hù)最近更新的圖片、內(nèi)心獨(dú)白和文字傳情,展示其生活方式、個(gè)人品位等軟性資料。系統(tǒng)會(huì)自動(dòng)推薦那些相對(duì)活躍、最近有信息流更新的人,這就促使用戶(hù)拿出更新微博的勁頭來(lái)更新花田,為花田積累了大量可供分析的軟性數(shù)據(jù)。 花田團(tuán)隊(duì)只有30多個(gè)人,大多是85后。他們?cè)趯?duì)海量軟硬數(shù)據(jù)進(jìn)行分析的基礎(chǔ)上,總結(jié)出一些人物特征,建立出一定數(shù)量的人物模型。再分析具體用戶(hù),將其分門(mén)別類(lèi)套入各種模型。這樣,用戶(hù)心儀其中某一個(gè)人,便可向其推薦這一類(lèi)人。 “我們可以通過(guò)‘內(nèi)心獨(dú)白’來(lái)挖掘用戶(hù)的性格特征。”網(wǎng)易花田負(fù)責(zé)人夏天宇說(shuō)。夏天宇在網(wǎng)易已工作11年,此前他的團(tuán)隊(duì)負(fù)責(zé)網(wǎng)易微博的研發(fā),而他最早的工作是Oracle數(shù)據(jù)庫(kù)管理。 現(xiàn)在,他和他的團(tuán)隊(duì)正試圖通過(guò)自然語(yǔ)言處理技術(shù)和語(yǔ)義分析方法來(lái)解碼用戶(hù)性格,實(shí)現(xiàn)“軟硬兼施”的精準(zhǔn)推薦。首先,他們運(yùn)用切分詞方法,從用戶(hù)的“內(nèi)心獨(dú)白”中提取出現(xiàn)頻率較高的關(guān)鍵詞;再將這些關(guān)鍵詞分類(lèi),如感性詞匯或理性詞匯;最后,通過(guò)文本分析、語(yǔ)義分析,從中挖掘出用戶(hù)的性格是內(nèi)向、外向、理想化還是現(xiàn)實(shí)派等等。 花田還建立了外貌模型?!拔覀凂R上要推出人臉識(shí)別?!毕奶煊罱榻B,如果想找個(gè)像范冰冰的女友,輸入“范冰冰”,就會(huì)推出很多范冰冰臉型的女生。據(jù)悉,花田之后還會(huì)推出幾十種流行的男女明星臉型供用戶(hù)選擇。 而如果花田能夠跨產(chǎn)品平臺(tái),結(jié)合網(wǎng)易門(mén)戶(hù)、郵箱、游戲等其他網(wǎng)易資源進(jìn)行大數(shù)據(jù)分析,是否就能向用戶(hù)推薦與自身閱讀習(xí)慣、工作習(xí)慣、娛樂(lè)習(xí)慣都匹配的對(duì)象呢?真正的大數(shù)據(jù)必然是跨平臺(tái)的,這點(diǎn)別家很難做到。 防造假防詐騙 數(shù)據(jù)分析不只可用于精準(zhǔn)推薦,還能識(shí)別婚戀網(wǎng)站最為人詬病的造假和詐騙。 2012年底,世紀(jì)佳緣換帥吳琳光。而他在加入世紀(jì)佳緣后,首先做的就是引入大數(shù)據(jù)來(lái)提高用戶(hù)體驗(yàn)。世紀(jì)佳緣的數(shù)據(jù)分析團(tuán)隊(duì)開(kāi)發(fā)出一套網(wǎng)警系統(tǒng),由以往的被動(dòng)等待用戶(hù)舉報(bào)騙子,改為主動(dòng)出擊。 “對(duì)我們來(lái)說(shuō),花籃托兒和酒吧托兒的危害最大?!笔兰o(jì)佳緣CEO吳琳光介紹,這兩種人的特點(diǎn)是希望長(zhǎng)期運(yùn)營(yíng),不會(huì)像真正的詐騙犯令受害者報(bào)案。錢(qián)雖不多,卻最讓人惡心。 酒吧托兒的特點(diǎn)是照片極美,但只有一兩張?;ɑ@托兒則是相貌堂堂、言語(yǔ)溫柔的中年大叔,但只打電話不見(jiàn)面。忽有一天聲稱(chēng)自己公司要開(kāi)業(yè),向女方求送花籃,騙個(gè)一兩千塊。他們的共同特點(diǎn)就是一上來(lái)便要聯(lián)系方式,盡快離開(kāi)網(wǎng)絡(luò)平臺(tái),用電話這種難以管控的方式來(lái)建立親密關(guān)系。 通過(guò)對(duì)騙子這些行為模式的數(shù)據(jù)分析,世紀(jì)佳緣制作出一套騙子識(shí)別模型,已經(jīng)投入使用。令人捧腹的是,吳琳光本人也曾因測(cè)試產(chǎn)品,被這套網(wǎng)警系統(tǒng)抓個(gè)正著,“我符合壞蛋的特征,上來(lái)就找女性直接要聯(lián)系方式?!?p> 棘手的技術(shù)難題 在花田迅速發(fā)展的背后,是網(wǎng)易不容小覷的技術(shù)儲(chǔ)備:“有道”搜索提供的自然語(yǔ)言處理技術(shù),被用于通過(guò)文本挖掘用戶(hù)性格。網(wǎng)易自研的原本用于網(wǎng)易郵箱的人臉識(shí)別技術(shù),更是婚戀網(wǎng)站求之不得的利器。 數(shù)百年前的媒婆們絕想不到,若干年后,一群技術(shù)出身的工程師們用冷冰冰的數(shù)據(jù)為癡男怨女保媒拉纖。 然而技術(shù)男們縱然辨得出喜惡,抓得住流氓,卻也有棘手的技術(shù)難題,比如人臉識(shí)別。對(duì)外貌的判斷感性而且私人化,向來(lái)是婚戀網(wǎng)站研究的難點(diǎn)。世紀(jì)佳緣一直在努力尋找合適的面部識(shí)別軟件,但難度很大。 吳琳光表示,他們正引入一款能夠識(shí)別相似臉的系統(tǒng),從用戶(hù)過(guò)往的選擇數(shù)據(jù)中總結(jié)歸納用戶(hù)喜歡何種臉型,給用戶(hù)推薦類(lèi)似臉型的人。花田雖然背靠網(wǎng)易大樹(shù),即將推出人臉識(shí)別功能,但這一技術(shù)目前止步于臉型識(shí)別?;ㄌ镌噲D將更高級(jí)的人臉識(shí)別,如五官識(shí)別、夫妻相匹配作為自己的增值服務(wù)收費(fèi)點(diǎn),也有待進(jìn)一步的技術(shù)突破。

對(duì)于人類(lèi)這樣復(fù)雜的動(dòng)物,數(shù)據(jù)究竟能做到什么程度?吳琳光說(shuō),自己的理想是讓用戶(hù)一注冊(cè)世紀(jì)佳緣,看到的推薦異性就個(gè)個(gè)都喜歡。但從身邊常聽(tīng)到的各種抱怨看,實(shí)現(xiàn)這個(gè)目標(biāo)尚需時(shí)日。
愛(ài)華網(wǎng)本文地址 » http://www.klfzs.com/a/9101032201/39077.html
愛(ài)華網(wǎng)



