自“大數(shù)據(jù)”成為熱詞以來(lái),,幾乎一夜之間,很多公司就開始標(biāo)榜自己“具備強(qiáng)大的數(shù)據(jù)挖掘能力”,。但實(shí)際上,,大數(shù)據(jù)時(shí)代剛剛萌芽,所謂的大數(shù)據(jù)應(yīng)用遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到“神乎其神”的程度,。 2016年4月21日,,亞馬遜中國(guó)聯(lián)合新華網(wǎng)開展了“2016全民閱讀調(diào)查”,通過(guò)覆蓋全國(guó)500多個(gè)城市,、11800多位受訪用戶的數(shù)據(jù)調(diào)查,,并結(jié)合多年來(lái)對(duì)中國(guó)市場(chǎng)的深入研究以及讀者在線消費(fèi)行為的分析,發(fā)布了一份調(diào)查報(bào)告,。 這份報(bào)告的一些結(jié)論頗令人奇怪,。比如,“70后”愛(ài)讀生活和少兒類圖書,,“80后”對(duì)經(jīng)管以及孕產(chǎn)育兒類書籍情有獨(dú)鐘,。不同年齡段的讀者在題材選擇上確實(shí)會(huì)有所不同,但“70后”中年紀(jì)最大的已經(jīng)46歲,,最小的也已37歲,,這一頭一尾的差別顯然不能用“愛(ài)讀生活和少兒類圖書”來(lái)統(tǒng)一,而且“70后”確實(shí)可能買少兒類圖書,,但未必就是“愛(ài)讀”,。 亞馬遜對(duì)于數(shù)據(jù)的解讀實(shí)在是太過(guò)粗疏了,而且也經(jīng)不起推敲,。導(dǎo)致這一結(jié)果的原因可能是調(diào)查樣本偏差,,也可能是數(shù)據(jù)在采集時(shí)就已經(jīng)被污染。前者是調(diào)查方式的問(wèn)題,,如是后者,,則與“數(shù)據(jù)身份歸屬”密切相關(guān),因?yàn)闊o(wú)論是通過(guò)亞馬遜網(wǎng)站還是Kindle采集的信息,,都可能無(wú)法精準(zhǔn)認(rèn)證,。 在當(dāng)下的互聯(lián)網(wǎng)技術(shù)支撐下,數(shù)據(jù)采集已經(jīng)不是什么難題,,但針對(duì)任何數(shù)據(jù)的分析,、評(píng)估、研判乃至具體的應(yīng)用,,首先就要明確數(shù)據(jù)的身份歸屬,。也就是說(shuō),,某一組數(shù)據(jù)到底是由哪一個(gè)具體的鮮活個(gè)體產(chǎn)生的。如果數(shù)據(jù)不是由某個(gè)確定的單一個(gè)體產(chǎn)生的,,顯然就無(wú)法依據(jù)這種被污染了的數(shù)據(jù)來(lái)做出正確的分析和合理的判斷,。 這個(gè)問(wèn)題看似簡(jiǎn)單,但在現(xiàn)實(shí)場(chǎng)景中卻存在著至少兩類數(shù)據(jù)身份歸屬不明的情形,。 第一類是數(shù)據(jù)身份錯(cuò)位,。 基于互聯(lián)網(wǎng)技術(shù)的商業(yè)應(yīng)用,往往需要用戶在使用之前進(jìn)行注冊(cè),。比如,,使用Uber、滴滴打車這樣的APP,,用戶必須將自己的一些身份信息填寫上傳,,才能正常使用。而Uber,、滴滴的后臺(tái)則根據(jù)這些身份信息,,來(lái)做對(duì)應(yīng)身份的數(shù)據(jù)分析與挖掘。但是因?yàn)榛ヂ?lián)網(wǎng)新技術(shù)存在著學(xué)習(xí)門檻,,并不是所有有意成為用戶的人都能輕松克服學(xué)習(xí)阻抗的,,只能請(qǐng)求他人幫助或代勞。 有一次,,我打Uber的時(shí)候,,從手機(jī)端看到的信息是一位年輕的女司機(jī),但隨后的電話溝通卻表明是一位年長(zhǎng)的男性,。等上了車做了一些了解后,,才知道這是女兒為了讓退休在家的父親有事可做而注冊(cè)了Uber司機(jī)賬號(hào),但她是用自己的身份而不是父親的身份注冊(cè)的,。這就造成了數(shù)據(jù)身份錯(cuò)位,。如果Uber以此賬號(hào)來(lái)認(rèn)證這一數(shù)據(jù)身份的行為,就可能出現(xiàn)偏差,。舉一個(gè)極端的例子,,當(dāng)這位女士作為乘客享用Uber服務(wù)的同時(shí),她(實(shí)際上是她的父親,,但后臺(tái)系統(tǒng)卻無(wú)法自動(dòng)識(shí)別)又作為司機(jī)在為別的乘客提供Uber服務(wù),。這雖然只是我的個(gè)人經(jīng)歷,但類似的情形卻絕非罕見,。據(jù)報(bào)道,,北京的一個(gè)司機(jī),從網(wǎng)上搜索出一輛他人的白色別克車信息,,利用這輛車的相關(guān)信息和自己本人的駕駛證信息及手機(jī)號(hào),,注冊(cè)成為一名滴滴專車司機(jī),并開始接單,。這個(gè)司機(jī)后來(lái)因?yàn)閺?qiáng)奸女乘客而被判刑,。這是車輛信息失真導(dǎo)致數(shù)據(jù)污染的情形。還有廣東番禺的一個(gè)司機(jī),,也是利用岳父的身份信息注冊(cè)的滴滴司機(jī)賬號(hào),。這個(gè)司機(jī)也因?yàn)閺?qiáng)奸女乘客而被判刑。舉這幾個(gè)例子,,不是要強(qiáng)化數(shù)據(jù)污染,、信息失真的用戶與犯罪之間的必然聯(lián)系,但是從心理學(xué)的角度來(lái)看,,信息失真帶來(lái)的某種程度的“匿名效應(yīng)”確實(shí)使得相關(guān)人員更有可能抱有僥幸心理而逾越道德或法律的約束,。 此外,還有一種是“合理幫助”導(dǎo)致的數(shù)據(jù)污染,。施以援手者盡管也是以被幫助者本人的身份信息注冊(cè)的,,但還是有可能夾雜部分自己的信息。比如,,2015年“雙12”時(shí),,支付寶為了增加用戶,與線下3萬(wàn)家超市便利店合作,,凡使用支付寶支付的,,全線五折,50元封頂,。這一優(yōu)惠力度對(duì)那些高度價(jià)格敏感者(大伯大媽們)的誘惑力不言而喻,,但他們大多從來(lái)沒(méi)有使用過(guò)支付寶。于是,,在活動(dòng)現(xiàn)場(chǎng),,就出現(xiàn)了超市或便利店的收銀員幫助他們下載、安裝,、注冊(cè)支付寶APP而排長(zhǎng)隊(duì)的場(chǎng)景,。為了盡快完成,收銀員們并不會(huì)完全按照大伯大媽的真實(shí)身份信息注冊(cè),,而是潦草完成,,能略則略,或是直接將某個(gè)默認(rèn)的選擇用之于所有人,。這樣的數(shù)據(jù)身份顯然是有瑕疵的,。 第二類是數(shù)據(jù)身份共享。 浙江義烏一位經(jīng)商的趙先生,為了方便女兒玩手機(jī),,把12歲女兒樂(lè)樂(lè)的指紋也加入了手機(jī)開鎖密碼,。不料,樂(lè)樂(lè)在父親手機(jī)里的一款社交K歌APP上聽歌時(shí),,竟然在3天內(nèi)打賞出去16萬(wàn)元,。對(duì)于這款A(yù)PP來(lái)說(shuō),如果開展后臺(tái)數(shù)據(jù)統(tǒng)計(jì)分析,,一定會(huì)將打賞行為視為趙先生本人所為,,卻不知道這是她年幼的女兒共享了趙先生的數(shù)據(jù)身份所致。 再以我自己的經(jīng)歷為例,。我的孩子有段時(shí)間在一個(gè)培訓(xùn)機(jī)構(gòu)補(bǔ)課,,中午需要自行解決午餐。于是,,用我的身份信息資料以及信用卡注冊(cè)的支付寶就成了孩子的支付工具,。孩子除了支付中午的外賣之外,也會(huì)用支付寶在淘寶上購(gòu)買一些她所喜歡的小東西,。如果將一個(gè)小女孩的購(gòu)物行為歸結(jié)到一個(gè)大男人的身上,,豈不是張冠李戴? 中國(guó)人的個(gè)人邊界意識(shí)較之于西方人是十分淡漠的,。在各種親密關(guān)系中,,這類數(shù)據(jù)身份共享是一種常態(tài)。諸如丈夫請(qǐng)妻子用自己的淘寶賬號(hào)購(gòu)物,,員工用自己的私人賬號(hào)為公家采購(gòu)都是符合中國(guó)國(guó)情的,。但數(shù)據(jù)身份的共享卻為后續(xù)的大數(shù)據(jù)處理帶來(lái)了極大的麻煩。這是另一類型的大數(shù)據(jù)污染,。 大數(shù)據(jù)的應(yīng)用顯然是向著精準(zhǔn)預(yù)測(cè)的方向演進(jìn)的,。 據(jù)說(shuō)電商巨頭亞馬遜已經(jīng)申請(qǐng)了預(yù)測(cè)式發(fā)貨的新專利。亞馬遜會(huì)根據(jù)某個(gè)用戶之前的訂單,、商品搜索記錄,、愿望清單、購(gòu)物車,,甚至包括用戶的鼠標(biāo)在某件商品上懸停的時(shí)間等數(shù)據(jù),,預(yù)測(cè)用戶的購(gòu)物習(xí)慣,從而在他實(shí)際下單前便將包裹發(fā)出,。 顯然,,亞馬遜的這一大數(shù)據(jù)應(yīng)用是建立在歷史數(shù)據(jù)的高純凈度的前提之下的,基于這些高純凈度數(shù)據(jù)來(lái)給用戶畫像,。如果因?yàn)閿?shù)據(jù)身份錯(cuò)位或共享而導(dǎo)致大數(shù)據(jù)污染,,所謂的用戶畫像就是失真的,也就不可能成為數(shù)據(jù)分析與預(yù)測(cè)決策的依據(jù)。 一句俗話能夠特別形象地表明大數(shù)據(jù)污染與大數(shù)據(jù)應(yīng)用之間的關(guān)系,,這就是“一顆老鼠屎,,壞了一鍋粥”。在當(dāng)下互聯(lián)網(wǎng)創(chuàng)業(yè)大干快上的大環(huán)境下,,創(chuàng)業(yè)公司為了盡快地跑馬圈地?fù)尩乇P,,往往是蘿卜快了不洗泥,很少有意識(shí)或有精力來(lái)顧及數(shù)據(jù)純凈度的問(wèn)題,。甚至有些創(chuàng)業(yè)公司為了拿出過(guò)得去的數(shù)據(jù),主動(dòng)造假,。但這樣做,,勢(shì)必會(huì)為未來(lái)埋下重大隱患,所積存的歷史數(shù)據(jù)很有可能因?yàn)槲廴緡?yán)重而失去基本效用,。 互聯(lián)網(wǎng)技術(shù)與大數(shù)據(jù)應(yīng)用無(wú)疑是大勢(shì)所趨,,未來(lái)的商業(yè)必然是向著極度精準(zhǔn)化的方向演進(jìn)的。但高樓萬(wàn)丈平地起,,如果從一開始就無(wú)法提供高純凈度的數(shù)據(jù)基礎(chǔ),,任何美好設(shè)想都將是無(wú)本之木,無(wú)源之水,。 所以,,我們必須重視杜絕大數(shù)據(jù)污染以及用戶畫像的真實(shí)度,這就要求我們必須把好“數(shù)據(jù)身份認(rèn)證關(guān)”,,這才是大數(shù)據(jù)應(yīng)用之基,。做不好這項(xiàng)基礎(chǔ)工作的互聯(lián)網(wǎng)公司,就不要急著奢談“強(qiáng)大的數(shù)據(jù)挖掘能力”了,,而消費(fèi)者們也要保持足夠的清醒,,不要盲目相信那些神乎其神的“大數(shù)據(jù)奇跡”。 編輯: 上 尉(微信號(hào):swei-226) 更多資訊請(qǐng)關(guān)注銷售與市場(chǎng)微信公眾號(hào),。 責(zé)任編輯: 趙艷麗 責(zé)任校對(duì): 肖亞超 審核:徐昊晨 免責(zé)聲明:本網(wǎng)部分文章來(lái)源于第三方平臺(tái),,不代表本網(wǎng)觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系我們刪除,! |
銷售與市場(chǎng)官方網(wǎng)站 ( 豫ICP備19000188號(hào)-5 )
GMT+8, 2024-12-26 08:52 , Processed in 0.037367 second(s), 20 queries .
Powered by 銷售與市場(chǎng)網(wǎng) 河南銷售與市場(chǎng)雜志社有限公司
© 1994-2021 sysyfmy.com