來源:數(shù)據(jù)派THU 時(shí)間:2017-08-31 11:04:30 作者:沈陽
大數(shù)據(jù)時(shí)代以其“4V”(即Volume體量大、Variety類型多、Value價(jià)值巨大、Velocity處理速度快)的神力不斷影響和改造著世界,作為一種全新的思想和手段,新媒體大數(shù)據(jù)、輿論大數(shù)據(jù),營銷大數(shù)據(jù)、公關(guān)大數(shù)據(jù)和廣告品牌大數(shù)據(jù)等各個(gè)領(lǐng)域的各類大數(shù)據(jù),澎湃洶涌地推動(dòng)著傳媒業(yè)從量變到質(zhì)變,開辟出了傳媒業(yè)轉(zhuǎn)型發(fā)展的新機(jī)遇。本期由清華—青島數(shù)據(jù)科學(xué)研究院主辦、清數(shù)大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟承辦的“應(yīng)用·創(chuàng)新”系列講座,邀請(qǐng)到清華大學(xué)新聞與傳播學(xué)院的沈陽教授。他是橫跨信息管理、新聞傳播和計(jì)算機(jī)科學(xué)三個(gè)專業(yè)的教授,多個(gè)部委的專家組成員,清博大數(shù)據(jù)的早期創(chuàng)始人,具有豐富的新媒體投融資、數(shù)據(jù)分析和新媒體戰(zhàn)略經(jīng)驗(yàn)?! ?
今年5月24日數(shù)據(jù)派發(fā)布過一期沈老師主講的“應(yīng)用·創(chuàng)新”系列講座之《數(shù)據(jù)與新媒體》,本場講座沈老師演講的主題“大數(shù)據(jù)驅(qū)動(dòng)下的媒體業(yè)轉(zhuǎn)型”對(duì)上一期的內(nèi)容做了補(bǔ)充和升級(jí),相信大家會(huì)從中得到更多的新視角和新啟示。
大數(shù)據(jù)連接論的三大要素
首先,大數(shù)據(jù)的終極目標(biāo)是連接。人類社會(huì)從早期的語言的思想的連接,慢慢過渡到紙質(zhì)的連接,再到廣播電視的連接,再到PC互聯(lián)網(wǎng)的連接,如今是移動(dòng)互聯(lián)網(wǎng)的連接,這種連接的頻度不斷提升。如果把連接看作人和事物、人和人之間的某種特定的相關(guān)性,這種特定相關(guān)性從整個(gè)人類的角度來說是越來越強(qiáng)的,它不僅是一個(gè)手段,很可能也是一個(gè)最終目標(biāo)。
其次,連接有量的變化,其中會(huì)因?yàn)榱孔兌a(chǎn)生一系列不同的效應(yīng)。如果你連接了一個(gè)人,那有可能是你的家人;當(dāng)你連接了10個(gè)人,就達(dá)到了社會(huì)學(xué)家所說的跟你關(guān)系最密切的初級(jí)群體,由此可以推算出你的社會(huì)地位,你的財(cái)富,就是你最好的六個(gè)朋友的平均值;當(dāng)你連接到100個(gè)人,就接近了鄧巴數(shù),即150定律(Rule Of 150),該定律是根據(jù)猿猴的智力與社交網(wǎng)絡(luò)推斷出:人類智力將允許人類擁有穩(wěn)定社交網(wǎng)絡(luò)的人數(shù)是148人,四舍五入大約是150人,這是與你能親密互動(dòng)人群的上限;當(dāng)你連接到1000個(gè)人,就達(dá)到了凱文凱利提到的社區(qū)啟動(dòng)的條件,倘若這1000人恰好都是你的忠粉,你就可以靠他們養(yǎng)活自己;當(dāng)你連接到10000個(gè)人,偶發(fā)效應(yīng)會(huì)特別強(qiáng),每次發(fā)布消息后都會(huì)反饋出想象不到的結(jié)果,而且這些人的朋友圈發(fā)布的消息也會(huì)給人很多意想不到的幫助。比如,九寨溝地震前,打算去九寨溝旅游的人因?yàn)樵谂笥讶λ⒌揭粡埦耪瘻先松饺撕5恼掌∠谐?,幸而逃過一劫,與地震擦肩而過。
當(dāng)你連接到十萬人會(huì)發(fā)生什么,在微信里面顯示為100000+,可以理解成你足以在某個(gè)細(xì)分領(lǐng)域形成非常大的影響,如果這個(gè)量級(jí)到達(dá)百萬會(huì)發(fā)生什么事?百萬的網(wǎng)絡(luò)連接,足以使人可以脫離于現(xiàn)實(shí)世界,在網(wǎng)絡(luò)中完成一個(gè)生存的閉環(huán)。假設(shè)你有一百萬真實(shí)的粉絲,你發(fā)一條微博,可能就幾萬塊錢了,這個(gè)時(shí)候你的經(jīng)濟(jì)來源已經(jīng)通過網(wǎng)絡(luò)解決了,你的吃穿用也都可以通過在線購買,獲得專門的機(jī)構(gòu)服務(wù)。
如果這個(gè)量級(jí)到達(dá)千萬又會(huì)發(fā)生什么呢?人民日?qǐng)?bào)對(duì)外公布的粉絲數(shù)就是一千多萬。故當(dāng)你連接到一千萬人,你基本上就成為了各大媒體平臺(tái)的頭把交椅,像快手里面的號(hào)稱第一大號(hào)的【MC天佑】、微信粉絲千萬的公眾號(hào)【咪蒙】,所以你會(huì)發(fā)現(xiàn)連接到千萬,足以在一個(gè)細(xì)分領(lǐng)域當(dāng)中逐步占據(jù)頭部的位置。接下來,如果連接到一億人,那你足以在某個(gè)細(xì)分領(lǐng)域挑戰(zhàn)BAT(BAT,B=百度、A=阿里巴巴、T=騰訊,中國互聯(lián)網(wǎng)公司百度公司(Baidu)、阿里巴巴集團(tuán)(Alibaba)、騰訊公司(Tencent)三大互聯(lián)網(wǎng)公司首字母的縮寫)。騰訊的微信活躍用戶有九億多,如果你連接到十億人,你就成了騰訊;而如果你能連接到二十億人,那你就成為了Facebook。
第三,除了量的積累之外,也有一個(gè)質(zhì)的演化。質(zhì)的演化有幾個(gè)要點(diǎn):第一個(gè)要點(diǎn)是任何連接一旦建立,不會(huì)滿足于單一的連接形態(tài),而是會(huì)附加各種各樣的功能。所謂“全家桶”模式便是,用戶只要安裝了一個(gè)APP,就會(huì)被不斷推薦安裝更多的APP,這就是不滿足于單一的連接形態(tài)。第二個(gè)要點(diǎn)是不管這個(gè)連接的量有多大,最重要的是對(duì)自身結(jié)點(diǎn)的賦能,促使自身進(jìn)化為關(guān)鍵連接點(diǎn)。
任何一個(gè)連接都需要去依托于平臺(tái),依托于某種工具,語言也可以被看作一個(gè)連接的媒介。那么未來,如果按照這條原理,在這些連接過程當(dāng)中,連接是會(huì)進(jìn)化的。任何一個(gè)數(shù)據(jù)連接都有可能會(huì)被新的連接所取代。
那么取代的規(guī)律是什么呢?如果一種新的連接要替代一種老的連接,這種新連接的頻度要更高、更快、更緊密、更美好。按照連接論分析,在手機(jī)上要取代微信的軟件,目前在中國基本上沒有。但是如果按照連接的進(jìn)化條件來說,什么東西能取代手機(jī)呢?或許有三種東西。
第一種是比人們本身的交互次數(shù)更高的、更多的一種設(shè)備,有可能是人們用眼神控制的設(shè)備。人們每用眼神掃描一下智能眼鏡,它就可以完成一次交互。由此推之,人們跟這個(gè)智能眼鏡交互次數(shù)是可以超過手機(jī),因?yàn)槭謾C(jī)作為媒介的交互頻度是遠(yuǎn)超報(bào)紙的,甚至可以認(rèn)為是高50倍以上。而智能眼鏡可能比手機(jī)的交互次數(shù)高100倍,人們每天可以指揮這個(gè)智能眼鏡,用眼神掃描即可。
第二種取代手機(jī)的設(shè)備是基于人工智能技術(shù)。想象未來人們一進(jìn)家門,通過智能語音問答系統(tǒng),眼前就能展現(xiàn)出一個(gè)虛擬的影像場景。隨著人工智能的進(jìn)一步發(fā)展,智能硬件會(huì)帶來變革,智能云可以調(diào)動(dòng)家里所有的設(shè)備。
第三種則是更為大膽的想象,平時(shí)與人們交互次數(shù)最多的是什么?衣服或許就是一種選擇。一個(gè)人每天跟衣服的交互次數(shù)高于一萬次,從這個(gè)角度來說,未來可能會(huì)有一家偉大的互聯(lián)網(wǎng)公司,就是做衣服的交互連接。
總之,按照這個(gè)原則,任何數(shù)據(jù)連接都應(yīng)該有可能會(huì)被新的連接所取代。
連接是最高的形式,是思想和認(rèn)知的連接
人跟人之間的物質(zhì)連接是短暫的,但是思想性的連接是永久的。數(shù)據(jù)在這里面所起到的作用,就是讓人們的認(rèn)知更加深刻。大數(shù)據(jù)時(shí)代,一個(gè)人到底能被貼上多少個(gè)標(biāo)簽?zāi)?Facebook里面一個(gè)賬號(hào),可以被打上幾百萬個(gè)標(biāo)簽,這些標(biāo)簽基于其瀏覽過的每一條Facebook文章,包括其任何一個(gè)細(xì)節(jié)的屬性。
以此為例,標(biāo)簽可以幫助在Facebook數(shù)億的賬號(hào)里進(jìn)行篩選。當(dāng)某一個(gè)對(duì)象的數(shù)據(jù)被刻畫得越精致時(shí),人們對(duì)這個(gè)世界的認(rèn)識(shí)程度也隨之大幅加深。
當(dāng)然,連接也存在過載和疏離的現(xiàn)象。過載現(xiàn)象指的是,當(dāng)越來越多的連接高速進(jìn)行而產(chǎn)生過載時(shí),人們可能會(huì)消減目前過載的狀態(tài),然后進(jìn)行聚焦。疏離現(xiàn)象指的是,連接好友過多之后,人們反而跟現(xiàn)實(shí)社會(huì)更加疏離,進(jìn)而產(chǎn)生強(qiáng)烈的疏離感。以游戲工會(huì)為例,一個(gè)游戲工會(huì)可能多達(dá)百萬人。很多身處其中的年輕人的生活狀態(tài)是,在網(wǎng)吧里面玩游戲,打下金幣和寶物換錢,換了錢之后在網(wǎng)吧里面叫外賣,累了就到網(wǎng)吧邊上的酒店去休息,基本上不接觸外面的世界。這是網(wǎng)絡(luò)連接加強(qiáng)之后,用戶對(duì)社會(huì)產(chǎn)生疏離感的真實(shí)寫照,是連接帶來的另一方面不太積極的影響。
數(shù)據(jù)連接的理想狀態(tài):輕于鴻毛,重如泰山
以微信為例,其作為數(shù)據(jù)連接器能夠提供給用戶便捷的使用體驗(yàn),這是其輕于鴻毛的一面。而微信背后的計(jì)算紛繁復(fù)雜,有強(qiáng)大的技術(shù)支撐,這是其重如泰山的一面。
現(xiàn)在很多大數(shù)據(jù)平臺(tái)在首頁上就為用戶呈現(xiàn)出極其復(fù)雜的功能,其實(shí)是顛倒了這兩個(gè)方面。理想狀態(tài)應(yīng)當(dāng)是前端“輕于鴻毛”,后端“重于泰山”。根據(jù)這個(gè)原理,大數(shù)據(jù)的邏輯可以簡化成20個(gè)字,這20個(gè)字體現(xiàn)著大數(shù)據(jù)平臺(tái)真正的價(jià)值——發(fā)現(xiàn)問題,感知風(fēng)險(xiǎn),解決問題,建立連接,預(yù)測(cè)未來。
首先,發(fā)現(xiàn)問題,這是大數(shù)據(jù)研究的首要一步。第二,感知風(fēng)險(xiǎn),或者叫感知變化。大數(shù)據(jù)系統(tǒng)做出來之后,應(yīng)該能夠連續(xù)分析其中蘊(yùn)含的風(fēng)險(xiǎn)、變化的實(shí)質(zhì)。第三,解決問題。目前解決問題多數(shù)手段仍在線下,且多需要第三方輔助,所以這方面重要性有所提升。第四,建立連接。把世界上更多的人連接起來,這是很重要的基礎(chǔ)目標(biāo)。第五,預(yù)測(cè)未來,只是最終目的——數(shù)據(jù)系統(tǒng)到底能預(yù)測(cè)到什么,能預(yù)測(cè)多久的事情。今年3月,沈老師提出“輿論預(yù)報(bào)”的概念。這可以是整個(gè)輿論場里面的短期預(yù)報(bào),如明天的天氣指數(shù);也可以是長期預(yù)報(bào),如一年內(nèi)全體中國人的情緒會(huì)有什么樣變化。
沈陽團(tuán)隊(duì)的數(shù)據(jù)研究,如輿情系統(tǒng)僅做了一年時(shí)間,但目前其機(jī)構(gòu)用戶數(shù)已經(jīng)位居行業(yè)前列。然而,沈老師表示,團(tuán)隊(duì)目前搭建的平臺(tái)仍然處于非常初級(jí)的階段?;诖髷?shù)據(jù)連接論歸納的這20個(gè)字:發(fā)現(xiàn)問題、感知風(fēng)險(xiǎn)、解決問題、建立連接、預(yù)測(cè)未來,是團(tuán)隊(duì)不斷提升迭代的重要準(zhǔn)則。
通過搭建平臺(tái)的經(jīng)歷,沈老師發(fā)現(xiàn)數(shù)據(jù)實(shí)際上可以分為三類:一類是to G,一類是to B,一類是to C,每類的要求各不相同。to G,是指對(duì)政府而言。從本質(zhì)上看,政府不需要產(chǎn)品,而是服務(wù)。to B,它需要大數(shù)據(jù)的場景更多是群體決策,待考慮的因素較多。to C,秉著輕于鴻毛的原則,產(chǎn)品良好體驗(yàn)性至關(guān)重要。所以大數(shù)據(jù)類別不同時(shí),它的要求也千差萬別。
去年下半年,沈老師曾提出一個(gè)模型——五層的表里數(shù)據(jù)關(guān)聯(lián)模型。所有的數(shù)據(jù)都可以被分做五類:第一大類就是原來的百度、谷歌等搜索引擎能搜索到的數(shù)據(jù),其為表層數(shù)據(jù)。表層數(shù)據(jù)沒有太大的門坎,任何人都可以做一個(gè)蜘蛛爬蟲去爬。第二類是手機(jī)APP里面蘊(yùn)含的數(shù)據(jù),這叫表二層數(shù)據(jù)。這種數(shù)據(jù)的獲取難度比表一層稍微難一點(diǎn),但是門坎仍然不是特別高。其獲取方式可以通過爬蟲,模擬手機(jī)抓取回來。第三類是里一層數(shù)據(jù),這是每個(gè)單位內(nèi)部的數(shù)據(jù),比如信息管理系統(tǒng)的數(shù)據(jù)等。第四類是里二層數(shù)據(jù),這是每個(gè)人產(chǎn)生的數(shù)據(jù),價(jià)值性非常高。第五類是里三層數(shù)據(jù),是每個(gè)人的基因數(shù)據(jù)。設(shè)想未來,可能再過20年左右,每個(gè)人到任何一個(gè)單位可能都會(huì)被要求提交基因數(shù)據(jù),由此其人的許多特性概率即可被獲知,如犯罪概率等。這類數(shù)據(jù)在某種程度上相當(dāng)可怕,因?yàn)檫@類數(shù)據(jù)將會(huì)使得人類陷入一種未來確定論的境界。
從實(shí)際著手去做大數(shù)據(jù)的角度來說,若想要獲得里層數(shù)據(jù),需要擁有如微信等作為自有平臺(tái),在后臺(tái)便可以拿到用戶的所有信息。在里層數(shù)據(jù)里面,里二層數(shù)據(jù)即每個(gè)人的數(shù)據(jù)非常寶貴。數(shù)據(jù)的最高價(jià)值就是能夠從APP里面獲得的各方面數(shù)據(jù)。
第二層有價(jià)值的數(shù)據(jù)是什么?在APP里埋SDK(軟件開發(fā)工具包,外語首字母縮寫:SDK、外語全稱:Software Development Kit。一般都是一些軟件工程師為特定的軟件包、軟件框架、硬件平臺(tái)、操作系統(tǒng)等建立應(yīng)用軟件時(shí)的開發(fā)工具的集合。),故而能拿到APP中的數(shù)據(jù)。但受限于協(xié)議,有些數(shù)據(jù)是平臺(tái)無法觸及的。
以今日頭條等大數(shù)據(jù)信息平臺(tái)為例,其可以隨意向受眾推送信息,但是埋SDK最大的問題是信息平臺(tái)無法向受眾推送平臺(tái)想讓受眾看到的商品信息。所以在這個(gè)大數(shù)據(jù)的世界當(dāng)中,最底層的是自己自有渠道拿到的數(shù)據(jù),第二層是信息平臺(tái)在這個(gè)渠道當(dāng)中埋SDK,拿到的受眾數(shù)據(jù)。然后再往上就是信息平臺(tái)也埋不了SDK,把所有的表層數(shù)據(jù)收集起來進(jìn)行分析。
所以,未來會(huì)有一個(gè)公司,把網(wǎng)絡(luò)當(dāng)中所有的ID號(hào)的數(shù)據(jù)全部收集起來,這個(gè)量級(jí)可能在千億級(jí)別的ID號(hào),用戶只要在百度貼吧、微博、豆瓣等平臺(tái)發(fā)布一則內(nèi)容,大數(shù)據(jù)公司就可以全部將此聯(lián)系起來,然后來分析這些ID之間的匹配關(guān)系。做不了ID大數(shù)據(jù),還可以退而求其次做IP大數(shù)據(jù),首先攻克網(wǎng)絡(luò)里面有名氣的、有價(jià)值的賬號(hào)。
今天的大數(shù)據(jù)到底發(fā)展到了什么階段呢?前幾日,一篇微信文章中整理了國內(nèi)70家最大的大數(shù)據(jù)公司,但這70家里面還有一些領(lǐng)域沒有覆蓋,這意味著目前仍處于上半場。即便如此,在某些價(jià)值密度高的領(lǐng)域,有些公司的規(guī)模已經(jīng)較為龐大,這就意味著某些領(lǐng)域已經(jīng)到中場,因此沈老師判斷大數(shù)據(jù)正處于從上半場轉(zhuǎn)向中場這樣一個(gè)階段。這就意味著今天的大數(shù)據(jù)領(lǐng)域,類似于20年前的房地產(chǎn),大部分地方還是空地,但是有些大城市已經(jīng)被廣泛圈地。
根據(jù)后來的細(xì)分領(lǐng)域,沈老師提出了一個(gè)新概念——大數(shù)據(jù)的產(chǎn)業(yè)接觸點(diǎn)。假設(shè)現(xiàn)在有大數(shù)據(jù)公司再來做服裝資訊,就已經(jīng)沒有必要了,因?yàn)榉b資訊已經(jīng)有一家蝶訊網(wǎng),且已經(jīng)完成新三板上市,所以,這時(shí)候就可以考慮做服裝設(shè)計(jì)的軟件大數(shù)據(jù),中國在這個(gè)領(lǐng)域可能還沒有形成一個(gè)巨頭,這就是可以嘗試的方向。又或者去做服裝面料的采購,這可能將是一個(gè)B2B的交易市場。再或者可以去做服裝貿(mào)易加工工廠的大數(shù)據(jù),中國服裝加工工廠非常多,如果覺得這個(gè)市場量太小了,那就可以做服裝行業(yè)、紡織行業(yè)工人的大數(shù)據(jù),這個(gè)量就很大。所以這表明一條線從to G的管理到to B的交易再到to C的廣泛使用,在任何一個(gè)行業(yè)都可以按照這個(gè)邏輯去切入。目前做通用大數(shù)據(jù),這個(gè)市場的競爭已經(jīng)非常激烈;所以,沈老師認(rèn)為下一個(gè)階段,行業(yè)大數(shù)據(jù)規(guī)模會(huì)進(jìn)一步持續(xù)擴(kuò)大,這個(gè)量級(jí)會(huì)增長到人們難以想象的地步。
大數(shù)據(jù)的運(yùn)用非常廣泛,從輿論的角度來說也非常有趣。在整個(gè)輿論行業(yè)當(dāng)中,一個(gè)比較大的問題是輿論的客觀性和不客觀性。如今一個(gè)重要的課題擺在人們眼前,即如何去甄別真實(shí)的言論和虛假的言論。很不幸的是,現(xiàn)在的水軍越來越像真實(shí)的人,好像沒有什么機(jī)器在電腦上操作不了的事情。小冰,一個(gè)人工智能的產(chǎn)品,他寫的詩比很多人寫的還要好,他已經(jīng)完成了這種進(jìn)化,整個(gè)人類已經(jīng)開始進(jìn)入到人本身的ID、人本身的資訊、人工智能以及機(jī)器產(chǎn)生的資訊和ID大規(guī)模共存的時(shí)代,這對(duì)輿情的影響非常之大。以上是在輿情研究中需要重點(diǎn)考慮的第一個(gè)要素。
第二個(gè)要素是如今越來越分散的平臺(tái),多平臺(tái)到達(dá),多渠道網(wǎng)絡(luò),多媒介融合。在這樣一種狀態(tài)下,大數(shù)據(jù)想要去尋找一個(gè)傳播路徑,尋找一個(gè)產(chǎn)品,在不同的平臺(tái)當(dāng)中的品牌度、聲量值、美譽(yù)度,實(shí)際上是一個(gè)比較復(fù)雜的課題,從另一方面來說,這個(gè)課題也就因此極具價(jià)值。
在如今的大數(shù)據(jù)形勢(shì)下,沈老師認(rèn)為營銷、廣告、公關(guān)、品牌這四個(gè)方面其實(shí)相互統(tǒng)一,或者說是一個(gè)共同體。也就是說此時(shí)可能需要一個(gè)精算的工具,需要能把不同平臺(tái)的粉絲連接起來的工具,同時(shí)可能也需要在不同平臺(tái)當(dāng)中測(cè)算不同轉(zhuǎn)化率的工具。假設(shè)今天有了資訊數(shù)據(jù),能不能考慮把環(huán)保數(shù)據(jù)納入進(jìn)來,然后根據(jù)環(huán)保的數(shù)據(jù)、霧霾的數(shù)據(jù),進(jìn)而影響北京的輿論場。想要做預(yù)報(bào)的話,需要把環(huán)保數(shù)據(jù)和資訊數(shù)據(jù)進(jìn)行整合。正如剛才強(qiáng)調(diào)的,不管是大數(shù)據(jù)連接論也好,還是指數(shù)大數(shù)據(jù)、輿論大數(shù)據(jù)、營廣公品(營銷、廣告、公關(guān)、品牌)大數(shù)據(jù),人類的一個(gè)終極目標(biāo)就是把所有的數(shù)據(jù)連接起來,未來在全世界的范圍內(nèi),人類可能就身處一個(gè)國家。如果真有走向這一步的那天,人類更需要強(qiáng)有力的連接手段,包括更好的測(cè)算模型以及在倫理方面的更加精確和精妙的把握。
責(zé)任編輯:陳近梅