国模叶桐尿喷337p人体,国产乱xxⅹxx国语对白,国产精品人妻无码久久久郑州,国产一区二区内射最近更新,国产一区二区三区不卡在线看

首頁(yè) 自媒自媒體大數(shù)據(jù)文摘正文

對(duì)話第四范式胡時(shí)偉:讓數(shù)據(jù)科學(xué)家成為業(yè)務(wù)專家,再為他們配一支技術(shù)軍團(tuán)

  “我的工作有相當(dāng)一部分時(shí)間是在出差的。”

  這位剛剛畢業(yè)于哥倫比亞大學(xué)的90后、第四范式數(shù)據(jù)智能部最年輕的數(shù)據(jù)科學(xué)家胡時(shí)偉如是向記者描述他的工作狀態(tài)。

  “我們會(huì)直接走入客戶公司,了解他們的運(yùn)營(yíng)模式,有點(diǎn)像咨詢。這也是我最喜歡第四范式的地方,給數(shù)據(jù)科學(xué)家的工作任務(wù)和美國(guó)那邊的定位很類似,偏應(yīng)用端,不會(huì)做太多R&D(研發(fā))的工作?!?/p>

  環(huán)顧四周,裝修簡(jiǎn)約的開放式辦公室,配上秋千椅、高腳桌,隨處可見免費(fèi)小零食。走進(jìn)第四范式,你會(huì)自然而然地聯(lián)想到“極客文化”、“工程師文化”,聯(lián)想到Facebook,Google等以人性化辦公著稱的科技公司。

  而眼前這位數(shù)據(jù)科學(xué)的一番話,卻讓我們覺(jué)得,第四范式的數(shù)據(jù)科學(xué)家們似乎與我們傳統(tǒng)印象中以技術(shù)為主,常年坐辦公室調(diào)參、做研發(fā)的“科學(xué)家”有所不同。

  你何時(shí)見過(guò)每個(gè)月都要出差幾次的“科學(xué)家”呢?

  暴走的數(shù)據(jù)科學(xué)家與“消失”的研發(fā)團(tuán)隊(duì)

  “將來(lái)的數(shù)據(jù)科學(xué)家,應(yīng)該每個(gè)人都有一個(gè)助手,甚至是有一支龐大的軍隊(duì)。這個(gè)龐大的軍隊(duì)不吃糧草,只吃數(shù)據(jù),數(shù)據(jù)科學(xué)家負(fù)責(zé)攻城略地就好了?!?/p>

  在與第四范式聯(lián)合創(chuàng)始人、首席架構(gòu)師胡時(shí)偉的訪談中,他進(jìn)一步肯定了第四范式對(duì)數(shù)據(jù)科學(xué)家業(yè)務(wù)能力的重視?!皩?duì)于我們的數(shù)據(jù)科學(xué)家,不僅要理解算法,更重要的是要求他們有對(duì)業(yè)務(wù)的理解能力和溝通能力,對(duì)業(yè)務(wù)有敏感度?!?/p>

  在這家定位為“人工智能技術(shù)與服務(wù)提供商”的公司,胡時(shí)偉口中的數(shù)據(jù)科學(xué)家的時(shí)間與精力分配,與我們的固有認(rèn)知存在較大差異。在過(guò)去,如果一個(gè)數(shù)據(jù)科學(xué)家一天工作8小時(shí),那么可能有超過(guò)6個(gè)小時(shí)他是在做數(shù)據(jù)準(zhǔn)備、模型調(diào)參等較為繁瑣的工作。而在第四范式,數(shù)據(jù)科學(xué)家每天這類工作可能只占用不到2個(gè)小時(shí),剩下的大量時(shí)間都用在解決實(shí)際業(yè)務(wù)問(wèn)題上。從6個(gè)小時(shí)到2個(gè)小時(shí),當(dāng)中似乎省掉了一整個(gè)研發(fā)團(tuán)隊(duì)所需承擔(dān)的工作。

  那么在第四范式,究竟是誰(shuí)在負(fù)責(zé)數(shù)據(jù)準(zhǔn)備、模型調(diào)參呢?

  接手這個(gè)“消失”的研發(fā)團(tuán)隊(duì)職責(zé)的,是第四范式自主研發(fā)的一個(gè)AI應(yīng)用者開發(fā)平臺(tái)--“第四范式·先知”平臺(tái)。

  “傳統(tǒng)來(lái)講一個(gè)數(shù)據(jù)科學(xué)家,他需要一些編程的經(jīng)驗(yàn),需要一些系統(tǒng)的經(jīng)驗(yàn),需要一些數(shù)學(xué)的理論支持,同時(shí)還要會(huì)用一些工具對(duì)數(shù)據(jù)處理,然后是業(yè)務(wù)知識(shí)。縱觀其整個(gè)工作中,大量繁重的工作其實(shí)與業(yè)務(wù)無(wú)關(guān)。我們創(chuàng)立第四范式的時(shí)候就發(fā)現(xiàn)了這個(gè)問(wèn)題:跟業(yè)務(wù)無(wú)關(guān)的工作,其實(shí)是可以用產(chǎn)品的方式解決的?!?/p>

  胡時(shí)偉所描述的現(xiàn)象可以被歸結(jié)為“進(jìn)入數(shù)據(jù)科學(xué)的門檻太高”的問(wèn)題。Google開發(fā)的Tensor flow已大大降低了機(jī)器學(xué)習(xí)的入門門檻,數(shù)據(jù)科學(xué)家們不再需要自行實(shí)現(xiàn)艱深復(fù)雜的機(jī)器學(xué)習(xí)深度學(xué)習(xí)算法。

  “但Tensorflow主要是面向算法研究者,需要對(duì)數(shù)學(xué)與機(jī)器學(xué)習(xí)有比較深的理解、以及具備較強(qiáng)的編程能力?!钡谒姆妒较胍堰@個(gè)門檻放得再低一些——讓科學(xué)家只需要專注于解決業(yè)務(wù)問(wèn)題,帶著這些功能封裝起來(lái)的“軍團(tuán)”,跑到了業(yè)務(wù)第一線。

  給業(yè)務(wù)高手配一個(gè)技術(shù)工具?還是給技術(shù)專家配一個(gè)業(yè)務(wù)顧問(wèn)

  給業(yè)務(wù)高手配一個(gè)技術(shù)工具?還是給技術(shù)專家配一個(gè)業(yè)務(wù)顧問(wèn)?這是目前人工智能、數(shù)據(jù)科學(xué)領(lǐng)域一直在爭(zhēng)論的一個(gè)難題。

  一方面,工程師背景較強(qiáng)的團(tuán)隊(duì)往往會(huì)認(rèn)為,技術(shù)能力,例如對(duì)機(jī)器學(xué)習(xí)算法的了解,是AI人才的關(guān)鍵技能,數(shù)據(jù)科學(xué)所需要的專業(yè)技能則能通過(guò)在與客戶的溝通中快速學(xué)習(xí)到;而另一方面,傳統(tǒng)上并非以工程師背景為人所知的團(tuán)隊(duì),例如城市規(guī)劃團(tuán)隊(duì),則認(rèn)為業(yè)務(wù)知識(shí)需要多年的積累,而編程知識(shí)、算法知識(shí)則可以被快速獲得。

  工程背景強(qiáng)悍的第四范式,選擇了給業(yè)務(wù)高手配一個(gè)AI平臺(tái)工具。胡時(shí)偉認(rèn)為,給業(yè)務(wù)高手配一個(gè)技術(shù)工具不僅僅是第四范式的產(chǎn)品開發(fā)模式,也是未來(lái)實(shí)現(xiàn)“人人都成為數(shù)據(jù)科學(xué)家”的關(guān)鍵。

  在先知的定位中,數(shù)據(jù)團(tuán)隊(duì)及業(yè)務(wù)專家都是使用者。今年上半年,第四范式舉行了一場(chǎng)基于先知的建模比賽,參賽選手是離機(jī)器學(xué)習(xí)比較遠(yuǎn)的行政、商務(wù)員工,兩周的培訓(xùn)之后有超過(guò)70%的參賽組合AUC成績(jī)(衡量模型效果的指標(biāo))超過(guò)0.8,達(dá)到成熟的數(shù)據(jù)科學(xué)家水平。

  在胡時(shí)偉帶領(lǐng)的先知技術(shù)團(tuán)隊(duì)的規(guī)劃中,這個(gè)門檻還將繼續(xù)降低?!拔覀兊脑妇笆恰瓵I foreveryone’,就是說(shuō)讓大家都能夠用到這個(gè)新的(數(shù)據(jù)科學(xué)、人工智能領(lǐng)域的)技術(shù)。”

  “算法和架構(gòu)的能力可以被產(chǎn)品化,而在業(yè)務(wù)能力上,AI不會(huì)消滅行業(yè)?!焙鷷r(shí)偉篤定地回答這個(gè)問(wèn)題。他從“AI的五個(gè)先決條件”為我們解釋了他們所作選擇背后的原因。

  他認(rèn)為,企業(yè)實(shí)現(xiàn)AI化,需要滿足五大核心要素:

  第一個(gè)是邊界清晰的問(wèn)題定義。這個(gè)說(shuō)的就是業(yè)務(wù)方向。這個(gè)特別重要,問(wèn)題目標(biāo)都錯(cuò)了,你跑一百米、一千米,也達(dá)不到你的目標(biāo)。

  第二個(gè)是高質(zhì)量、有意義的過(guò)程數(shù)據(jù)。這個(gè)其實(shí)也是跟業(yè)務(wù)有關(guān)系的,這回答的是最重要的一個(gè)問(wèn)題:我該收集什么數(shù)據(jù)?那這個(gè)問(wèn)題的答案肯定是從業(yè)務(wù)來(lái),不是從算法來(lái)的。

  第三個(gè)是持續(xù)不斷的反饋。胡時(shí)偉指出,光有過(guò)程數(shù)據(jù)是遠(yuǎn)不夠的。以下圍棋為例,光知道棋譜,不知道最后誰(shuí)贏誰(shuí)輸,是學(xué)不會(huì)圍棋的。

  除此之外,還需要有算法能力和高性能的計(jì)算能力。在機(jī)器學(xué)習(xí)的實(shí)際業(yè)務(wù)場(chǎng)景中,動(dòng)輒數(shù)十億級(jí)別的數(shù)據(jù)樣本,給計(jì)算框架帶來(lái)嚴(yán)峻考驗(yàn),在這樣的數(shù)據(jù)規(guī)模上即便是簡(jiǎn)單的邏輯回歸模型,也會(huì)變成一個(gè)非常困難的問(wèn)題,因此企業(yè)在計(jì)算能力上的投入將是巨大的。

  胡時(shí)偉指出,算法能力和高性能的計(jì)算能力這兩個(gè)技術(shù)問(wèn)題,是會(huì)隨著高性能的機(jī)器學(xué)習(xí)平臺(tái)的普及和硬件的提升而逐步解決的。而前面的三個(gè)問(wèn)題,是業(yè)務(wù)問(wèn)題、社會(huì)問(wèn)題,是需要人去解決的。

  公司從數(shù)據(jù)化到AI化的轉(zhuǎn)變?yōu)闀r(shí)過(guò)早嗎?

  目前,很多傳統(tǒng)企業(yè)已開始考慮向AI化轉(zhuǎn)型,但事實(shí)上它們中的很多仍然處在公司運(yùn)營(yíng)數(shù)據(jù)化初級(jí)階段,這些公司普遍有這樣的疑惑:現(xiàn)在考慮AI化是否為時(shí)過(guò)早?而企業(yè)AI化又該走哪條路?該將業(yè)務(wù)外包給AI咨詢公司?求助第三方AI平臺(tái)?還是自己開發(fā)一套AI平臺(tái)?

  在胡時(shí)偉看來(lái),企業(yè)現(xiàn)在考慮AI化絕不算早,實(shí)現(xiàn)AI化所需要的數(shù)據(jù)要從現(xiàn)在開始攢起。大多數(shù)公司不像百度、google這種互聯(lián)網(wǎng)公司,擁有充足的數(shù)據(jù)積累。在更多的公司、更多的場(chǎng)景中,AI并不是想開始就能開始的?!拔磥?lái)的企業(yè)競(jìng)爭(zhēng)相當(dāng)程度上是數(shù)據(jù)資產(chǎn)的競(jìng)爭(zhēng),兵馬未動(dòng)糧草先行,盡早解決數(shù)據(jù)的問(wèn)題,這并不是操之過(guò)急、而是勢(shì)在必行的事情。”

  而關(guān)于三種不同的公司AI化方案,胡時(shí)偉認(rèn)為,這其實(shí)是同一種AI化方案的三個(gè)步驟。

  “單純的咨詢公司往往不具備核心的產(chǎn)品能力,即使是能夠給出正確的思路,企業(yè)也無(wú)法能夠真正得到效果?!?/p>

  胡時(shí)偉認(rèn)為,企業(yè)老板通過(guò)咨詢或是學(xué)習(xí)的方式能對(duì)AI有一個(gè)正確的認(rèn)識(shí)。“我覺(jué)得一個(gè)企業(yè)的經(jīng)營(yíng)者、決策者是對(duì)這個(gè)企業(yè)業(yè)務(wù)的提升最了解的人,他自己先要成為一個(gè)機(jī)器學(xué)習(xí)應(yīng)用方面的行家,但是他不用成為算法專家。他要知道業(yè)務(wù)在新的時(shí)代下,在高維對(duì)高維的直接反饋的情況下,會(huì)變成什么樣子,這個(gè)是很重要的。”

  在樹立了對(duì)AI的正確觀念與期望之后,攢夠了AI化所需的數(shù)據(jù)之后,企業(yè)可以選擇進(jìn)一步組建起自己的數(shù)據(jù)團(tuán)隊(duì),或者通過(guò)第三方平臺(tái)實(shí)現(xiàn)AI化。

  而至于自建平臺(tái),胡時(shí)偉則認(rèn)為并不適用大多數(shù)想要實(shí)現(xiàn)AI化的公司。“在沒(méi)有機(jī)器學(xué)習(xí)平臺(tái)之前,一些有資源儲(chǔ)備的大公司會(huì)自建平臺(tái)。但其實(shí)到了現(xiàn)在這個(gè)階段,隨著第三方平臺(tái)的成熟,公司可以引入平臺(tái)、以比較合理的投入高效獲得AI帶來(lái)的收益,何樂(lè)而不為呢?”

  給AI行業(yè)的新人的建議:找到這個(gè)行業(yè)真正的金子

  “不著急,不跟風(fēng);最關(guān)鍵的還是要說(shuō)怎么能去解決實(shí)際的問(wèn)題”

  胡時(shí)偉也給想進(jìn)入AI行業(yè),或是初步進(jìn)入AI行業(yè)的新人提了幾個(gè)建議。

  對(duì)于學(xué)生來(lái)說(shuō),沒(méi)有那么多的機(jī)會(huì)接觸到實(shí)際應(yīng)用,那么就要把AI的方法論搞清楚?!安恢?,不跟風(fēng)。要知道機(jī)器學(xué)習(xí)為什么產(chǎn)生效果,而不是說(shuō)我下載一個(gè)代碼覺(jué)得產(chǎn)生效果了,就覺(jué)得可以了?!?/p>

  對(duì)于AI從業(yè)者來(lái)說(shuō),一定要關(guān)注目標(biāo)導(dǎo)向。在問(wèn)題定位清楚、提升空間分析完備之前,最好不要就全身心投入到模型調(diào)試的工作中去。前期要更多的關(guān)心這個(gè)模型是不是能解決企業(yè)的實(shí)際問(wèn)題,或者是企業(yè)解決該問(wèn)題的數(shù)據(jù)完備程度是否達(dá)到等。

  “對(duì)于企業(yè)來(lái)說(shuō),目標(biāo)導(dǎo)向就是你不需要去了解機(jī)器背后使用了什么算法、架構(gòu),就能享受到大數(shù)據(jù)驅(qū)動(dòng)所帶來(lái)的價(jià)值提升?!焙鷷r(shí)偉如是說(shuō)。

?

責(zé)任編輯:陳近梅

分享: