來源:數(shù)據(jù)觀 時間:2017-03-09 10:25:41 作者:大數(shù)據(jù)文摘
?Google于今早在舊金山舉行的Google Cloud Next會議上確認將收購數(shù)據(jù)科學(xué)競賽平臺Kaggle,但沒有公開收購條款細節(jié)。
?圖:2017年3月9日Kaggle社區(qū)最新排名
?這項收購并不出人意料。Kaggle在平臺上擁有50萬數(shù)據(jù)科學(xué)家,它將使Google能夠立即在AI社區(qū)中拓展其覆蓋范圍。隨著谷歌與亞馬遜在云計算領(lǐng)域的競爭難分伯仲,它將需要盡可能多的制勝點。
?這也將幫助谷歌在數(shù)據(jù)科學(xué)社區(qū)中更加扎實地確立其品牌——盡管得益于其像TensorFlow這樣的項目,它已經(jīng)是主角之一。谷歌面臨著日益激烈的競爭,因為人工智能領(lǐng)域已經(jīng)向自動駕駛和深度學(xué)習(xí)等垂直領(lǐng)域發(fā)展,公司不論大小都可以分到一杯羹。這從理論上可以將谷歌排除在最佳人工智能操作公司名單之外,雖然谷歌旗下的阿爾法狗剛剛戰(zhàn)勝圍棋世界冠軍。
?購買Kaggle及其在人工智能社區(qū)內(nèi)的知名度也可能有助于招聘。Google需要確保它不斷吸收專門從事深度學(xué)習(xí)的最佳人才,與其他公司(例如Pinterest(專注于視覺搜索))競爭。即使并不是一個比較專業(yè)化的技術(shù)收購,收購也意味著谷歌正在擴大關(guān)注范圍,以探索更深入不同類別的方法,以確保其在人工智能的主導(dǎo)地位。
?據(jù)估計,Google會保證Kaggle繼續(xù)運營其服務(wù)—并保留其當(dāng)前名稱。
?Kaggle由Goldbloom和Ben Hamner于2010年創(chuàng)立。企業(yè)和研究人員在Kaggle上發(fā)布數(shù)據(jù),讓全世界的統(tǒng)計師和數(shù)據(jù)科學(xué)家對數(shù)據(jù)集進行建模和分析,以競賽的形式評選出最佳模型。Kaggle的眾包競賽模式的價值在于,讓人們有可能從無窮無盡的建模方法中,尋找到最優(yōu)解。作為一個舉辦數(shù)據(jù)科學(xué)和機器學(xué)習(xí)競賽的平臺,盡管早期有一些競爭對手,如DrivenData,TopCoder和HackerRank,Kaggle已經(jīng)通過特別的市場定位,將它們遠遠甩在后面。它已經(jīng)是數(shù)據(jù)科學(xué)和機器學(xué)習(xí)競賽領(lǐng)域當(dāng)之無愧的大哥大。
?Kaggle也有一些與谷歌的“歷史淵源”,就在本月初,Google和Kaggle合作舉辦了一場價值100,000美元的機器學(xué)習(xí)競賽,圍繞YouTube視頻進行分類。這場比賽也與Google Cloud Platform進行了深入的整合。
?雖然谷歌的收購主要基于Kaggle所構(gòu)建的社區(qū)、而不是其技術(shù)價值,Kaggle自身也針對數(shù)據(jù)科學(xué)競賽開發(fā)了不少有用的工具。數(shù)據(jù)科學(xué)家可以使用一個基于云的平臺Kaggle Kernels(曾經(jīng)被稱為Scripts)運行數(shù)據(jù)分析和建模的代碼、將源代碼分享給他人以得到社區(qū)中的反饋意見,以及將源代碼展示在自己的Kaggle資料中。這樣,企業(yè)將非常容易看到Kaggle競賽中排名靠前的選手所做過的工作,這也是數(shù)據(jù)工作者競相爭取更高Kaggle排名的原因(當(dāng)然,另一個原因是企業(yè)為最佳數(shù)據(jù)分析結(jié)果給出的巨額獎金?。?/p>
?Kaggle的另一項服務(wù)是其網(wǎng)站上的招聘信息發(fā)布。目前還不知道谷歌將如何處理這項業(yè)務(wù)。
?圖:Kaggle招聘服務(wù)
?根據(jù)Crunchbase,Kaggle從2010年推出以來,籌集了1250萬美元(PitchBook說是1275萬美元)。Kaggle的投資者包括Index Ventures,SV Angel,Max Levchin,Naval Ravikant,Google首席經(jīng)濟學(xué)家Hal Varian,Khosla Ventures和Yuri Milner。
?以下為Kaggle的 CEO,Anthony Goldbloom的演講內(nèi)容:
?我很自豪和興奮地宣布,Kaggle準(zhǔn)備加入谷歌云!
?七年前,我們發(fā)起了第一場競賽,以預(yù)測歐洲歌唱大賽的投票模式。Jure Zbontar贏了,他擊敗其它的21支隊伍,贏得1000美元的獎金。
?從那以來,Kaggle社區(qū)已經(jīng)使用機器學(xué)習(xí)來為高中作文打分,診斷心力衰竭和提高希格斯玻色子發(fā)現(xiàn)的顯著性。 Geoff Hinton和George Dahl在默克競爭中展示了深層神經(jīng)網(wǎng)絡(luò)的力量,Tianqi Chen使用Kaggle Kernels向XGBoost介紹了社區(qū)。 Kaggle的個人資料庫已經(jīng)成為一項公認的認證證明,社區(qū)成員在這里完成從DeepMind到沃爾瑪公司的工作。去年8月,我們推出了一個開放的數(shù)據(jù)平臺,社區(qū)已經(jīng)共享了數(shù)百個高質(zhì)量的數(shù)據(jù)集。在Kaggle社區(qū),我們已經(jīng)一起取得了很多重要進展!
?Kaggle的團隊將作為一個整體加入Google Cloud,并將保留Kaggle的獨特品牌。我們將繼續(xù)發(fā)展我們的競賽和開放數(shù)據(jù)平臺,繼續(xù)對所有數(shù)據(jù)科學(xué)家、公司、方法和技術(shù)開放。 Kaggle Kernels將繼續(xù)支持源自Google多樣化生態(tài)系統(tǒng)的機器學(xué)習(xí)庫和包,也會繼續(xù)支持那些并非源自Google的工具包。
?Kaggle加入Google將允許我們實現(xiàn)更多目標(biāo)。它將世界上最大的數(shù)據(jù)科學(xué)社區(qū)與世界上最強大的機器學(xué)習(xí)云相結(jié)合。更令人振奮的是,這還能聯(lián)合ImageNet創(chuàng)作者李飛飛和李佳的力量。
?將Google云技術(shù)接入我們的社區(qū)后,我們將能夠接入強大的基礎(chǔ)架構(gòu)、可擴展的培訓(xùn)和部署服務(wù),以及存儲和查詢大型數(shù)據(jù)集的能力。
?感謝所有人為建立我們超級棒的社區(qū)所付出的努力。我無比期待接下來能和你們一起實現(xiàn)更多。
?——Anthony Goldbloom, CEO
?編譯 | 姜范波,任杰,Sophie
責(zé)任編輯:陳近梅