來源:數據觀 時間:2019-05-27 22:36:40 作者:
5月26日,2019數博會“大數據·新居住”專業(yè)論壇舉辦。在論壇的演講環(huán)節(jié),中國信息通信研究院云計算與大數據研究所所長何寶宏圍繞當前大數據的發(fā)展態(tài)勢做了主題演講。
在演講一開始,何寶宏就向在座的嘉賓拋出一個問題:未來十年,最奢的奢侈品會是什么?“毋庸置疑,未來最難拿到的將是隱私。”何寶宏講到,當前大數據的興起已然顛覆了我們對隱私的保護:“機器記住了你不應該記住和不想記住的東西。十年以后,在大數據時代,在新居住時代,如果我向你打招呼你不記得我,那就太幸福了,未來一定是這樣子的,被人忘記是一種幸福?!?/p>
的確,從要“努力記住”到“想忘記很難”的過程,也是數據越來越多、種類越來越復雜的過程。何寶宏表示,當前我們面臨的場景非常復雜,目前對于數據的分布式的分析和處理正在不斷融合,一些傳統(tǒng)數據庫也在向數據管理越來越模塊化、標準化的方向發(fā)展,其中還包括軟硬一體結合、數據管理開源的進展以及越來越多數據管理技術的誕生,如區(qū)塊鏈、時序數據庫等,而伴隨著這一態(tài)勢,在未來,一定還會有更多不同的數據管理技術誕生并得到發(fā)展。
同時,何寶宏還談到了他對大數據相關算法發(fā)展的擔憂?!霸谶@個數據爆炸的時代,大數據讓我們相信數據,但數據也能說謊。”何寶宏提到,算法是用機器書寫的數字世界的游戲規(guī)則,但算法更多注重的是效率,而不是道德和公平性問題。由于工程師會判斷優(yōu)先級,也存在盲點和偏見,這樣必然會把工程師對社會的認知帶到算法中,所以算法會出現問題,如自去年以來就被廣泛熱議的“大數據殺熟”問題。正是因為這樣的背景,可以想象未來的一兩年,我們要特別關注算法的開放問題及可解釋性的問題,要進行算法治理,尤其是涉及到個人隱私的時候。
數據資產化則是大數據發(fā)展面臨的另一個重要問題。何寶宏介紹,在技術方面,目前的一個典型應用是多方安全計算,旨在創(chuàng)造一個真正的面向數據的市場環(huán)境,這個市場環(huán)境不同于我們今天的商場、超市,也不同于石油、期貨,是一個全新的場景。而在數據資產化從理論到實踐的道路上,除了技術問題,還包括數據流通的問題。何寶宏認為,大數據流通是數字經濟學的富礦,但大數據流通尚處于男耕女織的時代。這主要是當前數據還沒有實現商品化造成的?!?0%的數據是你自己家的,或者是你鄰居家的,又或者是你客戶家的,另外50%還需要自我生產。在商業(yè)層面,99%以上的數據產品都是別人生產的,你自己家里生產不了,所以數據變成商品,變成資產還有很長的路要走?!背诉@一方面的原因,何寶宏還表示,數據資產化在理論以及經濟學的概念上也有待發(fā)展?!拔覀円恢痹谥v,今天經濟學的很多原理都不太適合數據這個資產,所以我把以前的經濟學叫做工業(yè)經濟學,并堅信誰能在數字經濟學堅持,就一定能獲得諾貝爾獎?!焙螌毢晷φ劦?。
演講中,何寶宏還提到了目前大數據發(fā)展除了算法及流通方面以外的一系列問題,如到底該如何采集?怎么處理?我們用過的數據都去了哪里?他提到當前對于數據利用存在的一個普遍的問題,那就是“很多數據被使用以后就進入‘冷宮’,不知去向?!边€有很多數據則是“生得偶然,死得隨機”,例如監(jiān)控物聯網采集數據,卻“根本不知道要拿來干什么。”
在這個一切皆數據,人類和數據互相塑造的時代,“我們一邊在保存數據,一邊在丟棄數據,幾年后還能找到十年前的數據嗎?有沒有辦法溯回?一千年后,后人會如何考古?我們的數據保存在哪兒?這些都是我們值得深思的問題?!焙螌毢暝谧詈笳f道。(數據觀記者 王婕)
責任編輯:陳近梅