來源:人民郵電報 時間:2023-12-07 10:06:23 作者:薛新龍 陳潤愷
人工智能正在深刻改變生產(chǎn)生活的各個領(lǐng)域,尤其是ChatGPT問世以來,國際社會對人工智能技術(shù)的關(guān)注和期待空前高漲,新的技術(shù)樣態(tài)與商業(yè)模式不斷涌現(xiàn)。英國《經(jīng)濟(jì)學(xué)人》調(diào)查顯示,僅2023年上半年,全球人工智能企業(yè)就吸引了超過400億美元的風(fēng)險投資,相關(guān)產(chǎn)業(yè)正處于快速變革和激烈競爭階段。我國應(yīng)緊跟國際人工智能產(chǎn)業(yè)發(fā)展趨勢,積極采取措施應(yīng)對競爭與挑戰(zhàn)。
全球人工智能產(chǎn)業(yè)蓬勃發(fā)展
算力競爭——降本增效成為首要任務(wù)。
算力是制約人工智能發(fā)展的首要因素,模型的訓(xùn)練和運(yùn)行需要龐大的計算資源。根據(jù)分析機(jī)構(gòu)SemiAnalysis的數(shù)據(jù),GPT-4的訓(xùn)練過程投入了約25000顆英偉達(dá)A100芯片,單次訓(xùn)練成本高達(dá)6300萬美元。成本壓力導(dǎo)致許多公司延緩新一代模型的研發(fā),例如,OpenAI公司經(jīng)過權(quán)衡,選擇將現(xiàn)有的GPT-4模型優(yōu)化至GPT-4.5版本,而非直接開發(fā)GPT-5模型。但這也為谷歌等財力雄厚的競爭對手創(chuàng)造了競爭空間,其計劃推出的Gemini模型有望在性能上超越OpenAI的現(xiàn)有產(chǎn)品。
因此,降低算力成本、提高計算效率已成為人工智能企業(yè)普遍面臨的問題。具體而言,一是加強(qiáng)芯片新架構(gòu)的研發(fā),以集成芯片、光芯片和類腦芯片為代表的新一代芯片技術(shù),具有提升良率、提高傳導(dǎo)效率、低能耗和自適應(yīng)學(xué)習(xí)等優(yōu)點(diǎn),正引領(lǐng)行業(yè)發(fā)展的新方向。二是優(yōu)化算力資源管理,增強(qiáng)調(diào)度能力。通過GPU資源池化等方式,實(shí)現(xiàn)資源并行使用,不僅提升算力利用率,還能有效降低硬件消耗和縮短調(diào)度時間。三是利用綠色電力或可再生能源為模型訓(xùn)練和運(yùn)行提供算力,從而降低碳排放,提高能源效率。
數(shù)據(jù)爭奪——拓展來源渠道豐富數(shù)據(jù)形式。
數(shù)據(jù)是決定人工智能競爭力的關(guān)鍵,優(yōu)質(zhì)、豐富的數(shù)據(jù)能夠顯著提高模型的理解力和內(nèi)容生成精度。在技術(shù)快速發(fā)展的驅(qū)動下,企業(yè)對數(shù)據(jù)的渴求日益強(qiáng)烈。谷歌和Meta等科技巨頭的最新模型已經(jīng)接受了超過1萬億單詞的訓(xùn)練,相當(dāng)于250多個英語版維基百科的內(nèi)容。研究機(jī)構(gòu)Epoch AI預(yù)計,可用于訓(xùn)練的高質(zhì)量文本庫可能在2026年之前耗盡。
為獲取更多優(yōu)質(zhì)的數(shù)據(jù),人工智能企業(yè)在拓展數(shù)據(jù)來源形式方面展開了激烈的競爭。一是與專業(yè)機(jī)構(gòu)簽約,拓展數(shù)據(jù)來源渠道,通過與新聞、攝影、科研機(jī)構(gòu)合作,將視頻、音頻、圖像等形式的數(shù)據(jù)納入訓(xùn)練范圍,提升數(shù)據(jù)專業(yè)度,讓模型更準(zhǔn)確地回答與特定領(lǐng)域相關(guān)的問題,例如,OpenAI通過與美聯(lián)社和圖庫Shutterstock合作,利用其數(shù)據(jù)庫提升模型的訓(xùn)練質(zhì)量;二是開發(fā)“合成”訓(xùn)練數(shù)據(jù),利用算法生成的模擬數(shù)據(jù),可以有效解決由于數(shù)據(jù)安全、隱私保護(hù)、采集成本等造成的數(shù)據(jù)來源不足問題,例如在訓(xùn)練自動駕駛汽車的圖像識別系統(tǒng)時,可以使用合成數(shù)據(jù)模擬各種復(fù)雜的道路條件、天氣變化和交通狀態(tài),不僅提高了數(shù)據(jù)的多樣性,還大大降低了數(shù)據(jù)的采集成本;三是積極利用用戶與軟件的交互數(shù)據(jù),企業(yè)通過在軟件中建立反饋機(jī)制了解用戶對生成內(nèi)容的滿意度,這些反饋數(shù)據(jù)將被用于模型的再次訓(xùn)練,形成所謂的“數(shù)據(jù)飛輪”,谷歌就通過分析用戶是否復(fù)制翻譯文本判斷生成內(nèi)容的可靠性,據(jù)此改進(jìn)產(chǎn)品。
商業(yè)創(chuàng)新——從吸引公眾用戶轉(zhuǎn)向打造專業(yè)社群。
打造專業(yè)社群正成為國際人工智能企業(yè)的發(fā)展策略。相比公眾用戶,專業(yè)用戶對產(chǎn)品的需求更為穩(wěn)定、具有更高的付費(fèi)能力,傾向于與模型制造者建立長期合作,共同解決問題和改進(jìn)模型。這種策略有助于深化企業(yè)與用戶的互動,增強(qiáng)產(chǎn)品的市場黏性和用戶忠誠度。同時,專業(yè)社群的構(gòu)建也為企業(yè)提供了持續(xù)的數(shù)據(jù)流和反饋,極大促進(jìn)了產(chǎn)品的優(yōu)化與創(chuàng)新。
具體模式上:一是從研發(fā)通用模型轉(zhuǎn)變?yōu)閷S媚P?,相較于通用模型,專用模型在算力成本和資源消耗上更具優(yōu)勢,更適應(yīng)特定領(lǐng)域的需求。例如,微軟基于GitHub(軟件代碼存儲庫)開發(fā)的編程輔助工具,以及谷歌對BERT模型進(jìn)行微調(diào)所形成的文本摘要和翻譯模型T5均屬這一類型。二是從面向公眾用戶轉(zhuǎn)變?yōu)槊嫦蚱髽I(yè)用戶,隨著市場逐漸成熟,企業(yè)開始傾向于提供商用的付費(fèi)服務(wù),而不再試圖通過免費(fèi)或低價的產(chǎn)品吸引大量用戶。OpenAI就將其模型授權(quán)給包括摩根士丹利、Salesforce在內(nèi)的企業(yè),為其打造更契合業(yè)務(wù)需求的定制化工具。
多措并舉提升產(chǎn)業(yè)競爭力
我國應(yīng)在進(jìn)一步加大核心技術(shù)的研發(fā)力度、加強(qiáng)算力基礎(chǔ)設(shè)施建設(shè)、促進(jìn)算力資源有效配置和高效運(yùn)用、提升數(shù)據(jù)運(yùn)算能力和業(yè)務(wù)處理能力的基礎(chǔ)上,從數(shù)據(jù)資源、專業(yè)模型和商業(yè)模式等方面持續(xù)提升人工智能產(chǎn)業(yè)的國際競爭力。
豐富數(shù)據(jù)資源,保障供給質(zhì)量和規(guī)模。加快培育數(shù)據(jù)要素市場,鼓勵人工智能基礎(chǔ)數(shù)據(jù)服務(wù)商開發(fā)數(shù)據(jù)標(biāo)注和清洗服務(wù),提升數(shù)據(jù)的應(yīng)用價值,重視專業(yè)領(lǐng)域數(shù)據(jù)集開發(fā),鼓勵專業(yè)機(jī)構(gòu)、行業(yè)組織、科研院所提供高質(zhì)量、高信任度的專業(yè)數(shù)據(jù);積極推進(jìn)各類數(shù)據(jù)資源的開發(fā)利用,建立健全公共數(shù)據(jù)資源目錄和開放清單,根據(jù)數(shù)據(jù)敏感度構(gòu)建有條件多層次的公共數(shù)據(jù)開放格局,細(xì)化個人信息數(shù)據(jù)處理規(guī)則,探索個人信息相對匿名化路徑,為企業(yè)提供明確清晰的合規(guī)指引,提高數(shù)據(jù)處理效率;拓展數(shù)據(jù)來源新渠道,發(fā)展合成數(shù)據(jù)訓(xùn)練技術(shù),通過模擬器模擬、算法合成、數(shù)據(jù)增強(qiáng)等方式,擴(kuò)充模型訓(xùn)練數(shù)據(jù)集,支持模型訓(xùn)練的多樣化需求。
培育專業(yè)模型,提升人工智能應(yīng)用能力。開發(fā)專業(yè)模型是提升產(chǎn)品應(yīng)用效率和行業(yè)滲透力的有效途徑。相對通用模型,專業(yè)化模型的計算成本較低,可使用較少的參數(shù)和計算資源來訓(xùn)練和運(yùn)行,并且能夠根據(jù)具體應(yīng)用場景、知識體系和行業(yè)需求進(jìn)行定制,提供更多的專業(yè)化解決方案,滿足不同用戶的需求。因此,推動發(fā)展行業(yè)和垂直領(lǐng)域大模型對提高人工智能的行業(yè)應(yīng)用能力至關(guān)重要。具體而言,一方面應(yīng)加強(qiáng)專業(yè)化模型的開發(fā)、測試,提供反饋和評價,促進(jìn)專業(yè)化模型的持續(xù)優(yōu)化和迭代;另一方面,要創(chuàng)造安全高效的研發(fā)與應(yīng)用環(huán)境,推動醫(yī)療、金融等關(guān)鍵領(lǐng)域數(shù)據(jù)的開發(fā)利用,支持模型與具體場景深度融合,持續(xù)推動各領(lǐng)域的數(shù)智化轉(zhuǎn)型。
創(chuàng)新商業(yè)模式,打造可持續(xù)發(fā)展生態(tài)系統(tǒng)。商業(yè)模式創(chuàng)新將有助于促進(jìn)技術(shù)成果的轉(zhuǎn)化,提升產(chǎn)品與服務(wù)的附加值,增強(qiáng)企業(yè)競爭力。應(yīng)推動人工智能企業(yè)從提供單一產(chǎn)品或服務(wù)轉(zhuǎn)向構(gòu)建多元、開放、協(xié)同的人工智能生態(tài)系統(tǒng)。培育以開源社區(qū)為代表的人工智能產(chǎn)業(yè)生態(tài)體系,通過為開發(fā)者提供工具和資源,吸引更多專業(yè)用戶。根據(jù)市場需求,提供多樣化訂閱服務(wù),提高客戶滿意度和忠誠度。利用人工智能技術(shù)發(fā)揮數(shù)據(jù)賦能作用,提供營銷、管理、研發(fā)等決策支持,為客戶提供個性化、差異化、專業(yè)化的解決方案。同時鼓勵跨機(jī)構(gòu)跨領(lǐng)域合作,與政府、學(xué)術(shù)機(jī)構(gòu)、行業(yè)協(xié)會等建立良好的合作關(guān)系,共同推進(jìn)人工智能領(lǐng)域政策、標(biāo)準(zhǔn)、法規(guī)的制定與實(shí)施。
(作者單位:對外經(jīng)濟(jì)貿(mào)易大學(xué)國家對外開放研究院)
責(zé)任編輯:張薇