政企領(lǐng)域,似乎正在成為AI落地的又一標(biāo)的。
幾個最新的動態(tài)是:新華三針對政企客戶發(fā)布私域大模型“百業(yè)靈犀”LinSeer、中國電科發(fā)布專為黨政企行業(yè)用戶服務(wù)的AIGC大模型“小可”、百應(yīng)科技發(fā)布政務(wù)行業(yè)專有大模型“萬機”……百度智能云、阿里云、三六零、科大訊飛、商湯等也都在針對政企客戶,發(fā)布了相關(guān)產(chǎn)品和解決方案。
這一趨勢同樣發(fā)生在海外。有消息稱微軟正在使用其 Azure 云服務(wù)把 OpenAI 的強大的語言生成模型引入政府機構(gòu),這些模型包括 OpenAI 最新、*進的大型語言模型(LLM)GPT-4以及 GPT-3。
(資料圖片)
然而,從國內(nèi)發(fā)布政企大模型的各大廠商的動作來看,并未有較多的落地案例。背后的原因有很多,一是產(chǎn)品發(fā)布時間短,無法及時得到較大反饋;二是由大模型引起的AI熱潮還處于爆發(fā)期,政企對于合作廠商的選擇還需考量。
除了這些因素之外,幾個關(guān)鍵的問題是,這些廠商針對政企客戶發(fā)布的AI產(chǎn)品,真的是政企所需要的嗎?再或者,于政企而言,其需要什么樣的AI產(chǎn)品與服務(wù)?
01 政企市場,“觀望”AI
“我們接觸的客戶都在探索這方面的內(nèi)容,政企會有這方面的訴求?!蹦硺I(yè)內(nèi)人士告訴產(chǎn)業(yè)家,“但對于AI大模型在政企領(lǐng)域的應(yīng)用,大家都處于觀望+探索的階段。”
在國內(nèi),政企普遍體量大、業(yè)務(wù)復(fù)雜、定制化要求高,有著沉重的IT建設(shè)包袱,各部門、業(yè)務(wù)之間難以協(xié)同,數(shù)據(jù)壁壘也難以打破,這使得政企的數(shù)字化轉(zhuǎn)型困難重重。
而大模型可以把人與人、人與機器之間的交互過程數(shù)據(jù)完整的沉淀下來,讓它自主學(xué)習(xí)進步,持續(xù)演進。杜絕了過去的煙囪式建設(shè),降本增效的同時還能推動政企數(shù)字化進程。
這種技術(shù)應(yīng)用的趨勢,推動著諸多廠商開始將自身的TOG產(chǎn)品與大模型結(jié)合。
不過客觀來看,當(dāng)下雖然深耕AI產(chǎn)業(yè)鏈的玩家眾多,但在政企領(lǐng)域,出于對算力、行業(yè)專業(yè)度、數(shù)據(jù)安全、國產(chǎn)化等各方因素的考量,廠商難以給出合適的AI解決方案。
AI大模型作為數(shù)字化的新基建,如何賦能行業(yè)仍需不斷探索、實踐。很多企業(yè)也在不斷進行新的嘗試。
周鴻祎曾在微博上發(fā)文表示,“大型企業(yè)或者政府要私有化大模型。即在加入公有GPT知識和能力的基礎(chǔ)上,再訓(xùn)練一個私有的GPT,只給企業(yè)自己或客戶使用?!?/p>
與周鴻祎有相同見解的,還有新華三安全產(chǎn)品研發(fā)總監(jiān)韓小平。
“政企大模型一方面數(shù)據(jù)不能出域;一方面需要結(jié)合其業(yè)務(wù)場景數(shù)據(jù)進行喂養(yǎng)訓(xùn)練,生成實際的業(yè)務(wù)場景App?!?/strong>
他認為,政企大模型技術(shù)本身其實不是*考量的因素,更重要的是對用戶業(yè)務(wù)的理解。政企AI服務(wù),行業(yè)Know-how仍是關(guān)鍵,沒有政企業(yè)務(wù)服務(wù)經(jīng)驗的廠商,難以結(jié)合大模型設(shè)計出個性化的解決方案。
兩人都將政企AI大模型的落地方式瞄準了私有化。
02 私有化,會是一個好的選擇嗎?
“全面禁止使用ChatGPT”這句話時不時就會喜提科技榜熱搜,最近一次的主角是三星。
具體源于三星允許半導(dǎo)體部門的工程師使用ChatGPT參與修復(fù)源代碼問題。但在過程當(dāng)中,員工們輸入了機密數(shù)據(jù),包括新程序的源代碼本體、與硬件相關(guān)的內(nèi)部會議記錄等數(shù)據(jù)。
起初三星全面禁止使用ChatGPT,自3月11日開始才部分開放給DS部門使用,卻沒想到在短短時間內(nèi)就傳出機密外泄。
諸如此類機密數(shù)據(jù)泄漏事件,層出不窮。
在海外市場,蘋果、三星、摩根大通、花旗銀行等知名企業(yè)都曾明確表示,禁止或限制員工在工作場合使用ChatGPT等大模型產(chǎn)品。
事實上,大模型的底層邏輯是將行業(yè)數(shù)據(jù)標(biāo)注出來進行深度學(xué)習(xí),訓(xùn)練出專注于某一行業(yè)的垂直模型。這也意味著,企業(yè)的數(shù)據(jù)要集成到通用大模型的數(shù)據(jù)池中。
然而,政企的數(shù)據(jù)大多涉及商業(yè)機密、個人隱私等問題,對數(shù)據(jù)安全要求甚高。
所以,數(shù)據(jù)不出域,成為關(guān)鍵。而私有大模型無疑是政企的必選項。
不過,私有化意味著需要政企客戶自己收集數(shù)據(jù)進行訓(xùn)練。一般情況下,AI決策的及時性和準確性,取決于數(shù)據(jù)質(zhì)量、數(shù)量以及算力。這意味著輸入預(yù)訓(xùn)練模型的數(shù)據(jù)維度、數(shù)量越多,質(zhì)量越高,才能真正發(fā)揮大模型真正價值。
一個有爭議的點是,專業(yè)廠商打造的私有模型,比起通用大模型的能力,能否滿足政企需求。
3月30日,彭博社創(chuàng)始人布隆伯格發(fā)布了一片論文,即BloombergGPT: A Large Language Modelfor Finance。
在論文中,介紹了其以模3630億token的金融領(lǐng)域數(shù)據(jù)集以及3450億token的通用數(shù)據(jù)集訓(xùn)練出來的金融大語言模型。并進行金融領(lǐng)域評估與通用領(lǐng)域評估。
結(jié)果顯示,在金融領(lǐng)域任務(wù)上,該模型綜合表現(xiàn)*;在通用任務(wù)上,該模型的綜合得分同樣優(yōu)于相同參數(shù)量級的其他模型,并且在某些任務(wù)上的得分要高于參數(shù)量更大的模型。
這意味著,基于專業(yè)領(lǐng)域語料訓(xùn)練的大模型,在領(lǐng)域內(nèi)的理解要超過通用大模型。
一個啟示是,在其他特定領(lǐng)域,也可以開發(fā)專用的大語言模型,并且效果可能比通用大模型更好。
然而,這個評估實驗的結(jié)論仍無法代表所有行業(yè),有些問題仍需要被正視,例如中外金融數(shù)據(jù)維度、質(zhì)量其實有著較大的差距,該金融模型作為*個行業(yè)模型,更換不同維度、質(zhì)量的數(shù)據(jù),能否保持其結(jié)論的準確性,還未得知。
另外,除政務(wù)系統(tǒng)、城市大腦以及金融等數(shù)據(jù)敏感的政企場景,其他終端場景,通用大模型的語料數(shù)據(jù)仍有很大優(yōu)勢。
所以,對于政企而言,其需要的AI服務(wù)是能在保證數(shù)據(jù)安全的同時,還可以能集成通用大模型作為能力補充。
03 政企大模型,亦需“群戰(zhàn)”
術(shù)業(yè)有專攻,大模型能力同樣如此。
在政務(wù)AI大模型應(yīng)用方面,周鴻祎曾直言,預(yù)測未來中國不會只有一個大模型,每個城市、每個政府部門都會有自己的專有大模型。
信創(chuàng)化的浪潮下,全技術(shù)棧的國產(chǎn)化已經(jīng)成為服務(wù)政企客戶的準入門檻。所以對于政企而言,信創(chuàng)生態(tài)能力成為其選擇廠商的重要標(biāo)準。
目前來看,能實現(xiàn)全技術(shù)棧國產(chǎn)化的AI大模型廠商屈指可數(shù)。能否吸引更多信創(chuàng)伙伴成為關(guān)鍵,取長補短,或?qū)崿F(xiàn)雙贏。
此外,在國產(chǎn)化的基礎(chǔ)上,不同的場景應(yīng)用,也需要與不同的廠商合作,例如互聯(lián)網(wǎng)云廠商在終端軟件應(yīng)用的優(yōu)勢;運營商的網(wǎng)絡(luò)優(yōu)勢;華為在芯片、系統(tǒng)上的優(yōu)勢。
除了基于客戶需求的合作,還有來自算力等資源稀缺所帶來的壓力。
AI新一輪熱潮襲來,服務(wù)器需要配備大量GPU/NPU/FPGA/ASIC等芯片以支持高算力,但就目前來看,算力不僅價格高昂且資源緊張。
目前,支撐包括ChatGPT大模型在內(nèi)的95%用于機器學(xué)習(xí)的芯片都是英偉達的A100(或者國內(nèi)使用的替代產(chǎn)品A800),該芯片的單價超過1萬美元。此外,英偉達最新一代的H100芯片的性能也遠超A100,但價格也更高,約合25萬元人民幣。
而在取長補短的AI大模型產(chǎn)業(yè)生態(tài)下,將大幅度杜絕模型的重復(fù)搭建、實現(xiàn)數(shù)據(jù)的重復(fù)利用,大大節(jié)約算力資源利用率。同時還可以減少政企客戶的AI部署成本。
所以,對于布局政企大模型的廠商而言,在私有化的前提下,通過開源、API接口等形式,以通用大模型和客戶或自身集成的數(shù)據(jù),幫助客戶調(diào)教模型,形成定制化的AI產(chǎn)品,或?qū)⑼苿诱蟠竽P涂焖俾涞亍?/strong>
一些廠商也正在驗證了這種路徑的可行性。
例如中國電科面向黨政企,提供“通用智能模型大循環(huán) + 行業(yè)智能模型小循環(huán)”雙循環(huán)、“模型訓(xùn)練 + 測試評估 + 場景精調(diào) + 可信增強”四階段的行業(yè)應(yīng)用新范式。
再比如,新華三面向政企發(fā)布的百業(yè)靈犀LinSeer既支持“私域大模型+新華三ICT基礎(chǔ)架構(gòu)”的模式保障數(shù)據(jù)安全,也支持“客戶自選大模型+新華三ICT基礎(chǔ)架構(gòu)”的模式滿足多種需求。
政企AI服務(wù)的走向逐漸清晰,即政企或許更需要“自助餐”式的服務(wù)模式。客戶可以選擇適合自身需求的芯片、模型技術(shù)方、數(shù)據(jù)集成方、軟件廠商等。
經(jīng)歷過多次寒冬的AI,能否抓住這次時代的機遇,仍需時間來驗證。
標(biāo)簽: