世界消息!逐浪AIGC丨AI大模型時代,火山引擎要做聚合平臺

來源:21經(jīng)濟網(wǎng)

21世紀經(jīng)濟報道記者白楊 北京報道

大模型浪潮撲面而來,幾乎所有企業(yè)都在思考如何迎接。經(jīng)過半年的觀察和實踐,字節(jié)跳動旗下的ToB品牌火山引擎也找準了自己的定位。

6月28日,火山引擎正式發(fā)布大模型服務(wù)平臺“火山方舟”,旨在為企業(yè)客戶提供模型精調(diào)、評測、推理等MaaS(Model-as-a-Service)服務(wù)。


【資料圖】

火山引擎總裁譚待表示,對于中國的大模型發(fā)展,火山引擎已經(jīng)有了幾個關(guān)鍵判斷:首先,未來的大模型市場將是一個百花齊放的多模型生態(tài),在這個生態(tài)系統(tǒng)中,將同時并行存在幾個少數(shù)的超大規(guī)模的大模型、多個中等規(guī)模的大模型和更多個行業(yè)的垂直模型,“這是由安全信任、行業(yè)壁壘和成本因素共同決定的。”

其次,在未來,企業(yè)尤其是行業(yè)頭部企業(yè),自身對于大模型的應用,將會是“1+N”的應用模式,即企業(yè)通過自研或者與三方模型服務(wù)商的深度合作,形成企業(yè)自身的1個主力模型,這個主力模型之外,在不同的場景中,企業(yè)還會同時應用N個外部模型。

聚合多方大模型

在此之前,已有多家云廠商相繼推出了MaaS服務(wù),他們的思路大都一致,都是基于一個通用基礎(chǔ)大模型,為不同行業(yè)提供具有行業(yè)屬性的行業(yè)大模型。

而火山引擎另辟蹊徑,采用了一種聚合模式。據(jù)介紹,火山方舟已集成百川智能、出門問問、復旦大學MOSS、IDEA研究院、瀾舟科技、MiniMax、智譜AI等多家AI科技公司及科研院所的大模型?;谶@種多模型架構(gòu),企業(yè)客戶在火山方舟上便可同步試用多個大模型,并選用更適合自身業(yè)務(wù)需要的模型組合。

譚待在接受21世紀經(jīng)濟報道采訪時指出,火山引擎和其他廠商的理念可能不大一樣,“友商推出模型平臺,從模型到模型平臺以及各種體系都是自己做的,是很封閉的端到端,他們可能認為未來一個模型就夠了,但我們不是這樣想的。我們認為未來肯定不是一個模型,而是多模型,所以我們的平臺一定要支持多個模型?!?/p>

除了理念上的不同之外,譚待還提到,火山引擎能做多模型架構(gòu),有一個很重要的原因,是這些業(yè)界做比較好的大模型,本身大部分的訓練都是在火山引擎上。“所以我們已經(jīng)跟這些大模型建立了很強的合作關(guān)系和信任感,他們也自然而然會把推理也放到火山引擎上?!?/p>

對于哪些大模型可以進入火山方舟,譚待稱,“我們希望火山方舟是一個精選的結(jié)果,所以希望那些確實是訓練完成,并且在合規(guī)等方面都做比較好的,已經(jīng)達到可用形態(tài)的大模型才放到方舟平臺上。第一批公布的是7家,后面還會陸續(xù)接入更多大模型?!?/p>

當然,做聚合平臺,也意味著火山引擎要面臨更多風險和挑戰(zhàn)。譚待表示,企業(yè)使用大模型,最擔心的是數(shù)據(jù)泄露;如果將大模型私有化部署,企業(yè)將承擔更高的成本,模型生產(chǎn)方也會擔心知識資產(chǎn)安全。

據(jù)火山引擎智能算法負責人吳迪介紹,“火山方舟”已上線了基于安全沙箱的大模型安全互信計算方案,利用計算隔離、存儲隔離、網(wǎng)絡(luò)隔離、流量審計等方式,實現(xiàn)了模型的機密性、完整性和可用性保證,可適用于對訓練和推理延時要求較低的客戶。

此外,吳迪透露,“火山方舟”還在探索基于NVIDIA新一代硬件支持的可信計算環(huán)境、基于聯(lián)邦學習的數(shù)據(jù)資產(chǎn)分離等多種方式的安全互信計算方案,更全面地滿足大模型在不同業(yè)務(wù)場景的數(shù)據(jù)安全要求。

聚焦平臺而非模型

對于火山方舟平臺,外界還關(guān)心的一個問題是:如果字節(jié)跳動有了自己的大模型,火山方舟會如何平衡自研和第三方模型的關(guān)系?

對此,譚待向21世紀經(jīng)濟報道記者表示,火山方舟會是個開放的平臺,字節(jié)內(nèi)部其他團隊如果做好了模型,也會放到方舟平臺上對外提供,它在方舟上就是眾多模型中的一個?!白詈筮x擇字節(jié)的模型還是其他模型,這是由客戶來做選擇的,而不需要火山引擎來做平衡?!?/p>

所以,在服務(wù)模型應用方的過程中,火山引擎提供的不是模型能力,而是幫助應用方更好使用模型的能力。按照譚待的說法,火山方舟為企業(yè)提供的是大模型使用的一站式工作臺,不僅包含了模型試用、評測、接入、精調(diào)等能力,也通過訓推一體、彈性調(diào)度、算子優(yōu)化等能力,幫助應用企業(yè)全面進行成本優(yōu)化。

據(jù)吳迪介紹,企業(yè)可以用統(tǒng)一的工作流對接多家大模型,對于復雜需求可設(shè)置高級參數(shù)、驗證集、測試集等功能,再通過自動化和人工評估直觀對比模型精調(diào)效果,在不同業(yè)務(wù)場景里還可靈活切換不同的模型,實現(xiàn)最具性價比的模型組合。

在其看來,訓練大模型很昂貴,但是從長期來看,模型的推理開銷會超過訓練開銷。效果和成本的矛盾永遠存在,降低推理成本會是大模型應用落地的重要因素,“一個經(jīng)過良好精調(diào)的中小規(guī)格模型,在特定工作上的表現(xiàn)可能不亞于通用的、巨大的基座模型,而推理成本可以降低到原來的十分之一。”

因此,企業(yè)在火山方舟進行的自定義指標和評估數(shù)據(jù)的積累,也將成為企業(yè)在大模型時代寶貴的數(shù)據(jù)資產(chǎn)。另據(jù)吳迪透露,字節(jié)跳動內(nèi)部已有十多個業(yè)務(wù)團隊在試用“火山方舟”,覆蓋文本和圖像生成、對話、代碼輔助、信息檢索、營銷創(chuàng)意、電商、辦公效率等領(lǐng)域。

吳迪表示,火山方舟希望在模型供應商和模型使用方之間,促成“研究-訓練-應用-變現(xiàn)-反哺研究”的正向循環(huán)?!皩δP吞峁┓絹碚f,火山方舟能夠幫助大家以更低的成本觸達海量客戶,用更小的代價在ToB市場規(guī)?;?;對模型使用者來說,則可以便捷地接觸到眾多高質(zhì)量的基座模型,為不同場景選擇最合適的模型?!?/p>

但譚待也坦言,“每一次技術(shù)的大變革,都會帶來體驗創(chuàng)新的新機會,而火山方舟還在起步階段,工具鏈和下游應用插件需要持續(xù)完善?!苯酉聛?,火山方舟還將接入更多大模型,并逐步擴大邀測范圍,加速大模型在各行各業(yè)的應用落地。

標簽:

推薦

財富更多》

動態(tài)更多》

熱點