阿里云推出AI繪圖大模型“通義萬相”與AI大模型社區(qū)

來源:界面新聞
界面新聞記者 | 徐詩琪

7月7日,阿里云在2023世界人工智能大會(WAIC)上發(fā)布了其大模型相關(guān)產(chǎn)品,一是AI繪畫創(chuàng)作大模型通義萬相,二是面向創(chuàng)業(yè)者和開發(fā)者的大模型社區(qū)。

通義萬相是阿里云“通義”大模型系列第三個產(chǎn)品,此前的通義千問、通義聽悟分別具備文字問答和語音文字處理的功能。阿里云透露,已有超過30萬企業(yè)申請測試通義千問,通義聽悟累計用戶數(shù)達到36萬。

據(jù)介紹,AI繪畫創(chuàng)作大模型通義萬相有三大功能:在基礎文生圖功能中,可根據(jù)文字內(nèi)容生成水彩、扁平插畫、二次元、油畫、中國畫、3D卡通和素描等風格圖像;在相似圖片生成功能中,用戶上傳任意圖片后,即可進行創(chuàng)意發(fā)散,生成內(nèi)容、風格相似的AI畫作;該模型還支持圖像風格遷移,用戶上傳原圖和風格圖,可自動把原圖處理為指定的風格圖。


(相關(guān)資料圖)

通義萬相基于阿里研發(fā)的組合式生成模型Composer,其可通過對配色、布局、風格等圖像設計元素進行拆解和組合,該研究成果已在國際AI頂會ICML 2023上發(fā)表。

阿里云在現(xiàn)場展示了該模型生成圖片的效果,當輸入“沉浸在全頁灰度涂色的迷人世界中,有一只老虎在曼陀羅寧靜的森林中,畫面采用線條、筆畫”后,系統(tǒng)能生成線條細節(jié)豐富的老虎圖片,如果繼續(xù)使用風格遷移功能,還可切換圖片風格。

圖為界面新聞測試,通義萬相可識別中英文提示詞。

目前通義萬相僅支持定向邀測,之后將逐步向行業(yè)客戶開放。

阿里云同時介紹了其MaaS(Model as a Service,模型即服務)理念,提出以AI模型為核心的開發(fā)范式,并搭建了一套以AI模型為核心的云計算技術(shù)和服務架構(gòu),積累了豐富的大模型研發(fā)經(jīng)驗、工具和平臺,這套能力將全部向大模型初創(chuàng)企業(yè)和開發(fā)者開放,提供包括模型訓練、推理、部署、精調(diào)、測評、產(chǎn)品化落地等在內(nèi)的全方位服務。

靈積模型服務平臺是其MaaS之一,平臺建設了一系列自動化的模型上云統(tǒng)一工具鏈路,支持模型的自主接入,所有接入靈積平臺的模型都能自動獲取平臺的服務能力。對于AI開發(fā)者而言,這些不同模型的能力都能通過統(tǒng)一的SDK方便地獲取并集成到自己的AI應用中去。當前靈積平臺上托管了包括通義千問、ChatGLM-v2、百川、姜子牙、Dolly等在內(nèi)的業(yè)界領先大語言模型。

在開發(fā)者生態(tài)層,阿里發(fā)起AI模型社區(qū)魔搭,允許模型生產(chǎn)者上傳模型、測試技術(shù)能力和應用場景等。魔搭社區(qū)打通了與靈積平臺的部署鏈路。基于此,阿里云推出了智能工具魔搭GPT(ModelScopeGPT),它能接收用戶指令,通過“中樞模型”一鍵調(diào)用魔搭社區(qū)其他的AI模型,大小模型協(xié)同完成復雜任務。魔搭GPT現(xiàn)已能夠調(diào)用魔搭社區(qū)十多個核心AI模型的API。

阿里云CTO周靖人在演講中表示:“阿里云將把促進中國大模型生態(tài)的繁榮作為首要目標,向大模型創(chuàng)業(yè)公司提供全方位的服務,包括最強大的智能算力和開發(fā)工具,并在資金和商業(yè)化探索方面提供充分支持。阿里云魔搭社區(qū)現(xiàn)已聚集180萬AI開發(fā)者和由20多家頂尖人工智能機構(gòu)貢獻的900多個優(yōu)質(zhì)AI模型,我們將努力把魔搭社區(qū)培育成中國最大的‘大模型自由市場’?!?/p>

標簽:

推薦

財富更多》

動態(tài)更多》

熱點