探展WAIC |專(zhuān)訪柏睿數(shù)據(jù)董事長(zhǎng)劉睿民:Data+AI智能算力底座將助力解決“千模時(shí)代”算力需求

來(lái)源:藍(lán)鯨財(cái)經(jīng)

7月7日,柏睿數(shù)據(jù)董事長(zhǎng)兼首席科學(xué)家劉睿民在世界人工智能大會(huì)中的區(qū)塊鏈+WEB3新發(fā)展論壇發(fā)表題為“分布式數(shù)據(jù)庫(kù)智能算力底座賦能金融WEB3.0”的演講,分享智能算力底座如何促進(jìn)金融賦能實(shí)體經(jīng)濟(jì)。


【資料圖】

柏睿數(shù)據(jù)為國(guó)內(nèi)目前僅看到的推出全內(nèi)存分布式計(jì)算引擎的智能數(shù)據(jù)算力公司,目前已處于上市輔導(dǎo)階段。劉睿民是國(guó)內(nèi)資深的數(shù)據(jù)庫(kù)研發(fā)領(lǐng)軍專(zhuān)家,自2014年開(kāi)始成立團(tuán)隊(duì)致力于研發(fā)國(guó)內(nèi)首個(gè)大規(guī)模并行MPP內(nèi)存數(shù)據(jù)倉(cāng)庫(kù)引擎。后成功其中,以MLOPS為方法論的數(shù)據(jù)智能開(kāi)發(fā)平臺(tái),包括LLMOps平臺(tái)(大模型開(kāi)發(fā)運(yùn)維平臺(tái))、Rapids VectorDB(向量數(shù)據(jù)庫(kù))等產(chǎn)品,覆蓋從數(shù)據(jù)采集、存儲(chǔ)、計(jì)算分析到模型訓(xùn)練、部署、應(yīng)用的全生命周期解決方案。近期,柏睿數(shù)據(jù)全球創(chuàng)新賦能中心在上海浦東新區(qū)授牌,也與多家海內(nèi)外創(chuàng)新主體聯(lián)合組建國(guó)際AI創(chuàng)新聯(lián)合體。

劉睿民在接受藍(lán)鯨財(cái)經(jīng)專(zhuān)訪時(shí)舉例,算力基座就相當(dāng)于引擎,數(shù)據(jù)就像油,AI、web3等訓(xùn)練、推理、使用數(shù)據(jù)庫(kù)的框架都需要靠底層算力。柏睿數(shù)據(jù)自主研發(fā)打造的Data+AI智能算力底座,融合大數(shù)據(jù)、人工智能、數(shù)據(jù)計(jì)算加速加密等技術(shù),能夠滿足產(chǎn)業(yè)智能下大規(guī)模的數(shù)據(jù)實(shí)時(shí)計(jì)算需求,并向云端演進(jìn),讓算力不再成為Web3.0發(fā)展的瓶頸。

藍(lán)鯨財(cái)經(jīng):作為已經(jīng)深耕分布式數(shù)據(jù)庫(kù)十年的企業(yè),是否會(huì)覺(jué)得大眾對(duì)AI、Web3的關(guān)注將帶領(lǐng)行業(yè)迎來(lái)全盛年代?

劉睿民:現(xiàn)在所說(shuō)的千模萬(wàn)模,基本上都是在應(yīng)用領(lǐng)域,因?yàn)槲覀兪亲龌A(chǔ)領(lǐng)域,所以說(shuō)最后無(wú)論呈現(xiàn)模式是什么,都要用同樣的東西,就是算力。

現(xiàn)在市場(chǎng)需求量的急速擴(kuò)張,很多人的困擾是模型已經(jīng)搭建好了,但無(wú)法進(jìn)行訓(xùn)練。我們其實(shí)是從國(guó)產(chǎn)的角度來(lái)做數(shù)據(jù)庫(kù),我們主要研發(fā)大內(nèi)存的全內(nèi)存分布式計(jì)算引擎。當(dāng)前算力的不足是一個(gè)關(guān)鍵問(wèn)題,其中一項(xiàng)卡脖子的因素是英偉達(dá)的A100H100卡,由于禁運(yùn)很多單位無(wú)法獲得這個(gè)昂貴的卡。而我們的全內(nèi)存分布式計(jì)算引擎通過(guò)軟硬件協(xié)同打通,可以達(dá)到196GB的內(nèi)存容量,相比之下,幾年前我們能夠?qū)崿F(xiàn)單板達(dá)到1TB內(nèi)存的規(guī)模。從行業(yè)角度來(lái)看,我們是國(guó)內(nèi)目前僅看到的專(zhuān)注于全內(nèi)存分布式計(jì)算引擎的公司,國(guó)外也只有五六家。國(guó)內(nèi)的用戶往往在買(mǎi)GPU時(shí)會(huì)有各種限制,這也面臨一些問(wèn)題。像英偉達(dá)等公司,首先推出的是一款爆款產(chǎn)品。這種產(chǎn)品可能價(jià)格較高,但隨后會(huì)推出其他評(píng)級(jí)較低但價(jià)格更為實(shí)惠的產(chǎn)品版本。這些版本在性能方面可能達(dá)到原產(chǎn)品的六七成,但價(jià)格僅為原產(chǎn)品的十分之一。

因此,我們提供相對(duì)廉價(jià)的算力解決方案,直接利用內(nèi)存進(jìn)行訓(xùn)練,創(chuàng)新解決算力問(wèn)題。

藍(lán)鯨財(cái)經(jīng):柏睿數(shù)據(jù)推出的大模型開(kāi)發(fā)運(yùn)維平臺(tái)LLMOps平臺(tái)和其他產(chǎn)品如何助力Web3.0場(chǎng)景的落地?

劉睿民:LLMOps平臺(tái)賦能了應(yīng)用端的開(kāi)發(fā)階段,使用者無(wú)需從頭開(kāi)始開(kāi)發(fā),而是可以借助平臺(tái)提供的基礎(chǔ)底層,通過(guò)簡(jiǎn)單的拖拉拽操作來(lái)建立大模型。這意味著用戶只需要很少的代碼就能完成模型的建立。目前,LLMOps平臺(tái)在海外的客戶中使用較多,因?yàn)楹M饪蛻粝鄬?duì)成熟一些。而國(guó)內(nèi)客戶由于接觸國(guó)外平臺(tái)的機(jī)會(huì)較少,所以對(duì)LLMOps的了解還不夠。在人工智能領(lǐng)域,我們主要吸引了海外客戶的關(guān)注,比如新加坡的客戶。國(guó)內(nèi)的用戶也對(duì)我們的產(chǎn)品感興趣,但由于國(guó)外資源相對(duì)不易獲取,所以在某種程度上有些滯后。

這方面目前主要客戶是國(guó)外的人工智能公司,國(guó)外人工貴,他們需要將人工智能應(yīng)用落地到工業(yè)領(lǐng)域中,比如機(jī)器人優(yōu)化、港口調(diào)度等場(chǎng)景中的優(yōu)化問(wèn)題。過(guò)去,他們通常通過(guò)編寫(xiě)代碼來(lái)實(shí)現(xiàn)這些優(yōu)化場(chǎng)景,但現(xiàn)在情況不同了。他們可以在LLMOps平臺(tái)上進(jìn)行拖拉拽式建模和試算,然后部署到計(jì)算機(jī)集群上進(jìn)行計(jì)算。他們可以選擇連接到不同的平臺(tái),如谷歌、AWS或微軟的集群。對(duì)于這些客戶來(lái)說(shuō),LLMOps的優(yōu)勢(shì)在于低門(mén)檻的使用和加速功能的提供。

藍(lán)鯨財(cái)經(jīng):是否意味著未來(lái)高自動(dòng)化、低代碼化的公司會(huì)越來(lái)越多,這將成為必然發(fā)展趨勢(shì)?

劉睿民:這是必然的。隨著人工智能的發(fā)展,越來(lái)越多的任務(wù)和工作將被自動(dòng)化取代,包括編寫(xiě)簡(jiǎn)單的代碼。這并不意味著復(fù)雜的編程工作將完全消失,但對(duì)于一般的程序員來(lái)說(shuō),未來(lái)可能會(huì)面臨挑戰(zhàn)。因此,自動(dòng)化和低代碼的趨勢(shì)將成為主流,這是一種正常的發(fā)展過(guò)程。在未來(lái)的三到五年內(nèi),簡(jiǎn)單的編程工作可能會(huì)變得相對(duì)無(wú)關(guān)緊要。

藍(lán)鯨財(cái)經(jīng):如何理解在WEB3.0特定應(yīng)用場(chǎng)景中,"FPGA計(jì)算引擎+配套軟件"如何提供比SmartNIC、GPU和AI大模型加速芯片等通用芯片更強(qiáng)大的專(zhuān)業(yè)計(jì)算能力?

劉睿民:舉例來(lái)說(shuō),GPU的功能原本是用于打游戲的,它的功能并非專(zhuān)為人工智能而設(shè)計(jì),有段時(shí)間甚至被用來(lái)挖礦。這只是因?yàn)榇蠹覜](méi)有一個(gè)芯片來(lái)運(yùn)行更復(fù)雜的計(jì)算。無(wú)論后面的應(yīng)用場(chǎng)景是什么,通用的東西其實(shí)是雙精度運(yùn)算,就是浮點(diǎn)運(yùn)算。

我們現(xiàn)在把浮點(diǎn)運(yùn)算的算法都放到了FPDA卡上,配上大內(nèi)存,然后內(nèi)存板和內(nèi)存板之間的通訊,通過(guò)我們?nèi)珒?nèi)存的分布式計(jì)算引擎連接在一起,這樣的話用戶就能夠調(diào)動(dòng)比如說(shuō)1TB甚至幾個(gè)TB的內(nèi)存。

在某種程度上,以后有一種專(zhuān)門(mén)運(yùn)用于AI計(jì)算的芯片將成為必然。以前科學(xué)計(jì)算,尤其是超級(jí)計(jì)算中,開(kāi)始使用了GPU,并建立了一個(gè)完整的生態(tài)系統(tǒng)。后來(lái),GPU被應(yīng)用于人工智能的訓(xùn)練中,導(dǎo)致我們陷入了這樣一個(gè)循環(huán)。

所以,這是一個(gè)逐漸發(fā)展的過(guò)程,不是說(shuō)有很多選擇可以做。事實(shí)上,在進(jìn)行雙精度計(jì)算時(shí),以前并沒(méi)有其他選擇,也沒(méi)有其他人在這個(gè)領(lǐng)域有大量研究?,F(xiàn)在雖然有了這樣的選擇,但限制還是很多。

藍(lán)鯨財(cái)經(jīng):柏睿數(shù)據(jù)對(duì)于數(shù)據(jù)隱私和安全方面有哪些保障措施和技術(shù)手段?

劉睿民:我們使用的是國(guó)密,技術(shù)路線類(lèi)似于隱私計(jì)算,公司只有一個(gè)鎖芯,鑰匙是掌握在用戶手里的。“鎖芯”的安全性、穩(wěn)定性越高,“鎖”就越安全,數(shù)據(jù)就越安全。RapidsDB 總體代碼自研率高達(dá)99.32%,通過(guò)中國(guó)信通院、金融信創(chuàng)生態(tài)實(shí)驗(yàn)室、國(guó)家密碼管理局商用密碼產(chǎn)品等多項(xiàng)國(guó)家級(jí)測(cè)試認(rèn)證,并在運(yùn)營(yíng)商、金融、電力、政務(wù)、醫(yī)療等多個(gè)行業(yè)成功落地應(yīng)用,安全性遙遙領(lǐng)先。

標(biāo)簽:

推薦

財(cái)富更多》

動(dòng)態(tài)更多》

熱點(diǎn)