據(jù)文心一言發(fā)布已過(guò)去50余天
,5月9日,百度工程師首次現(xiàn)場(chǎng)演示了“文心千帆”如何可視化微調(diào)大模型。百度智能云方面表示,正在內(nèi)測(cè)的“文心千帆大模型平臺(tái)”
,是全球首個(gè)一站式的企業(yè)級(jí)大模型生產(chǎn)平臺(tái),不但提供包括文心一言在內(nèi)的大模型服務(wù)及第三方大模型服務(wù),還提供大模型開(kāi)發(fā)和應(yīng)用的整套工具鏈。3月16日,文心一言在萬(wàn)眾矚目中面世
,而由于其演示的Demo為錄屏,不少網(wǎng)友大呼“失望”,就連李彥宏也多次提及,這類(lèi)大語(yǔ)言模型還遠(yuǎn)未到發(fā)展完善的階段,進(jìn)步空間很大。(相關(guān)資料圖)
近兩個(gè)月的時(shí)間過(guò)去了
,經(jīng)過(guò)多次迭代升級(jí)和首批企業(yè)內(nèi)測(cè)后,百度的底氣似乎足了一些。300余家生態(tài)伙伴參與內(nèi)測(cè)
,大模型推理成本降為十分之一3月16日開(kāi)始
,百度智能云大模型平臺(tái)便啟動(dòng)了首批企業(yè)內(nèi)測(cè),面向企業(yè)客戶(hù)開(kāi)放了文心一言API接口調(diào)用服務(wù)。并于3月27日
,推出面向客戶(hù)的“文心千帆”大模型平臺(tái)。
據(jù)了解
,文心千帆大模型平臺(tái)具有生成合同
、邀請(qǐng)函、數(shù)字人文案
、直播文案
、訂機(jī)票、改行程等多種能力
。例如在用戶(hù)輸入五一想從北京出發(fā)去云南玩五天等關(guān)鍵信息后
,文心千帆除了提供行程攻略信息外,還會(huì)自動(dòng)關(guān)聯(lián)相關(guān)的門(mén)票和機(jī)票信息,對(duì)行程細(xì)節(jié)不滿(mǎn)意時(shí),也可以提出更改。
在收費(fèi)模式上
,文心千帆的推理服務(wù)調(diào)用以0.012元/1000 tokens收費(fèi),按調(diào)用輸入輸出總字?jǐn)?shù)付費(fèi)。百度集團(tuán)副總裁袁佛玉透露:“截止目前,已有超過(guò)300家生態(tài)伙伴參與文心一言?xún)?nèi)測(cè),在400多個(gè)企業(yè)內(nèi)部場(chǎng)景取得測(cè)試成效。”目前
,文心千帆大模型平臺(tái)提供公有云服務(wù)、私有化部署兩大交付模式。在公有云服務(wù)方面
,將提供推理(直接調(diào)用大模型的推理能力)、微調(diào)(通過(guò)高質(zhì)量精標(biāo)業(yè)務(wù)數(shù)據(jù),高效訓(xùn)練出特定行業(yè)的大模型)、托管(將模型發(fā)布在百度智能云,以實(shí)現(xiàn)更加穩(wěn)定高效的運(yùn)行)三種服務(wù),大幅降低企業(yè)部署大模型的門(mén)檻。在私有化部署方面
,文心千帆大模型平臺(tái)支持軟件授權(quán)(提供在企業(yè)環(huán)境中運(yùn)行的大模型服務(wù))、軟硬一體(提供整套大模型服務(wù)及對(duì)應(yīng)的硬件基礎(chǔ)設(shè)施),租賃服務(wù)(提供機(jī)器和平臺(tái)的租賃滿(mǎn)足客戶(hù)低頻需求)三種方式。私有化部屬能夠滿(mǎn)足對(duì)數(shù)據(jù)監(jiān)管有嚴(yán)格要求的企業(yè)客戶(hù)需求。4月25日
,在文心一言開(kāi)啟內(nèi)測(cè)一個(gè)月之際
,百度智能云曾表示,其已完成4次技術(shù)版本升級(jí)
,相較最初版本推理效率提升了10倍
,模型算力利用率提升了1倍,大模型推理成本隨之降為原來(lái)的十分之一
。
互聯(lián)網(wǎng)產(chǎn)業(yè)時(shí)評(píng)人張書(shū)樂(lè)向記者指出
,文心一言依托百度的龐大搜索數(shù)據(jù)和算法優(yōu)勢(shì),其學(xué)習(xí)資料極為豐富
,關(guān)鍵在于其學(xué)習(xí)方法(算法)上的迭代完善
,能否支撐其從一個(gè)尋章摘句的“書(shū)蟲(chóng)”變?yōu)橛歇?dú)立思考能力的“優(yōu)等生”。目前
,文心一言的完善程度應(yīng)該在國(guó)產(chǎn)大模型中是比較高的
,而且依托“中文”這個(gè)護(hù)城河,較之國(guó)外大模型有更多地緣優(yōu)勢(shì)
。
被質(zhì)疑
、被回懟,文心一言需要“螃蟹”的覺(jué)悟
雖然過(guò)去近兩個(gè)月時(shí)間
,但關(guān)于文心一言的討論一直不斷
。
3月底,文心一言推出不到兩周
,便迎來(lái)了質(zhì)疑聲
。有微博博主發(fā)文質(zhì)疑其文生圖功能抄襲“StableDiffusion”
,同時(shí)在中文語(yǔ)義理解方面存在局限。彼時(shí)
,百度方面回應(yīng)稱(chēng)
,文心一言完全是百度自研的大語(yǔ)言模型,文生圖能力來(lái)自文心跨模態(tài)大模型ERNIE-ViLG
。
隨后
,在接受36氪采訪(fǎng)中,李彥宏表示,“早在文心一言發(fā)布之前,大家用文心一格(指代百度基于文心大模型的文生圖系統(tǒng))就能體驗(yàn)文生圖這個(gè)能力?div id="jpandex" class="focus-wrap mb20 cf">!?/p>
此外,李彥宏指出
,“百度的文心一言和OpenAI差距可能在兩個(gè)月左右”
。這番言論卻讓王小川不以為然。
他直言
,這肯定是平行宇宙里的李彥宏說(shuō)的
,不是我們這個(gè)世界里的。并指出
,文心一言不可能和OpenAI差距只有兩個(gè)月
,如果真是如此,那肯定是另一個(gè)宇宙
。他認(rèn)為國(guó)內(nèi)目前的大模型和GPT的差距不可能是2個(gè)月是三年
。但這是很動(dòng)態(tài)的,大家很努力就有可能快一些
。
5月4日
,李彥宏在內(nèi)部活動(dòng)中回應(yīng)了此番爭(zhēng)議,他表示
,“說(shuō)實(shí)話(huà)這有點(diǎn)斷章取義
,我后面緊接著還說(shuō),這不是重點(diǎn)
,重點(diǎn)是這兩個(gè)月的差距我們要用多長(zhǎng)時(shí)間才能趕上
,也許很快,也許永遠(yuǎn)也趕不上
?div id="jpandex" class="focus-wrap mb20 cf">!?/p>
同時(shí),他認(rèn)為
,算力不能保證我們能夠在通用人工智能技術(shù)上領(lǐng)先
,算力是可以買(mǎi)來(lái)的
,創(chuàng)新的能力是買(mǎi)不來(lái)的,是需要自建的
。據(jù)悉
,目前全球算力規(guī)模美國(guó)占34%,中國(guó)占33%
,算力差不多
。
在今天的演示會(huì)上,百度智能云云計(jì)算產(chǎn)品解決方案和運(yùn)營(yíng)部總經(jīng)理宋飛表示
,“大家可能會(huì)覺(jué)得堆積算力
、寫(xiě)好代碼、然后進(jìn)行模型訓(xùn)練
,把它跑起來(lái)就行了
。實(shí)際上在訓(xùn)練過(guò)程中會(huì)遇到各種各樣的挑戰(zhàn),很少有人能夠使得一個(gè)大模型訓(xùn)練過(guò)程能夠在連續(xù)一兩天內(nèi)不出問(wèn)題
。百度AI大底座可以為大模型提供高效
、穩(wěn)定的訓(xùn)練和有效的收斂。千卡加速比達(dá)到90%
,資源利用率70%
,開(kāi)發(fā)效率提升100%。這是AI大底座為大模型的開(kāi)發(fā)和應(yīng)用帶來(lái)的價(jià)值
?div id="m50uktp" class="box-center"> !?/p>
從目前的實(shí)踐來(lái)看,以文心一言為代表的大模型主要應(yīng)用于B端
,在張書(shū)樂(lè)看來(lái)
,這主要是因?yàn)镃端延伸存在難度。
他指出
,一是個(gè)體用戶(hù)需求太過(guò)龐雜
、無(wú)序,難以有效滿(mǎn)足不同層次用戶(hù)使用需求
;二是個(gè)體用戶(hù)主流需求過(guò)于淺顯
。大多數(shù)C端體驗(yàn)僅僅是嘗鮮,缺乏深度應(yīng)用能力
。就如辦公軟件在C端大多停留在文字處理一般
,而少有人涉及深層使用,這讓GPT的應(yīng)用場(chǎng)景既雜且淺
,缺乏戰(zhàn)略縱深
;三是可實(shí)現(xiàn)的多模態(tài)對(duì)于C端大多數(shù)用戶(hù)而言較為雞肋,加上目前的生成能力依然是“小升初”階段,無(wú)法真正意義上滿(mǎn)足C端用戶(hù)所謂“一鍵式傻瓜操作”
。
至于能否追上ChatGPT
,百度需要培養(yǎng)AI原生應(yīng)用的思維方式和理念,也需要有做“敢于吃螃蟹的人”的覺(jué)悟
,爭(zhēng)議和期待會(huì)在一段時(shí)間內(nèi)共存