大模型激戰(zhàn)之際,繼海外的Meta之后
,阿里巴巴成為又一家推動(dòng)人工智能(AI)大模型“安卓時(shí)刻”潮流的科技巨頭
。
【資料圖】
8月3日周四,阿里云將70億參數(shù)的通義千問(wèn)模型開(kāi)源
,包括通用模型Qwen-7B和對(duì)話模型Qwen-7B-Chat
。這兩款模型均已上線國(guó)內(nèi)首個(gè)“模型即服務(wù)”開(kāi)放平臺(tái)魔搭社區(qū),開(kāi)源
、免費(fèi)
、可商用
。
開(kāi)源代碼支持對(duì)Qwen-7B和Qwen-7B-Chat的量化
,支持用戶在消費(fèi)級(jí)顯卡上部署和運(yùn)行模型。用戶既可從魔搭社區(qū)直接下載模型,也可通過(guò)阿里云靈積平臺(tái)訪問(wèn)和調(diào)用Qwen-7B和Qwen-7B-Chat,阿里云為用戶提供包括模型訓(xùn)練、推理、部署、精調(diào)等在內(nèi)的服務(wù)。
魔塔社區(qū)已有發(fā)帖
,專門介紹通義千問(wèn)上述模型的安裝、創(chuàng)空間體驗(yàn)、模型推理、模型訓(xùn)練最佳實(shí)踐,并附有模型鏈接及下載情況截圖。公開(kāi)資料顯示
,Qwen-7B使用去重及過(guò)濾后超過(guò)2.2萬(wàn)億tokens的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,是支持中、英等多種語(yǔ)言的基座模型,上下文窗口長(zhǎng)度達(dá)到8k。它包含高質(zhì)量中、英、多語(yǔ)言、代碼、數(shù)學(xué)等數(shù)據(jù),囊括全網(wǎng)文本 、百科
、書籍、代碼
、數(shù)學(xué)及各個(gè)領(lǐng)域垂類
。
評(píng)測(cè)英文綜合能力的基準(zhǔn)評(píng)測(cè)之一MMLU的評(píng)測(cè)結(jié)果顯示,在英文評(píng)測(cè)方面
,Qwen-7B的效果超過(guò)了目前國(guó)內(nèi)外其他同類開(kāi)源預(yù)訓(xùn)練模型
,對(duì)比更大規(guī)模版本的模型也具有較強(qiáng)競(jìng)爭(zhēng)力。中文評(píng)測(cè)方面
,在C-Eval驗(yàn)證集上
,Qwen-7B在同等規(guī)模現(xiàn)有模型中取得了最高分?jǐn)?shù)
,甚至相比更大規(guī)模模型也具有較強(qiáng)競(jìng)爭(zhēng)力。
以下為Qwen-7B的MMLU 5-shot準(zhǔn)確率結(jié)果對(duì)比。
在Qwen-7B的基礎(chǔ)上
,阿里云使用對(duì)齊機(jī)制打造了基于基座模型的AI助手Qwen-7B-Chat。它是基于Transformer的中英文對(duì)話大語(yǔ)言模型,已實(shí)現(xiàn)與人類認(rèn)知對(duì)齊。預(yù)訓(xùn)練數(shù)據(jù)類型多樣,覆蓋廣泛,包括大量網(wǎng)絡(luò)文本、專業(yè)書籍、代碼等。無(wú)論是在C-Eval驗(yàn)證集上
,還是在MMLU評(píng)測(cè)集上,Qwen-7B-Chat模型的zero-shot準(zhǔn)確率均在同類對(duì)齊模型中表現(xiàn)較優(yōu)。以下為C-Eval測(cè)試集上的zero-shot準(zhǔn)確率結(jié)果對(duì)比
。通義千問(wèn)的開(kāi)源后
,阿里云成為國(guó)內(nèi)首個(gè)加入大模型開(kāi)源行列的大型科技企業(yè)。今年7月,微軟宣布,聯(lián)手Meta發(fā)布開(kāi)源AI模型的可商用版本Llama 2,提供OpenAI和谷歌模型的平替產(chǎn)品。也是在7月,智譜AI及清華KEG實(shí)驗(yàn)室公布,中國(guó)頂尖開(kāi)源大模型ChatGLM2-6B允許免費(fèi)商用。華爾街見(jiàn)聞此前文章提及
,開(kāi)源模型的好處包括用戶的接受率更高,然后輸入更多數(shù)據(jù)供人工智能處理。LLM擁有的數(shù)據(jù)越多,其功能就越強(qiáng)大。此外,開(kāi)源模型使研究人員和開(kāi)發(fā)人員能夠發(fā)現(xiàn)和解決漏洞,同時(shí)提高技術(shù)和安全性。今年4月的2023阿里云峰會(huì)上,阿里巴巴宣布向企業(yè)開(kāi)放通義千問(wèn)
,企業(yè)可以調(diào)用通義千問(wèn)的能力訓(xùn)練自己的大模型。阿里云智能集團(tuán)首席技術(shù)官(CTO)周靖人當(dāng)時(shí)介紹,未來(lái)企業(yè)在阿里云上既可以調(diào)用通義千問(wèn)的全部能力
,也可以結(jié)合企業(yè)自身的行業(yè)知識(shí)和應(yīng)用場(chǎng)景
,訓(xùn)練自己的企業(yè)大模型。比如
,每個(gè)企業(yè)都可以有自己的智能客服
、智能導(dǎo)購(gòu)、智能語(yǔ)音助手
、文案助手
、AI設(shè)計(jì)師、自動(dòng)駕駛模型等。
阿里巴巴集團(tuán)CEO兼阿里云智能集團(tuán)CEO張勇當(dāng)時(shí)稱
,阿里巴巴所有產(chǎn)品未來(lái)都將接入通義千問(wèn)大模型。張勇表示
,面向 AI 時(shí)代,所有產(chǎn)品都值得用大模型重做一次,而基于這一信念,阿里云也希望幫助更多企業(yè)用上大模型,讓每家企業(yè)都能基于通義千問(wèn),擁有具備自己行業(yè)能力的專屬大模型。關(guān)鍵詞:
最近更新
- 國(guó)內(nèi)AI大模型“安卓時(shí)刻”到來(lái)!阿里云通義千問(wèn)免費(fèi)、開(kāi)源、可商用2023-08-04
- 不懼“黑天鵝”負(fù)面消息,巴菲特堅(jiān)持購(gòu)買美債,另一位大佬則高調(diào)做空長(zhǎng)債2023-08-04
- 涿州直擊丨照片背后的救援故事:全國(guó)幾十支隊(duì)伍、上百只沖鋒舟集結(jié)在這個(gè)路口2023-08-04
- 中國(guó)常駐聯(lián)合國(guó)代表:中國(guó)一直以積極行動(dòng)為維護(hù)國(guó)際糧食安全作出貢獻(xiàn)2023-08-04
- 國(guó)乒3人被淘汰!錢天一4:1奪冠,成為雙冠王,國(guó)乒斬獲3項(xiàng)冠軍2023-08-04
- 又是美國(guó)海關(guān)!海象新材宣布:全資子公司大幅減產(chǎn)2023-08-04
- 一文讀懂|河北涿州洪水從何而來(lái)?災(zāi)情為何更為嚴(yán)重?2023-08-04
- 觀自在菩薩行深波羅蜜多時(shí)翻譯(觀自在菩薩)2023-08-04
- 同一個(gè)單位的cps和mpa s有什么區(qū)別?2023-08-04
- 【新聞隨筆】到成都街頭走走看看2023-08-04
- 蘇軾是詩(shī)圣還是詩(shī)仙(詩(shī)圣是誰(shuí)的稱號(hào))2023-08-04
- 山東自貿(mào)區(qū)板塊8月3日漲0.06%,山東路橋領(lǐng)漲,主力資金凈流出2768.38萬(wàn)元2023-08-04
- 轉(zhuǎn)發(fā)擴(kuò)散!房子被毀,家人重病……南安這個(gè)家庭急需救助!2023-08-03
- 吧友吐槽張琳芃飛鏟野蠻的動(dòng)作
,該追加禁賽的紅牌動(dòng)作2023-08-03- 如何在拼多多上開(kāi)設(shè)成人用品店?詳細(xì)教程來(lái)了
!2023-08-03- 上半年我國(guó)機(jī)器人產(chǎn)業(yè)總體保持穩(wěn)定增長(zhǎng)態(tài)勢(shì)2023-08-03
- 《逐夢(mèng)》第六集:《永遠(yuǎn)守住根與魂》2023-08-03
- 理想L9新版本上市
,價(jià)格門檻降三萬(wàn),這力度難以拉升銷量2023-08-03- 桂花鎮(zhèn)開(kāi)展“聚力共同締造·代表行動(dòng)”活動(dòng)2023-08-03
- 咸安區(qū)啟動(dòng)“‘紅領(lǐng)巾’講咸寧”之“童讀檔案”活動(dòng)2023-08-03
- 翔騰新材:公司沒(méi)有超導(dǎo)相關(guān)的材料2023-08-03
- C視頻丨太“仙”了
!瀑布云、“佛光”齊現(xiàn)峨眉山金頂2023-08-03 - 吧友吐槽張琳芃飛鏟野蠻的動(dòng)作