AI終端產(chǎn)品“遍地開花”的科大訊飛
,終于拿出大模型這個“水壺”,向AI花園澆灌,用大模型的技術(shù)賦能旗下AI終端產(chǎn)品。 ,無法通過語言轉(zhuǎn)換為圖片。科大訊飛將星火定義為認知大模型
,和目前“大模型混戰(zhàn)”的主力軍語言大模型有所差異
。為了明確認知和語言的具體區(qū)別,紫金財經(jīng)向星火提問,星火表示“認知模型更關(guān)注人類語言的理解和生成過程,而語言模型更關(guān)注語言中詞匯、語法和語義等方面的規(guī)律?div id="d48novz" class="flower left">
!?/section>簡單來說
,其他大廠發(fā)布的語言大模型,更偏重于語言本身的規(guī)律,而訊飛的星火則側(cè)重于人類語言的理解,俗稱更懂人說話的邏輯。科大訊飛將大模型的研究方向定為認知的原因
,也不難理解。畢竟,2022年教育業(yè)務(wù)、開放平臺及消費者業(yè)務(wù),合計為科大訊飛貢獻了超過50%的營業(yè)收入。這兩項業(yè)務(wù)的產(chǎn)品使用場景,也都導(dǎo)向了人類自然語言與AI的交互。(資料圖)
認知大模型更符合科大訊飛的“調(diào)性”,畢竟在AI終端產(chǎn)品上深耕多年
,科大訊飛具備一定的技術(shù)底色和用戶數(shù)據(jù),來支持大模型的研發(fā),同時產(chǎn)品亦能為大模型提供商業(yè)落地場景,讓技術(shù)不再飄在空中。雖然內(nèi)部將大模型和產(chǎn)品融合,呈現(xiàn)良性驅(qū)動
,但外部的競爭,不容小覷。從宏觀的視角來看
,此次科大訊飛加入的大模型混戰(zhàn),可謂是移動互聯(lián)網(wǎng)技術(shù)底色最濃的一次戰(zhàn)爭。海外有Chat GPT立標桿,國內(nèi)各互聯(lián)網(wǎng)大廠投身熱潮,同屬于AI賽道的老對手商湯科技,已經(jīng)搶先一步發(fā)布大模型。
對于科大訊飛而言,這將是一場比拼韌勁的艱難戰(zhàn)爭
。為了研發(fā)星火
,科大訊飛投入的資金,使得今年Q1扣非歸母凈利潤大跌331.82%
,這讓本就離不開補貼和融資的企業(yè)
,又增添了幾分現(xiàn)金流的危機感
。參戰(zhàn)大模型,不知道科大訊飛準備了多少彈藥
?
星火的“前世今生”
“今年10月24日
,通用模型對標ChatGPT(中文超越,英文相當(dāng))
?div id="jfovm50" class="index-wrap">!笨拼笥嶏w董事長劉慶峰豪言。
科大訊飛給自己定下的目標
,可以說放在國內(nèi)所有大模型廠商中
,都是很高的水準了。百度創(chuàng)始人李彥宏曾在文心一言發(fā)布之際表示,距離ChatGPT還有兩個月的差距,而這兩個月的差距具體需要多久才能趕上是個未知數(shù)。
雖然距離科大訊飛兌現(xiàn)諾言的時候還有幾個月時間
,但我們?nèi)钥梢詮倪^往和當(dāng)下,來還原科大訊飛所具備的技術(shù)積累,而這也是科大訊飛參戰(zhàn)大模型的基礎(chǔ)彈藥。從大模型自身來看
,廠商需要具備數(shù)據(jù)積累、核心算法、算法創(chuàng)新、算力支撐等方面能力。而這些能力代入到科大訊飛中,就離不開星火誕生之前,科大訊飛的努力。這些技術(shù)沉淀
,也可以看作是星火的“前世”。2011年科大訊飛,承建了語音及語言信息處理國家工程實驗室
,當(dāng)時科大訊飛提出了讓機器像人一樣能聽會說
。從如今的視角來看,這也是當(dāng)下認知大模型語音和語言的核心能力的基礎(chǔ)條件
。
在核心算法層面
,GPT的核心算法支撐為Transformer(深度神經(jīng)網(wǎng)絡(luò)算法),這個算法起初是聚焦在自然語言處理領(lǐng)域
,隨后發(fā)展至各個領(lǐng)域
,也是目前AI主流的算法模型。
科大訊飛的星火模型
,同樣是基于Transformer的
,擁有超過1000億個參數(shù)
,是目前世界上最大的中文預(yù)訓(xùn)練語言模型。經(jīng)過多年的技術(shù)沉淀
,目前科大訊飛已經(jīng)將Transformer深度神經(jīng)網(wǎng)絡(luò)算法應(yīng)用于
,語音識別、圖文識別
、機器翻譯中
。科大訊飛已開源6大類
、超過40個通用領(lǐng)域系列的中文預(yù)訓(xùn)練語言模型
,相關(guān)模型庫月均調(diào)用量超1000萬。
除了Transformer之外
,在核心算法層面上
,科大訊飛還創(chuàng)新性地提出了知識與大模型融合的統(tǒng)一理解框架X-Reasoner,有望彌補大模型的模糊記憶技術(shù)短板
。X-Reasoner的基本技術(shù)是科大訊飛研發(fā)并應(yīng)用十幾年的DNN
,早在2011年科大訊飛就上線了中文語音識別DNN系統(tǒng)。
X-Reasoner于2017年發(fā)布
,是一款基于語義理解和推理的知識圖譜查詢系統(tǒng)
。可以應(yīng)用在智能客服
、智能問答系統(tǒng)等領(lǐng)域
。在2022年科學(xué)常識推理挑戰(zhàn)賽OpenBookQA中,以準確率94.2%的優(yōu)勢奪冠
,常識推理單模型首超人類平均水平
。
由此可見,科大訊飛多年來在AI領(lǐng)域的探索
,已具備一定的算法能力
,這也是如今星火大模型的技術(shù)底座。經(jīng)過十余年的發(fā)展
,這些技術(shù)積累早已形成規(guī)模化的研發(fā)
,所以在算法創(chuàng)新和算力支撐層面都已十分成熟
。
2017年,科大訊飛承建了中國首個認知智能領(lǐng)域國家級重點實驗室
,設(shè)計了通用認知大模型評測體系
,評測體系利于科大訊飛推動認知大模型的發(fā)展,也為日后創(chuàng)新夯實基礎(chǔ)
。技術(shù)底座中的最后一環(huán)
,算力支撐是所有大模型廠商最棘手的問題之一
。這方面,科大訊飛此前曾建立了AI數(shù)據(jù)中心
,這也是大模型訓(xùn)練的硬件基石
。
可以說,多年來在AI領(lǐng)域的“厚積”
,才讓科大訊飛迎來星火這個“薄發(fā)”的機會
。
但目前,科大訊飛的星火還存在很多不足之處
,劉慶峰表示
,目前訊飛星火認知大模型技術(shù)還存在很多可改進之處,比如新知識難以及時更新
,事實類問答容易“張冠李戴”等
。
紫金財經(jīng)在和星火進行多輪對話時也發(fā)現(xiàn)了部分不足,例如在提問“以人工智能賦能各行各業(yè)為題
,寫一篇市場報告”時
,星火引用的資料出現(xiàn)了“根據(jù)相關(guān)報告顯示,全球智能物流市場規(guī)模將在XXXX年突破2000億美元”
。這部分回答
,星火給出了模糊的年份,暴露了模型對資料處理能力的欠缺
。在提問“我本周找了十個客戶
,沒有成交,請幫我寫一份周報”時
,星火給出的回答出現(xiàn)了“找到了十個潛在客戶
,其中七個被成功轉(zhuǎn)化為進一步聯(lián)系機會?div id="m50uktp" class="box-center"> !边@部分回答出現(xiàn)了回答和提問事實不符的狀況
。
所以能看出,星火具備一定的技術(shù)實力
,但隨機應(yīng)變的能力還需進一步加強
。
星火誕生,燎原終端
在科大訊飛的總部園區(qū)中心
,立著一塊巨石
,石頭上刻著“頂天立地”四個大字。
劉慶峰解釋道
,“頂天”是指技術(shù)頂天
,掌握源頭核心技術(shù)并處于全球領(lǐng)先地位;“立地”是指應(yīng)用落地,讓技術(shù)轉(zhuǎn)化為大眾切實可感受的產(chǎn)品
。
應(yīng)用落地是科大訊飛自1999年成立以來
,一直未變的戰(zhàn)略目標。這或許也將是科大訊飛在大模型之戰(zhàn)中
,差異化的競爭力
。此前紫金財經(jīng)曾在《大廠集體搶灘ChatGPT:誰真的有實力,誰在試點商業(yè)化
?》一文中闡述觀點
,沒有商業(yè)落地場景,那技術(shù)只能是空中樓閣
。
科大訊飛在大模型商業(yè)落地環(huán)節(jié)先行一步
,目前科大訊飛AI終端產(chǎn)品包括AI學(xué)習(xí)機、智能辦公本
、翻譯機
、語音轉(zhuǎn)換APP等,涵蓋了學(xué)習(xí)
、辦公等多個使用場景