如何用AIGC支點,撬動元宇宙生態(tài) ?
“被AI的繪畫技術(shù)整破防了”“AI會取代人類繪畫嗎”……這些近期掛在微博熱搜榜上的話題
,揭示了AI繪畫的火爆程度。無論是自拍
、合影
,還是搞怪圖片,只需應用AI繪畫特效
,就能一鍵轉(zhuǎn)換為自己指定風格的精美繪圖
。這種開盲盒似的體驗,讓許多用戶欲罷不能
。
【資料圖】
當人們成迷于AIGC(AI-Generated Content,人工智能生產(chǎn)內(nèi)容)體驗中的時候,也不禁對其背后的技術(shù)進展投注了更大興趣。12月15日,昆侖天工AIGC技術(shù)發(fā)布會在線上舉行。昆侖萬維CEO方漢正式發(fā)布昆侖天工AIGC全系列算法與模型,并宣布模型開源。昆侖天工旗下模型包括天工巧繪SkyPaint
、天工樂府SkyMusic、天工妙筆SkyText
、天工智碼SkyCode
,覆蓋圖像、音樂
、文本
、編程等多模態(tài)內(nèi)容生成能力。
這標志著昆侖萬維成為目前國內(nèi)AIGC領(lǐng)域布局最為全面的公司之一,也是國內(nèi)第一個全身心投入到AIGC開源社區(qū)的公司。此時宣布開源,昆侖萬維CEO方漢表示
,“因為我們堅信開源是推動AIGC生態(tài)發(fā)展的土壤和重要力量
。昆侖萬維致力于在AIGC模型算法方面的技術(shù)創(chuàng)新和開拓,致力于推進開源AIGC算法和模型社區(qū)的發(fā)展壯大
,致力于降低AIGC技術(shù)在各行各業(yè)的使用和學習門檻
。”
昆侖萬維的AIGC技術(shù)到底已經(jīng)發(fā)展到了什么程度?能夠?qū)IGC生態(tài)的發(fā)展助推到一個新高度嗎?
模型突破,AIGC爆發(fā)
“成精”的AI
,不僅能繪畫
,還能聊天。12月以來在科技圈刷屏的聊天機器人ChatGPT
,面對網(wǎng)友們“調(diào)戲式”的提問
,不僅對答如流,還能中英文絲滑切換
,就連參加有“美國高考”之稱的SAT考試也能考出排在全美前52%的成績
。
相關(guān)產(chǎn)品的出圈,讓AIGC概念站到了聚光燈下。國盛證券研報稱
,AIGC代表新一輪范式轉(zhuǎn)移的開始,其中在AIGC生成算法模型及數(shù)據(jù)集層面
,可關(guān)注英偉達
、Meta、百度
、藍色光標(300058.SZ)
、昆侖萬維(300418.SZ)等公司
。
事實上,AIGC頻繁見諸報端是今年才發(fā)生的事,這也是為何2022年被稱為AIGC元年。其是繼PGC(專業(yè)生產(chǎn)內(nèi)容)和UGC(用戶生產(chǎn)內(nèi)容)后的又一種新型內(nèi)容創(chuàng)作方式,此前雖然業(yè)界對AIGC研究已久
,但一直難以實現(xiàn)質(zhì)的突破
。
招商證券研報中,將AIGC的發(fā)展分為三個階段
,分別是1950-1990年的早期萌芽階段
、1990-2010年的沉淀積累階段和2010年至今的快速發(fā)展階段。其迭代與人工智能深度學習的演進沿革密切相關(guān)
。
要了解深度學習
,就離不開機器學習的概念。這項技術(shù)的主要任務(wù)是指導計算機從數(shù)據(jù)中學習
,然后利用經(jīng)驗來改善自身的性能
。
在此基礎(chǔ)上,深度學習開辟了機器學習研究中的新方法
。其動機在于建立
、模擬人腦進行分析學習的神經(jīng)網(wǎng)絡(luò),模仿人腦的機制來解釋數(shù)據(jù)
,是2011-2020年最熱門的AI研究主題
。
最早出現(xiàn)的深度學習模型是2014年的GAN,其對輸出結(jié)果的控制力較弱
;2021年,CLIP模型橫空出世
,其已經(jīng)能實現(xiàn)圖像和文本的匹配
;而2022年的最新深度學習模型Diffusion,不僅能高效合成視覺數(shù)據(jù)
,還在視頻生成
、音頻合成等其他領(lǐng)域展示出了不俗的潛力,直接推動了AIGC技術(shù)的突破性發(fā)展
。
可以說,近兩年AI深度學習的發(fā)展,是以天為單位計算的
。以AI繪畫為例
,其實今年年初被大眾熟知的AI繪畫產(chǎn)品Disco Diffusion的缺點還較為明顯,不僅無法刻畫具體細節(jié)
,還要耗費數(shù)以小時計的時間對圖像進行渲染
。
圖注:天工巧繪生成作品
但這些缺點僅過了幾個月就被新模型Stable Diffusion近乎完美的解決,后者可將模型的計算空間,在盡可能保留細節(jié)信息的情況下降維到一個稱之為“潛空間”的低維空間里, 再進行繁重的模型訓練和圖像生成計算
,大大降低了內(nèi)存和計算要求
。而且這款當今堪稱最強大的AI繪畫模型,已經(jīng)于8月完全開源
。
這種從前只會發(fā)生在《三體》等科幻小說中的“降維打擊”情節(jié)
,竟成為了現(xiàn)實,也難怪AIGC領(lǐng)域當下深受資本青睞
。目前
,大數(shù)據(jù)+AI公司Databricks估值已達380億美元,開發(fā)出ChatGPT的OpenAI估值在今年10月超過200億美元
。同時
,國內(nèi)百度、騰訊
、阿里巴巴
、字節(jié)跳動、網(wǎng)易等大廠也正競相入場
。
AIGC的應用場景大致可以分為To B和To C兩個賽道,其中B端主要通過“AI+”為產(chǎn)業(yè)進行賦能;C端主要通過與人交互進行內(nèi)容生產(chǎn)
。而招商證券又按照生成的內(nèi)容形式
,將AIGC分為了文字、圖像
、音頻
、視頻和虛擬人五類。
另據(jù)Gartner預測
,至2025年人工智能生成數(shù)據(jù)占比將達10%
。紅杉美國的兩位合伙人在一篇題為《Generative AI:A Creative New World》的報告中表示,AIGC有潛力產(chǎn)生數(shù)萬億美元的經(jīng)濟價值
。
AIGC走紅后,兩年前就開始對該領(lǐng)域進行全系列布局的昆侖萬維受到了廣泛關(guān)注。
登陸A股的2015年
,昆侖萬維的游戲收入占比達97%
,境外收入占比達74%,公司IPO募集的13億元也基本用于游戲的研發(fā)和代理
,是一家不折不扣的海外游戲公司
。
但在上市后次年,昆侖萬維就聯(lián)合三六零(601360.SH)收購了全球知名瀏覽器公司Opera,自此走上了互聯(lián)網(wǎng)平臺型企業(yè)的轉(zhuǎn)型之路
。7年時間里
,昆侖萬維一邊收購資產(chǎn),一邊開發(fā)自研
,目前業(yè)務(wù)已覆蓋包括社交
、娛樂、元宇宙
、信息分發(fā)
、搜索及游戲等在內(nèi)的多個領(lǐng)域。
同期,昆侖萬維一直堅持出海戰(zhàn)略
。截至今年上半年,公司的兩個主要產(chǎn)品
,Opera全球平均月活用戶達3.3億
;海外社交娛樂領(lǐng)域頭部平臺StarX主打產(chǎn)品StarMaker累計在102個國家音樂/音頻類暢銷榜排名前五,其中84個國家位列第一
。
事實上
,早在兩年前,昆侖萬維已經(jīng)開始全系列布局AIGC
,投入數(shù)千萬元
,組建了二百余人的研發(fā)團隊。2020年底至2021年4月
,其研發(fā)出百億參數(shù)的中文GPT-3模型
,并于2021年8月開始研發(fā)基于自有大文本模型的對話機器人,迅速刷新國內(nèi)技術(shù)指標
。2022年1月啟動SkyMusic音樂實驗室
,2022年4月達到人工智能領(lǐng)域最優(yōu)效果;2022年9月啟動編程
、圖像
、文本方向的AIGC產(chǎn)品。
目前,昆侖萬維推出的AIGC模型與算法昆侖天工,AI生成能力已覆蓋圖像
、音樂
、編程、文本等全模態(tài)領(lǐng)域
,且其在四大模態(tài)領(lǐng)域均采用世界頂尖開源模型
。
如AI圖像方面,天工巧繪采用全球第一款多語言Stable Diffusion分支模型
,兼容Stable Diffusion
;使用1.5億中英雙語語料
,支持中英雙語輸入實現(xiàn)文字生成圖像,是國內(nèi)為數(shù)不多的支持中英雙語的文圖生成模型
。
圖注:天工巧繪生成作品
AI音樂方面
,天工樂府則采用了國內(nèi)第一款商用級開源作曲AI模型,和弦準確率達92.5%
,遠超目前行業(yè)最佳64.7%
;還支持31種語種、全球多個曲風
,并能從旋律
、文案素材生成歌詞。
今年上半年
,StarX成立的MusicX Lab音樂實驗室發(fā)布了五首完全由AI作曲的歌曲
,已在Spotify、SoundCloud
、QQ音樂和網(wǎng)易云音樂等海內(nèi)外180余個音樂平臺上線
;三季度,MusicX Lab再推10首新作AI歌曲
,算法模型及AIGC能力不斷優(yōu)化提升
。得益于此,目前StarMaker旗下K歌類產(chǎn)品Sing Star已是業(yè)內(nèi)第一個可實現(xiàn)AIGC豐富內(nèi)容供給的產(chǎn)品
。
而AI編程方面
,天工智碼則采用全球第一款多語言開源編程大模型,能生成python
、Java
、C、php
、swift等共計十余種編程語言
,使不同語言的使用者都能來體驗。
AI文本被方漢稱作是公司下一個可能的發(fā)展重點 。與之對應的是
,天工妙筆采用生成效果最好的開源GPT中文預訓練大模型,針對中文領(lǐng)域構(gòu)建了千億級別的高質(zhì)量數(shù)據(jù)集
,能提供包括續(xù)寫
、對話、中英翻譯
、內(nèi)容風格生成
、推理、詩詞對聯(lián)等在內(nèi)的各種功能。
圖注:天工妙筆生成五言詩
不難發(fā)現(xiàn) ,無論是哪一領(lǐng)域
,昆侖天工都很重視多語言模型的開發(fā)、為全球的從業(yè)者和用戶造福
,這也與公司出海的戰(zhàn)略遙相呼應
。優(yōu)質(zhì)模型疊加豐富的數(shù)據(jù)集,讓昆侖天工擁有強大的團隊模型訓練能力
,
并在同賽道上市公司中處于領(lǐng)先地位。值得一提的是,目前AI圖像、AI編程、AI文本的模型已經(jīng)在GitHub上開源。“我們堅信開源是推動AIGC生態(tài)發(fā)展的土壤和重要力量
?div id="4qifd00" class="flower right">
!狈綕h在發(fā)布會上稱。
能讓昆侖萬維如此不遺余力地押注
,AIGC到底有何魔力?或許將目光放到其背后的元宇宙可以找到答案
。
雖然終極形態(tài)尚未確定
,但業(yè)界的共識是,元宇宙將極大擴展人類的存在空間
。而這樣的空間需要大量的數(shù)字內(nèi)容支撐
,顯然單靠人工設(shè)計和開發(fā)無法完全滿足需求,AIGC剛好可以解決這樣一個問題
。
在此背景下
,AIGC被視作“推動元宇宙發(fā)展的加速器”,亦或是“開啟元宇宙的鑰匙”
。
結(jié)合昆侖萬維原本的元宇宙業(yè)務(wù),AIGC或?qū)①x予昆侖萬維更大的想象空間。一方面,AIGC可以實現(xiàn)降本增效,并增強應用的可玩性和功能性。還是以AI作曲為例:昆侖萬維的游戲
、StarMaker等產(chǎn)品中都需要植入海量音樂
,而音樂本身創(chuàng)作成本較高,AI作曲則能在提高音樂品質(zhì)的同時降低使用成本和音樂愛好者
、獨立音樂人的使用門檻。
方漢曾打過這樣一個比方:“假設(shè)每款游戲的音樂成本在50萬元至100萬元之間,那么通過AIGC
,我們的音樂成本就能夠降至0
。”
同時
,這種模式也具備商業(yè)化潛力
。近期昆侖萬維方面表示,已經(jīng)接到了采購AI創(chuàng)作歌曲的意向
。目前看來
,為企業(yè)用戶提供音樂相關(guān)解決方案,包括批量供給背景音樂
、伴奏配樂等泛化內(nèi)容
,或為藝人及虛擬偶像定制化創(chuàng)作符合其人設(shè)調(diào)性的音樂作品等服務(wù),是AI作曲B端落地的重要方向
。
另一方面,昆侖萬維旗下各產(chǎn)品對接的海量用戶提供的數(shù)據(jù),還能幫助AIGC迭代,保持技術(shù)優(yōu)勢。2021年,StarMaker已經(jīng)成長為除中國外全球最大的在線K歌娛樂社交平臺。“其實全世界做AIGC的公司非常多
,但是昆侖萬維的長處在于我們有音頻方面的深厚積累。我們擁有全世界最大的伴奏帶數(shù)據(jù)庫
,里面有相當多是已經(jīng)被數(shù)字化的伴奏母帶
。人工智能非常依賴數(shù)據(jù)集,我們有這樣高質(zhì)量的數(shù)據(jù)集
,對于AIGC非常有幫助
。這是競爭對手短期內(nèi)無法復制的?div id="4qifd00" class="flower right">
!狈綕h曾表示
。
不只是AI作曲,昆侖天工在AI繪畫
、AI編程
、AI文本方面的輸出能力,同樣能與昆侖萬維的元宇宙業(yè)務(wù)形成協(xié)同效應
。再結(jié)合昆侖萬維此前在文娛
、社交、游戲等不同行業(yè)的深度商業(yè)沉淀和領(lǐng)先的互聯(lián)網(wǎng)運營能力
,在
行業(yè)人士看來,昆侖萬維也有望成為元宇宙風口到來后最大的受益者之一