數(shù)據(jù)運(yùn)營商和C端應(yīng)用誰主沉浮。
AI行業(yè)火了大半年,時至今日誰才是產(chǎn)業(yè)鏈里的掘金人呢
(資料圖片僅供參考)
可以是給大模型訓(xùn)練提供數(shù)據(jù)的供應(yīng)商
究其原因
無論是選擇好公司還是好賽道都離不開以上三點(diǎn)
接下來我們具體聊聊:
為什么大模型賽道不行了?
AI行業(yè)涌現(xiàn)的機(jī)會在哪里
絕大多數(shù)的大模型企業(yè)要淚奔
為什么這么說
因?yàn)椋竽P推髽I(yè)很難滿足上述提到的重要三要素
從年初
后來
,Meta發(fā)布開源大模型Llama,變成了開源大模型的鼻祖,開源大模型讓眾多企業(yè)、研發(fā)人員有了追趕GPT的機(jī)會(沒有開源,那只會望塵莫及,畢竟通用大模型的訓(xùn)練成本不是隨便一家企業(yè)能承受的);也正是因?yàn)橛辛碎_源大模型
但是
首先,各家大模型與Open AI的差距還是很明顯
其次
最后
另外
,在大模型定價方面只會越來越難,開源已經(jīng)是常態(tài)了,連openAI最近也要開源新的大模型了,如果GPT3.5開源,那對于其他大模型廠商來說可謂是毀滅性的打擊。對于大部分的大模型方來說都面臨著一邊難收費(fèi)
,一邊要拼命花錢訓(xùn)練模型,以后數(shù)據(jù)也會開始收費(fèi)(又多了花錢的渠道),怎么想大模型都不是一個看起來能輕易盈利的商業(yè)模式。未來肯定很多企業(yè)會放棄這條擁擠、又不賺錢的賽道
。除非是能追上GPT4的水平,真正做到讓用戶覺得好用,才會有絕對的競爭力數(shù)據(jù)運(yùn)營商的春天要來了
上文提到
,扼住大模型發(fā)展的除了AI芯片,那就是訓(xùn)練大模型必不可少的數(shù)據(jù)。我們認(rèn)為
,數(shù)據(jù)運(yùn)營商將迎來發(fā)展的黃金期,不過還要適當(dāng)考慮各國情況的差異性(這里不做展開)。數(shù)據(jù)是新型生產(chǎn)要素
,這句話在大模型這里得到非常好的體現(xiàn)。值得關(guān)注的是
,數(shù)據(jù)商將成為行業(yè)賣水人。谷歌最近就因?yàn)榉欠ㄋ鸭脩魯?shù)據(jù)用于訓(xùn)練AI模型,被美國加利福尼亞州克拉克森律師事務(wù)所起訴
,要求向用戶賠償數(shù)據(jù)使用費(fèi)和告知數(shù)據(jù)用途。數(shù)據(jù)價值已經(jīng)開始顯現(xiàn)
。近日
,海外Prolific公司不僅獲得3200萬美元融資,還賺了1億+美元的數(shù)據(jù)提供費(fèi)用;每小時價格在6—8美元或更高。也就是說
Prolific已獲得了3000多家知名組織,其中包括谷歌
Prolific也表示
,高質(zhì)量、真實(shí)訓(xùn)練數(shù)據(jù)對于AI大模型來說能夠減少幻覺、非法輸出、增強(qiáng)RLHF能力。我們認(rèn)為
,數(shù)據(jù)運(yùn)營商在大模型上的商業(yè)價值才開始顯現(xiàn)。C端應(yīng)用是AI流量必爭之地
哪里有流量
,哪里就有財(cái)富。之前業(yè)內(nèi)都在討論到底是封閉大模型還是開源大模型的生態(tài)會更好
,哪個模式的商業(yè)價值更勝一籌;最后得到的結(jié)論是:開源還是封閉其實(shí)不是最核心的問題,關(guān)鍵在于如何形成好的數(shù)據(jù)飛輪效應(yīng)
。最近“數(shù)據(jù)飛輪“這個詞在科技圈內(nèi)非?div id="jpandex" class="focus-wrap mb20 cf">;穑唵蝸碚f是一種描述數(shù)據(jù)價值增長的循環(huán)過程
在互聯(lián)網(wǎng)時代我們看到數(shù)據(jù)量的激增
如果從產(chǎn)品落地和價值變現(xiàn)的速度來看
無論是微軟用Microsoft 365 Copilot開啟辦公AI時代
還是一直在內(nèi)卷的AI繪畫、和即將開卷的AI視頻
C端應(yīng)用往往比B端更容易落地
而B端的場景、訴求更多
這也就為什么在國內(nèi)互聯(lián)網(wǎng)流量紅利期賺的盆滿缽滿的是阿里、騰訊