近日,云啟資本合伙人陳昱接受21世紀(jì)經(jīng)濟報道記者專訪時表示,當(dāng)前還在競速中的國內(nèi)AI大模型企業(yè)都有發(fā)展機會,核心在于不斷提升工程優(yōu)化和技術(shù)迭代能力,同時也要充分挖掘創(chuàng)新應(yīng)用場景。
在他看來,生成式AI落地到應(yīng)用場景中,將是80%存量應(yīng)用升級+20%新應(yīng)用探索的“二八定律”局面。也將給正在演進中的技術(shù),如元宇宙、自動駕駛等,帶來漸進式能力推動。
作為早期投資人,在面對AI大模型創(chuàng)業(yè)項目時,他更看好有野心、懂技術(shù)、執(zhí)行力強的團隊。
追根溯源,如今火爆全球的ChatGPT背后,是Transformer架構(gòu)的支撐。這一技術(shù)早在2017年被谷歌提出,2018年谷歌還提出基于Transformer架構(gòu)的BERT技術(shù)等。
“其實無論是早期的CNN(卷積神經(jīng)網(wǎng)絡(luò))還是Transformer,都屬于在深度學(xué)習(xí)領(lǐng)域,行業(yè)探索過程中尋求的不同網(wǎng)絡(luò)結(jié)構(gòu)。恰好Open AI用解碼器decoder only架構(gòu),證明了Transformer的可行性,并把參數(shù)規(guī)模從十億擴展到上千億量級?!标愱爬m(xù)稱,因此這一方面有賴于深度學(xué)習(xí)算法的持續(xù)發(fā)展;另一方面英偉達提供的GPU算力支持同樣功不可沒。
實際上,在早期路徑探索中,谷歌認(rèn)為decoder only路線可能會不如encoder+decoder(編碼-解碼)效果好,因此采用了另外一條路線,而谷歌內(nèi)部長期有多個團隊在做不同嘗試。
最終Open AI持續(xù)迭代,加之RLHF(人類反饋強化學(xué)習(xí))后,證明了decoder only路線的可行性。隨著路線被證明,谷歌很快也推出號稱可對標(biāo)GPT4的大模型PaLM2。
“國內(nèi)和國外有不同的大模型體系,投身AI大模型的國內(nèi)企業(yè),當(dāng)前還是有一定機會?!标愱艑τ浾叻治?,目前GPT-4的水平可能已經(jīng)達到了95分,國內(nèi)很多產(chǎn)品在80分左右,但是并不存在代際差。
一方面,AI大模型公司需要花費更多時間在工程優(yōu)化和技術(shù)迭代上;另一方面,更需要產(chǎn)品經(jīng)理的創(chuàng)新能力,充分挖掘AI大模型的創(chuàng)新功能。
“我覺得這一輪,微軟在創(chuàng)新應(yīng)用方面做得比絕大部分公司好,近期微軟密集發(fā)布新功能,比如在Bing中引入ChatGPT、適用于Windows 11的Windows Copilot等。”他進一步表示。
不過有行業(yè)觀點認(rèn)為,Open AI更多是證明了Transformer架構(gòu)路線的可行性,在具體落地時,或許未必要重投入,而是可以考慮小模型發(fā)展路線。
“目前業(yè)界存在不同觀點。”陳昱對記者分析,一部分人認(rèn)為,小模型可能存在諸多優(yōu)勢,如資源消耗較少、成本低,而成本低就是跑通商業(yè)模型的重要一環(huán);同時,當(dāng)前“大力出奇跡”的AI大模型中集合了太多數(shù)據(jù)量和能力,但實際在應(yīng)用中或許未必需要。
但另一部分人認(rèn)為,AI公司最終的發(fā)展目標(biāo)都是瞄準(zhǔn)通用人工智能(AGI),也即類似人類的大腦,在運轉(zhuǎn)過程中并不會分區(qū),而是可以同時多路線思考運行,甚至各分區(qū)之間會互相作用,產(chǎn)生意想不到的效果。這條思路之下,就意味著需要大模型最終“一統(tǒng)江湖”。
總體來看,當(dāng)前業(yè)界對這兩條路仍有分歧?!皩W(xué)術(shù)上也還沒有證明,大模型是否的確是參數(shù)量越多越好。畢竟目前AI的運作還是一個黑匣子。”
當(dāng)然他也認(rèn)為,并不是所有企業(yè)都需要有自己的大模型?!坝?xùn)練大模型要從頭開始,這意味著巨大的資源消耗,需要衡量投入產(chǎn)出比。有時調(diào)用成熟的大模型,取得的效果可能遠(yuǎn)比自己從頭搭建和訓(xùn)練要好?!彼麖娬{(diào),長遠(yuǎn)來看,綜合考慮成本和收益是否算得過來賬很重要。
當(dāng)前最受關(guān)注的,便是在生成式AI浪潮之下,對應(yīng)用生態(tài)和相關(guān)底層技術(shù)帶來的影響。
具體來說,數(shù)字經(jīng)濟、企業(yè)服務(wù)、SaaS服務(wù)等技術(shù)此前已經(jīng)發(fā)展多年,通過引入更好的AI大模型能力,可以將既有技術(shù)進一步升級,把之前很難做好的體驗真正做到滿意;再如微軟近期不斷對旗下應(yīng)用進行迭代升級,將極大提升內(nèi)容生產(chǎn)力和工作效率。這都是由技術(shù)變革帶來的體驗變革。
生成式AI技術(shù)的出現(xiàn),也將給正在迭代中的技術(shù)路線帶來一定幫助,比如元宇宙和自動駕駛等。但總體帶來的將是漸進式改變,而非顛覆式驅(qū)動。
陳昱對記者分析,AIGC對元宇宙的推動將主要在于素材生成?!霸钪媲捌跁谶@方面花費較多時間,AIGC就可以幫助提高素材生成效率、節(jié)省創(chuàng)意時間?!?/p>
不過這并不能起到根本性推動作用。“元宇宙一直難以大面積落地,是因為暫時沒有剛需的應(yīng)用場景。AR/VR被視為元宇宙的入口,但目前遇到的難題是,還沒有一款眼鏡達到可以長期佩戴使用的效果?!彼赋觥?/p>
對于自動駕駛的改善可以包括感知和規(guī)劃部分兩方面。此前,自動駕駛功能運行時,傳感器需要不斷收集外部信息,進行標(biāo)注。但有了AI大模型后,由于其具備zero-shot(零樣本)能力,可能就不再需要具象到所有可能出現(xiàn)的物體樣本進行標(biāo)記。
而自動駕駛進程中,根據(jù)收集到的地圖、實時視覺等信息后,該決策是加速、減速還是換道等,就可以運用到AI大模型的推理能力,這將會比現(xiàn)有自動駕駛所用模型做到更好的效果。
與此同時,AI大模型還在不斷滲透到軟硬件層面,如近期ChatGPT推出iOS版、百度為此推出硬件產(chǎn)品等。不過陳昱并不認(rèn)為AI大模型的出現(xiàn),會對既有軟硬件生態(tài)帶來太大角色改變。
“我認(rèn)為改變的可能是搜索生態(tài)。”他續(xù)稱,比如ChatGPT就可能成為谷歌在搜索方面的競爭對手。這意味著對用戶使用習(xí)慣沒有太大改變,改變的只是獲取信息的途徑。
從社會影響來說,陳昱認(rèn)為,這將對整個教育體系帶來巨變。可以類比此前計算機出現(xiàn)后,復(fù)雜的珠算、五位數(shù)乘法等學(xué)習(xí),到今天多被計算器所取代,人們可以把腦力放在其他更有創(chuàng)造力知識的學(xué)習(xí)中去。“如果能夠利用好AI工具,幫助我們?nèi)祟愅瓿纱饲?0%的工作,剩下20%可以更好地施展創(chuàng)造力和想象力,同時也會帶來新的職業(yè)暢想和組織范式。”