集團 業務

當前位置:
集團業務 >行業動态

陸奇說了什麼(me)

2023-05-12 17:05

作者 | 張小珺

來源 | 騰訊科技

(ID:qqtech)

就連陸奇都(dōu)說他跟不上大模型時代的狂飙速度了。他讓下屬做“大模型日報”,一方面(miàn)便于他跟上論文和信息更新,另一方面(miàn)給奇績生态創業者共享。他用了三個“實在”表達這(zhè)一點。“我實在不行了,論文實在是跟不上,代碼實在是跟不上。Just too much(太多了)。”陸奇在近期一次分享活動上說。

這(zhè)樣(yàng)的時刻還(hái)從沒(méi)有過(guò)。奇績創壇創始人兼CEO陸奇是中國(guó)AI布道(dào)人,也是中國(guó)針對(duì)大模型最有發(fā)言權的人之一。他曾在全球巨頭身居要職,先後(hòu)任職于IBM、雅虎、微軟、百度,曾是華人在美國(guó)科技公司最有權威的高層人士,位至雅虎和微軟執行副總裁,回國(guó)加盟百度出任集團總裁兼COO。陸奇以勤勉的工作爲科技圈著稱——每天清晨4點起(qǐ)床,跑步5英裡(lǐ),6點準時到辦公室。

同時,他和OpenAI有著(zhe)深厚淵源。陸奇所掌管的奇績前身是YC中國(guó),是美國(guó)著名創業孵化器YC(Y Combinator)的中國(guó)分支。他也是YC全球研究院院長(cháng)。而OpenAI首席執行官Sam Altman正是YC二代接班者、現任總裁。兩(liǎng)人雖相差24歲,卻是忘年交,相識已逾18年。當初正是Sam Altman屢次力邀陸奇加盟YC。所以,陸奇對(duì)YC、對(duì)Sam Altman和OpenAI都(dōu)有長(cháng)期的近距離觀察。

2023年4月22日,陸奇在上海舉行小規模演講,騰訊新聞有幸參與了旁聽。陸奇希望幫助中國(guó)創業者認清這(zhè)次曆史性的拐點時刻,定位今天的時代坐标、找準自己的位置。“這(zhè)個時代跟淘金時代很像,”他說道(dào),“如果你那個時候去加州淘金,一大堆人會死掉。但是賣勺子、賣鏟子的人永遠可以賺錢。”

陸奇很反感蹭熱點,他一再警示創業者蹭熱點隻會浪費機會。到現在爲止,你幾乎很難在公開(kāi)渠道(dào)聽到陸奇的觀點。這(zhè)也讓本次演講具有稀缺性。

事(shì)實上,在大模型快速達成(chéng)社會共識之際,一部分人期待陸奇博士披甲上陣,做“中國(guó)的Sam Altman”——扮演可能(néng)比一名投資者、布道(dào)者更關鍵的角色。但據奇績内部人說:“Qi目前100%時間花在奇績。”

騰訊新聞作者將(jiāng)這(zhè)場分享進(jìn)行了完整的整理——演講涵蓋他對(duì)大模型時代的宏觀思考,包括拐點的内在動因、技術演進(jìn)、創業公司結構性機會點以及給創業者的建議。大家可以各取所需。

好(hǎo)了,讓我們來看看陸奇怎麼(me)說。爲了方便閱讀,作者做了一些字句修改和文本優化。

社會性拐點的核心

是一項大型成(chéng)本從邊際變成(chéng)固定

我認識Sam Altman是2005年,他那時19歲不到,我已經(jīng)40多歲了。

我們倆是忘年交。他是一個很善良也很奇怪的小孩,今天很高興他能(néng)這(zhè)樣(yàng)改變世界。前不久,我春節在美國(guó)3個月,也到OpenAI和Sam聊了一些。

首先,怎麼(me)理解這(zhè)個新範式?這(zhè)張圖能(néng)把ChatGPT和OpenAI所帶來的一切講清楚。之後(hòu),基于第一性原理,你自然會推演出所在賽道(dào)的機會和挑戰。

這(zhè)張圖是“三位一體結構演化模式”,本質是講任何複雜體系,包括一個人、一家公司、一個社會,甚至數字化本身的數字化體系,都(dōu)是複雜體系。“三位一體”包括:

“信息”系統(subsystem of information),從環境當中獲得信息;

“模型”系統(subsystem of model),對(duì)信息做一種(zhǒng)表達,進(jìn)行推理和規劃;

“行動”系統(subsystem of action),我們最終和環境做交互,達到人類想達到的目的。

任何體系,都(dōu)是這(zhè)三個體系的組合,數字化系統尤其如此。數字化和人分不開(kāi)。人也一樣(yàng),人要獲得信息、表達信息、行動解決問題或滿足需求。

基于此,我們可以得出一個簡單結論。今天大部分數字化産品和公司,包括Google、微軟、阿裡(lǐ)、字節,本質是信息搬運公司。一定要記住,我們所做的一切,一切的一切,包括在座的大部分企業都(dōu)在搬運信息。Nothing more than that,You just move bytes(僅此而已,你隻是移動字節)。但它已經(jīng)足夠好(hǎo),改變了世界。

早在1995-1996年,通過(guò)PC互聯網迎來一個拐點。那時我剛從CMU(卡内基梅隆大學(xué))畢業。大量公司層出不窮,其中誕生了一家偉大公司叫(jiào)Google。爲什麼(me)會有這(zhè)個拐點?爲什麼(me)會有爆炸式增長(cháng)?把這(zhè)個觀點講清楚,就能(néng)把今天的拐點講清楚。

原因是,獲取信息的邊際成(chéng)本開(kāi)始變成(chéng)固定成(chéng)本。

一定要記住,任何改變社會、改變産業的,永遠是結構性改變。這(zhè)個結構性改變往往是一類大型成(chéng)本,從邊際成(chéng)本變成(chéng)固定成(chéng)本。

舉個例子,我在CMU念書開(kāi)車離開(kāi)匹茨堡出去,一張地圖3美元,獲取信息很貴。今天我要地圖,還(hái)是有價錢,但都(dōu)變成(chéng)固定價格。Google平均一年付10億美元做一張地圖,但每個用戶要獲得地圖的信息,基本上代價是0。也就是說,獲取信息成(chéng)本變0的時候,它一定改變了所有産業。這(zhè)就是過(guò)去20年發(fā)生的,今天基本是free information everywhere(免費的信息無處不在)。

Google爲什麼(me)偉大?它把邊際成(chéng)本變成(chéng)固定成(chéng)本。Google固定成(chéng)本很高,但它有個簡單商業模式叫(jiào)廣告,它是世界上高盈利、改變世界的公司,這(zhè)是拐點關鍵。

今天2022-2023年的拐點是什麼(me)?它不可阻擋、勢不可擋,原因是什麼(me)?一模一樣(yàng)。模型的成(chéng)本從邊際走向(xiàng)固定,因爲有件事(shì)叫(jiào)大模型。

模型的成(chéng)本開(kāi)始從邊際走向(xiàng)固定,大模型是技術核心、産業化基礎。OpenAI搭好(hǎo)了,發(fā)展速度爬升會很快。爲什麼(me)模型這(zhè)麼(me)重要、這(zhè)個拐點這(zhè)麼(me)重要,因爲模型和人有内在關系。我們每個人都(dōu)是模型的組合。人有三種(zhǒng)模型:

1.認知模型,我們能(néng)看、能(néng)聽、能(néng)思考、能(néng)規劃;

2.任務模型,我們能(néng)爬樓梯、搬椅子剝雞蛋;

3.領域模型,我們有些人是醫生,有些人是律師,有些人是碼農。

That’s all。我們對(duì)社會所有貢獻都(dōu)是這(zhè)三種(zhǒng)模型的組合。每個人不是靠手和腿的力量賺錢,而是靠腦袋活。

簡單想一想,如果你沒(méi)有多大見解,你的模型能(néng)力大模型都(dōu)有,或者大模型會逐步學(xué)會你所有的模型,那會怎樣(yàng)?——未來,唯一有價值的是你有多大見解。

人類社會是技術驅動。從農業時代,人用工具做簡單勞動,最大問題是人和土地綁定,人缺少流通性,沒(méi)有自由。工業發(fā)展對(duì)人最大變化是人可以動了,可以到城市和工廠。早期工業體系以體力勞動爲主、腦力勞動爲輔,但随著(zhe)機械化、電氣化、電子化,人的體力勞動下降。信息化時代以後(hòu),人以腦力勞動爲主,經(jīng)濟從商品經(jīng)濟轉向(xiàng)服務經(jīng)濟——碼農、設計師、分析師成(chéng)爲我們時代的典型職業。

這(zhè)一次大模型拐點會讓所有服務經(jīng)濟中的人、藍領基本都(dōu)受影響,因爲他們是模型,除非有獨到見解,否則你今天所從事(shì)的服務大模型都(dōu)有。下一時代典型的職業,我們認爲是創業者和科學(xué)家。

所以,這(zhè)次變革影響每個人。它影響整個社會。

我所看到的三個拐點

下個拐點是什麼(me)?

下個拐點將(jiāng)是組合:“行動”無處不在(自動駕駛、機器人、空間計算)。也就是人需要在物理空間裡(lǐ)行動,它的代價也從邊際走向(xiàng)固定。20年後(hòu),這(zhè)個房子裡(lǐ)所有一切都(dōu)有機械臂,都(dōu)有自動化的東西。我需要的任何東西,按個按鈕,軟件可以動,今天還(hái)需要找人。

那麼(me),哪些公司能(néng)走到下個拐點、站住下個拐點?我認爲特斯拉有很高概率,它的自動駕駛、機器人現在很厲害。微軟今天跟著(zhe)OpenAI爬坡,但怎麼(me)站住下個拐點?

接下來講一下我們看到的三個拐點:

① 今天信息已經(jīng)無處不在了,接下來15-20年,模型就是知識,將(jiāng)無處不在。以後(hòu)手機上打開(kāi),任何聯網,模型就過(guò)來了。它教你怎麼(me)去解答法律問題,怎麼(me)去做醫學(xué)檢驗。不管什麼(me)樣(yàng)的模型都(dōu)可以無處不在。

② 在未來,自動化、自主化的動作可以無處不在。

③ 人和數字化的技術共同進(jìn)化。Sam最近經(jīng)常講,它必須要共同進(jìn)化,才能(néng)達到通用智能(néng)(AGI)。通用智能(néng)四大要素是:湧現(emergence)+代理(agency)+功能(néng)可見性(affordence)+具象(embodiment)。

總結來說,我們從根本性的三位一體結構分析未來,從過(guò)去的曆史拐點能(néng)清晰看到今天所面(miàn)臨的拐點,本質是模型成(chéng)本從邊際走向(xiàng)固定,將(jiāng)有一家甚至多家偉大公司誕生。毫無疑問,OpenAI處于領先。

雖然講得有點早,但我個人認爲,OpenAI未來肯定比Google大。隻不過(guò)是大1倍、5倍還(hái)是10倍。

OpenAI核心就堅信兩(liǎng)件事(shì)

發(fā)展速度連Sam本人都(dōu)驚訝

下面(miàn)我從技術角度講OpenAI大事(shì)迹,它怎麼(me)把大模型時代帶來的?

爲什麼(me)講OpenAI,不講Google、微軟。講真心話,因爲我知道(dào),微軟好(hǎo)幾千人也做這(zhè)個,但不如OpenAI。一開(kāi)始比爾·蓋茨根本不相信OpenAI,大概6個月前他還(hái)不相信。4個月前看到GPT-4的demo(産品原型),目瞪口呆。他寫了文章說:It’s a shock,this thing is amazing(這(zhè)太令人震驚了,這(zhè)東西太神奇了)。谷歌内部也目瞪口呆。

OpenAI一路走下來的關鍵技術:

1.GPT-1是第一次使用預訓練方法來實現高效語言理解的訓練;

2.GPT-2主要采用了遷移學(xué)習技術,能(néng)在多種(zhǒng)任務中高效應用預訓練信息,并進(jìn)一步提高語言理解能(néng)力;

3.DALL·E是走到另外一個模态;

4.GPT-3主要注重泛化能(néng)力,few-shot(小樣(yàng)本)的泛化;

5.GPT-3.5 instruction following(指令遵循)和tuning(微調)是最大突破;

6.GPT-4 已經(jīng)開(kāi)始實現工程化。

7.2023年3月的Plugin是生态化。

OpenAI的融資結構爲什麼(me)這(zhè)麼(me)設計?和Sam早期目标和對(duì)未來的判斷分不開(kāi)。他知道(dào)要融很多錢,但股權設計有一個很大挑戰——容易把回報和控制混在一起(qǐ)——所以他要設計一個結構,讓它不受任何股東的制約。于是,OpenAI的投資者沒(méi)有控制權,他們的協議是一種(zhǒng)債的結構。如果賺完2萬億,接下來是non-profit(不再盈利了),一切回歸社會。這(zhè)個時代需要新的結構。

它勢不可擋。Sam Altman自己都(dōu)surprise,連他都(dōu)沒(méi)想到會那麼(me)快。

如果大家對(duì)技術感興趣,Ilya Sutskever(OpenAI聯合創始人兼首席科學(xué)家)很重要,他堅信兩(liǎng)件事(shì)。

第一是模型架構。它要足夠深,隻要到了一定深度,bigness is betterness(大就是好(hǎo))。隻要有算力,隻要有數據,越大越好(hǎo)。他們一開(kāi)始是LSTM(long short term memory),後(hòu)來看到Transformer就用Transformer。



image.png

第二個OpenAI相信的是,任何範式、改變一切的範式永遠有個引擎,這(zhè)個引擎能(néng)不斷前進(jìn)、不斷産生價值。

這(zhè)個引擎基本是一個模型體系(model system),它的核心是模型架構Transformer,就是sequence model(序列模型):sequence in、sequence out、encode、decode後(hòu)者decode only。但最終的核心是GPT,也就是預訓練之後(hòu)的Transformer,它可以把信息高度壓縮。Ilya有個信念:如果你能(néng)高效壓縮信息,你一定已經(jīng)得到知識,不然你沒(méi)法壓縮信息。所以,你把信息高效壓縮的話,you got to have some knowledge(你得有一些知識)。

Ilya堅信GPT3、3. 5,當然GPT-4更是,它已經(jīng)有一個世界模型在裡(lǐ)面(miàn)。雖然你做的事(shì)是predict next word(預測下一個關鍵詞),這(zhè)隻不過(guò)是優化手段,它已經(jīng)表達了世界的信息,而且它能(néng)持續地提高模型能(néng)力,尤其是目前研究比較多的在子概念空間當中做泛化。知識圖譜真的不行。如果哪個同學(xué)做知識圖譜,我認真跟你講,你不要用知識圖譜。我自己也做知識圖譜20多年,just don’t do that。Just pretty bad。It does not work at all。You should use Transformer。(不要那樣(yàng)做。很糟糕。它根本不起(qǐ)作用。你應該使用Transformer。)

更重要的是用增強學(xué)習,加上人的反饋,與人的價值對(duì)齊。因爲GPT已經(jīng)做了4年多,知識已經(jīng)封裝在裡(lǐ)面(miàn)了,過(guò)去真的是用不起(qǐ)來,也很難用。

最大的是對(duì)齊(alignment engineering),尤其是instruction following和自然語言對(duì)齊。當然也可以跟代碼、表格、圖表對(duì)齊。

做大模型是很難的,很大難度是infra(基礎設施)。我在微軟的時候,我們每個服務器都(dōu)不用網卡,都(dōu)放了FPGA。網絡的IO的帶寬速度都(dōu)是無限帶寬技術(Infiniband),服務器和服務器之間是直接訪問内存。爲什麼(me)?因爲Transformer是密度模型,它不光是算力問題,對(duì)帶寬要求極高,你就想GPT-4需要24000張到25000張卡訓練,試想世界上多少人能(néng)做這(zhè)種(zhǒng)系統。所有數據、data center網絡架構都(dōu)不一樣(yàng)。它不是一個三層的架構,必須是東西向(xiàng)的網絡架構。所以這(zhè)裡(lǐ)要做大量的工作。

Token很重要。全世界可能(néng)有40-50個确定的token,就是語言的token和模态,現在有更多的token化。當然現在更多的模型的參數小型化、本地化,任務領域的專業知識可以融入這(zhè)些大模型當中。它的可操縱性主要是靠提示和調試,尤其是根據指令來調,或者對(duì)齊來調試,或者in-context learning(上下文學(xué)習),這(zhè)個已經(jīng)貫徹比較清晰了。它的可操作性是越來越強。可拓展性基本上也足夠。

加在一起(qǐ),這(zhè)個引擎并不完美。足夠好(hǎo)、足夠強的引擎,我沒(méi)從沒(méi)有過(guò)。

以上是引擎,拐點是怎麼(me)到的?ChatGPT能(néng)在曆史上第一次兩(liǎng)個月1億活躍用戶,擋都(dōu)擋不住,爲什麼(me)?

① 它封裝了世界上所有知識。

② 它有足夠強的學(xué)習和推理能(néng)力,GPT-3能(néng)力在高中生和大學(xué)生之間,GPT-4不光是進(jìn)斯坦福,而且是斯坦福排名很靠前的人。

③ 它的領域足夠寬,知識足夠深,又足夠好(hǎo)用。自然語言最大的突破是好(hǎo)用。擴展性也足夠好(hǎo)。當然還(hái)是很貴,像2萬多張卡,訓練幾個月這(zhè)麼(me)大的工程。不過(guò)也沒(méi)貴到那麼(me)離譜——Google可以做,微軟可以做,中國(guó)幾個大公司能(néng)做,創業公司融錢也能(néng)做。

加在一起(qǐ),範式的臨界點到了。拐點已經(jīng)到來。

稍微啰嗦幾句。我做自然語言20多年,原來的自然語言處理有14種(zhǒng)任務,我能(néng)夠把動詞找出來、名詞找出來、句子分析清楚。即使分析清楚,你知道(dào)這(zhè)是形容詞,這(zhè)是動詞,這(zhè)是名詞——那這(zhè)個名詞是包香煙?還(hái)是你的舅舅?還(hái)是一個墳墓?還(hái)是個電影?No idea(不知道(dào))。你需要的是知識。自然語言處理沒(méi)有知識永遠沒(méi)用。

The only way to make natural language work is you have knowledge(讓自然語言處理有效的唯一路徑是你有知識)。正好(hǎo)Transformer把這(zhè)麼(me)多知識壓縮在一起(qǐ)了,這(zhè)是它的最大突破。

未來是一個模型無處不在的時代

OpenAI未來2-3年要做的——模型更稀疏一點,現在它對(duì)帶寬要求實在太高,要把attention window拉長(cháng)一點,或者是recursion causality推理的功能(néng),包括brainstorming等一些工作要做。當然有一些grounding的東西,包括亞符号、子概念的都(dōu)可以做。更多的模态,更多的token空間,更多的模型穩定性,更多的潛在空間(例如Latent Space對(duì)齊),更多的計算,更多的基礎架構工具。2-3年基本排滿。也就是說,我們大概知道(dào)需要什麼(me)去把這(zhè)個引擎繼續做大。

不過(guò)這(zhè)個飛輪啓動,主要是資本大量進(jìn)來。美國(guó)2023年1月到3月,擋也擋不住,錢全進(jìn)去了,每個月都(dōu)在比上個月增長(cháng)。中國(guó)基本也一樣(yàng),商業模式、盈利模式有初步規模,基礎設施、平台應用、生态在加速開(kāi)發(fā),初創公司、大型企業都(dōu)在進(jìn)入。

當然社會的安全、監管,一大堆問題——現在這(zhè)些是OpenAI最頭痛的——Sam在美國(guó)花大量精力讓社會認可這(zhè)個技術。現在OpenAI核心做的是,把推進(jìn)速度變慢,每推進(jìn)新版本,都(dōu)有足夠時間讓用戶給他們足夠反饋,找到潛在風險點,有足夠時間彌補。但加在一起(qǐ),增長(cháng)飛輪的雛形基本上起(qǐ)來了。

有了飛輪,我認爲發(fā)展路徑核心是模型的可延伸性和未來模型的生态。是一個模型無處不在的時代。

未來的模型世界會怎麼(me)發(fā)展?首先是將(jiāng)有更多大模型會出來。更多更完整的模态和更完整的世界知識在這(zhè)裡(lǐ)。你有大量的知識、更多的模态,學(xué)習能(néng)力、泛化能(néng)力和泛化機制一定會加強。

此外,會有更多的對(duì)齊工作要做。OpenAI目前會關注什麼(me)呢?今天對(duì)齊基本上是做到,有一部分人能(néng)接受但你也得罪很多人,很多人每天罵GPT。他們想要做到是足夠寬的一個對(duì)齊,希望有個像美國(guó)憲章這(zhè)樣(yàng)一個結果,雖然ChatGPT不是大家都(dōu)能(néng)夠認可,但它足夠平穩、綜合,大部分人能(néng)接受,這(zhè)是對(duì)齊工程。自然語言也好(hǎo),代碼也好(hǎo),數學(xué)公式也好(hǎo),表單也好(hǎo),有大量對(duì)齊工作要做。

還(hái)有更多的模态對(duì)齊。這(zhè)裡(lǐ)先講human scale的模态,它主要是對(duì)人的描述,以人的語言爲主,它的模态目前是語言和圖形,以後(hòu)有更多的模态會接入。這(zhè)是大模型層面(miàn)。

在大模型之上建立的模型更多了。我判斷主要是有兩(liǎng)類模型和他們的組合。第一是事(shì)情的模型,人類每一類需求都(dōu)有領域/工作模型,其中有結構模型、流程模型、需求模型和任務模型,尤其是記憶和先驗。

第二,人的模型,包括認知/任務模型,它是個體的,其中有專業模型,有認知模型、運動模型和人的記憶先驗。人基本是這(zhè)幾類模型的組合,律師也好(hǎo),醫生也好(hǎo),大量領域會有大量模型往前走。

人的模型和學(xué)的模型有本質區别,這(zhè)是我過(guò)去1-2個月個人收獲較多的。

首先,人一直在建立模型。人的模型好(hǎo)處是泛化的時候更深、更專業,基本是用符号(例如數學(xué)公式)或結構(例如畫流程圖)。它具體用,說實話都(dōu)不好(hǎo)用。人的模型要麼(me)像物理公式解決很宏觀的問題,要麼(me)解決很微觀的問題。我們日常生活的問題,物理一點用都(dōu)沒(méi)有——沒(méi)法告訴我這(zhè)個樹的葉子的形狀,狗的貓的顔色爲什麼(me)是這(zhè)樣(yàng)子?沒(méi)有任何模型可以解這(zhè)個。很大問題是它的模型是靜态的,不會場景變化。

今天有很多模型,比方說數字孿生,很難用。因爲物理世界一直在變,這(zhè)個模型僵硬、不變,就用不起(qǐ)來。尤其是用知識圖譜建的模型,我做了幾十年,超級難算,函數結構差得一塌糊塗。所以人的模型有好(hǎo)處,專業性強,但有很大缺點。

學(xué)出來的模型,首先,它本質是場景化的,因爲它的token是場景化的。其次,它适應性很強,環境變了,token也變了,模型自然會随著(zhe)環境變;第三,它的泛化拓展性有大量理論工作要做,但是目前子概念空間的泛化,看來是很有潛在發(fā)展空間的這(zhè)樣(yàng)一種(zhǒng)模型的特性。它好(hǎo)用,因爲它可以對(duì)齊人的使用傾向(xiàng)或人的自然語言、表格等等。它的計算性内在是過(guò)程性的。這(zhè)裡(lǐ)有大的問題,就是人表達知識傾向(xiàng)運用結構,但真正能(néng)解決問題的是過(guò)程,人不适合用過(guò)程來表達。

ChatGPT代表的模型跟人的模型相輔相成(chéng),長(cháng)期可以融在一起(qǐ)。我們看到的未來是更多模型的生态,新的領域、新的專業、新的結構、新的場景、新的适應能(néng)力,形成(chéng)閉環,不斷加強認知和推理能(néng)力。當然,最終還(hái)是要所謂叫(jiào)grounding,跟感知要ground,和接入行動的能(néng)力,形成(chéng)真正的智能(néng)。

某種(zhǒng)意義上20-30年後(hòu),這(zhè)個模型世界跟生物世界有很多類似的地方。大模型我覺得像基因,有不同的種(zhǒng)類,然後(hòu)進(jìn)化。我們目前能(néng)看到未來核心技術模型世界,它是用這(zhè)個方法來向(xiàng)前驅動。

我們基本對(duì)這(zhè)個時代的範式有了結構性的理解。那麼(me)接下來,我們如何擁抱這(zhè)個時代?

對(duì)每個人、每個行業都(dōu)有結構性影響

我個人過(guò)去10個月,每天看東西是挺多的,但最近實在受不了。就真的是跟不上。發(fā)展速度非常非常快。最近我們開(kāi)始發(fā)行“大模型日報”,是我實在不行了,論文實在是跟不上,代碼實在是跟不上——just too much(太多了)

世界在嘩嘩嘩地變。我曾經(jīng)說1995-1996年有這(zhè)種(zhǒng)感覺,但這(zhè)個比1995-1996年還(hái)要強。爲什麼(me)?模型的成(chéng)本從邊際轉向(xiàng)固定,知識創造就是模型和知識的獲取,它結構性做演變了。

生産資本從兩(liǎng)個層次全面(miàn)提高。第一,所有動腦筋的工作,可以降低成(chéng)本、提升産能(néng)。我們目前有一個基本假設,碼農成(chéng)本會降低,但對(duì)碼農的需求會大量增加,碼農不用擔心。因爲對(duì)軟件的需求會大量增加,就是這(zhè)個東西便宜了,都(dōu)買嘛。軟件永遠可以解決更多問題,但有些行業未必。這(zhè)是生産資本的廣泛提高。

第二,生産資本深層提升。有一些行業的生産資本本質是模型驅動,比如醫療就是一個模型行業,一個好(hǎo)醫生是一個好(hǎo)模型,一個好(hǎo)護士是一種(zhǒng)好(hǎo)模型。醫療這(zhè)種(zhǒng)産業,本質是強模型驅動。現在模型提高了,科學(xué)也随之提高。在遊戲核心産業,我們的産能(néng)將(jiāng)本質性、深度提高。産業的發(fā)展速度會加快,因爲科學(xué)的發(fā)展速度加快了,開(kāi)發(fā)的速度加快了,每個行業的心跳都(dōu)會加快。因此,我們認爲下個拐點會加速。用大模型做機器人、自動化、自動駕駛,擋也擋不住。

它對(duì)每個人都(dōu)將(jiāng)産生深遠和系統性影響。我們的假設是每個人很快將(jiāng)有副駕駛員,不光是1個,可能(néng)5個、6個。有些副駕駛員足夠強,變成(chéng)正駕駛員,他自動可以去幫你做事(shì)。更長(cháng)期,我們每個人都(dōu)有一個駕駛員團隊服務。未來的人類組織是真人,加上他的副駕駛員和真駕駛員一起(qǐ)協同。

毫無疑問,每個行業也會有結構性影響,會系統性重組。這(zhè)裡(lǐ)有一個簡單公式。今天動腦筋的人一天平均工資多少小時?減掉ChatGPT現在大概平均是15美元/小時,再過(guò)3年可能(néng)不到1美元,再過(guò)5年可能(néng)幾十美分。然後(hòu)就乘一下有多少數量。降本或者增效,讓碼農能(néng)變成(chéng)super碼農,醫生變成(chéng)super醫生。

大家可以按這(zhè)個公式算一算。如果你是華爾街的對(duì)沖基金,你可以做空一大堆行業。

舉個簡單例子,律師在美國(guó)平均1500美元/小時,我在網上已經(jīng)看到每天有這(zhè)種(zhǒng)信息——如果你想離婚,不要找離婚律師,ChatGPT離婚很便宜啊!(全場笑)

開(kāi)發(fā)人員、設計師、碼農、研究人員都(dōu)一樣(yàng),有些是更多需求,有些是成(chéng)本下降。尤其是核心産業,科學(xué)、教育、醫療,這(zhè)是OpenAI長(cháng)期最關注的3個行業,也是整個社會最根本的。

尤其是醫療。在中國(guó),需求遠遠大于供給。而且,中國(guó)是大政府驅動的市場經(jīng)濟,政府可以扮演更大角色,因爲固定成(chéng)本政府可以承擔。

最爲重要的是教育。如果你是大學(xué),你第一擔心的是,考試怎麼(me)考?沒(méi)法考了。他一問ChatGPT,什麼(me)都(dōu)知道(dào)。更重要的是,以後(hòu)怎麼(me)定義是好(hǎo)的大學(xué)生呢?假定說有個大學(xué)生什麼(me)都(dōu)不懂,物理也不懂、化學(xué)也不懂,但他懂怎麼(me)問ChatGPT,他算不算一個好(hǎo)的大學(xué)生?機會與挑戰并存。

總結一下,整個這(zhè)個時代在高速地進(jìn)行,速度越來越快。它是結構上決定的。勢不可擋。

大模型的淘金時代

對(duì)機會點進(jìn)行結構性拆解

現在,我給大家一個結構化思維框架。某種(zhǒng)意義上你可以對(duì)号入座,知道(dào)我在這(zhè)裡(lǐ),我怎麼(me)思考今天的機會點。

image.png

這(zhè)張圖是整個人類技術驅動的創業創新,所有事(shì)情的機會都(dōu)在這(zhè)張圖上。

首先,底層是數字化的技術,因爲數字化是人的延伸。數字化的基礎裡(lǐ)有平台,有發(fā)展基礎,包括開(kāi)源的代碼、開(kāi)源的設計、開(kāi)源的數據;平台有前端、後(hòu)端等。這(zhè)裡(lǐ)有大量機會。

第二,波是用數字化的能(néng)力去解決人的需求。我們把數字化應用完整放在這(zhè)張表上。

1)C端,是把所有的人分成(chéng)人群,每種(zhǒng)人群24小時,他花時間幹什麼(me)?有通訊、社交、内容、遊戲消費、旅遊、健身……C端有一類特殊的人,這(zhè)類人是改變世界的,是碼農、設計師、研究員。他們創造未來。微軟這(zhè)麼(me)大的公司,是基于一個簡單理念:微軟我們就是要寫更多軟件、幫别人寫更多軟件,因爲寫軟件是未來。

2)B端,企業需求也一樣(yàng),降本增效。它要生産,有供應鏈、銷售、客服……有了這(zhè)些需求之後(hòu),數字化看得見的體驗結構有6種(zhǒng):給你信息的,二維就夠;給你三維交互體驗,在遊戲、元宇宙;人和人之間抽象的關系,包括信任關系、Web 3;人在物理世界環中自動駕駛、機器人等;人的内在的用碳機植入到裡(lǐ)面(miàn),今天是腦機接口,以後(hòu)有更多,以後(hòu)是可以用矽基;最後(hòu)是給你模型。

最後(hòu),人類是挺奇怪的物種(zhǒng),不光要滿足這(zhè)些需求,還(hái)要改變世界,我們在滿足世界時,也要獲得更多能(néng)源,所以需要有能(néng)源科技;需要轉化能(néng)源,用生命科學(xué)的形式,biological process轉化能(néng)源或者使用mechanical process,材料結構來轉化能(néng)源,或者是新的空間。這(zhè)是第三波。

所以創業公司基本上有三類:數字化基礎,用數字化去解決人的需求,去改變物理世界。有了這(zhè)個大的框架,我們可以系統性地來看對(duì)号入座:我在哪個位置?如果我在這(zhè)個位置,需要關注哪些點?

image.png


首先講數字化基礎,它有一個穩定結構,不管再怎麼(me)發(fā)展,結構永遠是這(zhè)樣(yàng)。過(guò)去30多年,大部分系統或多或少我都(dōu)碰過(guò),這(zhè)個結構确實相當穩定。

核心是前端和後(hòu)端——前端是完整可延伸的體驗,後(hòu)端是完整可延伸的能(néng)力,有設備端,比方說電腦、手機、眼鏡、汽車等等,設備端裡(lǐ)面(miàn)是芯片、模組加上操作系統。萬億美元的公司都(dōu)在這(zhè)一層。

其次是體驗的容器,二維的容器,三維的容器,内在嵌入的容器。

容器之上,寫代碼都(dōu)知道(dào)畫布,畫布可以是文檔,可以是聊天,可以是代碼,可以是空間,可以是世界,可以是數字人,也可以是碳基裡(lǐ)的蛋白質等等。這(zhè)是前端。

後(hòu)端也一樣(yàng),底層式設備,服務器、交換機、數據中心等等,也是芯片、模組、操作系統。

中間這(zhè)一層非常重要,網絡數據堆棧,分布式系統,區塊鏈等等。

最上面(miàn)是雲,是能(néng)力的供給。能(néng)力供給像自然水源,打開(kāi)就是算力,有存儲和通訊能(néng)力。今天的模型時代,打開(kāi)就是模型。

下面(miàn)是數字化基礎。符号計算,或者所謂的深度學(xué)習,疊加向(xiàng)量的浮點計算,矽基的,碳基的。

如果你是這(zhè)裡(lǐ)的創業者,機會點在哪裡(lǐ)?

image.png


① 首先搬運信息,這(zhè)個時代還(hái)有很多可以做。

② 如果你是做模型的,我現在判斷什麼(me)都(dōu)要重做一遍。大模型爲先。很多設備也要重做,你要支持大模型,容器要重做,這(zhè)些都(dōu)有機會。雲、中間的基礎設施、底層的硬件,包括數字化發(fā)展核心的基礎,尤其是開(kāi)源的體系,這(zhè)裡(lǐ)是真正意義上是有大量機會。

③ 第三代系統,即已經(jīng)開(kāi)始做機器人、自動化、自主系統。孫正義今天all in。這(zhè)個也能(néng)用大模型做。馬斯克也看到這(zhè)種(zhǒng)機會。都(dōu)是在第三代下一個拐點,創業公司完全可以把握的機會。

④ 同時并行的,我把它稱作“第三代++系統”,是碳基的生物計算,這(zhè)一類公司有大量的量子計算,有很多機會。元宇宙和Web 3今天點冷,但從曆史長(cháng)河角度來講,隻是時間問題,因爲這(zhè)些技術都(dōu)能(néng)真正意義上帶來未來的人類價值。

所以如果是這(zhè)個創業項目,基礎層機會就在這(zhè)裡(lǐ)。這(zhè)是最好(hǎo)的生意。爲什麼(me)?這(zhè)個時代跟淘金時代很像。如果你那個時候去加州淘金,一大堆人會死掉,但是賣勺子的人、賣鏟子的人永遠可以賺錢。所謂的shove and pick business。

大模型是平台型機會。按照我們幾天的判斷,以模型爲先的平台,將(jiāng)比以信息爲先的平台體量更大。平台有以下幾個特征:

① 它是開(kāi)箱即用;

② 要有一個足夠簡單和好(hǎo)的商業模式,平台是開(kāi)發(fā)者可以活在上面(miàn),可以賺足夠的錢、養活自己,不然不叫(jiào)平台;

③ 他有自己殺手級應用。ChatGPT本身是個殺手應用,今天平台公司就是你在蘋果生态上,你做得再好(hǎo),隻要做大蘋果就把你沒(méi)收了,因爲它要用你底層的東西,所以你是平台。平台一般都(dōu)有它的錨點,有很強的支撐點,長(cháng)期OpenAI設備機會有很多——有可能(néng)這(zhè)是曆史上第一個10萬億美元的公司。

這(zhè)是一場激烈的競争平台之戰,未來一個體量很大的公司。在這(zhè)個領域競争是無比激烈。The price is too big(代價實在太大),錯過(guò)太可惜。再怎麼(me)也得試一試。

今天的模型魯棒性、脆弱性,還(hái)是問題。用這(zhè)個模型,你一定要一開(kāi)始稍微窄一點,限制要嚴一點,這(zhè)樣(yàng)的話體驗是穩定的,等到模型能(néng)力越來越強再把它放寬,找到适當的場景,循序漸進(jìn)。質量和寬度之間的平衡很重要。另外發(fā)展路徑上,你要考慮今天産品要不要在這(zhè)個上基礎上改,重啓爐竈,還(hái)是齊頭并進(jìn)。把這(zhè)個團隊給改了、重做,還(hái)到外面(miàn)去買公司?

創新,尤其是創業公司落地,它永遠是技術推動和需求拉動的組合。在落地的過(guò)程中,對(duì)需求理解的把控,掌握和滿足需求的方法是一切當中最重要。長(cháng)期一定是技術驅動爲主,但在落地的時候對(duì)需求的拆解、分析、梳理,把控好(hǎo)需求,是一切的一切。

有一個機密大家今天都(dōu)知道(dào)了——OpenAI是用GPT-4做GPT-5,每個碼農都(dōu)是放大能(néng)力的碼農。它規模效應不一樣(yàng),馬太效應不一樣(yàng),從此壁壘和競争格局不一樣(yàng),知識産權結果不一樣(yàng),國(guó)際化的格局也不一樣(yàng)。中國(guó)顯然有機會。

我對(duì)創業者有幾點建議

創業公司的内在結構是人和事(shì)的組合。人,一開(kāi)始是創始人/創始團隊;他有初心,内在驅動力、外在驅動力;他能(néng)獨立思考,判斷未來;他能(néng)行動導向(xiàng),解決問題;他能(néng)需求導向(xiàng),找到價值;最終通過(guò)溝通獲得資源。接下來是産品市場匹配,這(zhè)部分就是研發(fā)技術、研發(fā)産品、交付産品。商業模式是收到錢、更多增長(cháng)、觸達更多客戶、融更多錢、一直觸達到未來的價值。組織上,通過(guò)系統建設,開(kāi)拓面(miàn)向(xiàng)未來的人才、組織結構和文化價值觀等等。這(zhè)一切就是一家公司的總和。


image.png


我們對(duì)每位同學(xué)的建議是,不要輕舉妄動,首先要思考。

① 不要浮誇,不能(néng)蹭熱。我個人最反對(duì)蹭熱,你要做大模型,想好(hǎo)到底做什麼(me),大模型真正是怎麼(me)回事(shì),跟你的創業方向(xiàng)在哪個或哪幾個維度有本質關系。蹭熱是最不好(hǎo)的行爲,會浪費機會。

② 在這(zhè)個階段要勤于學(xué)習。新範式有多個維度,有蠻大複雜性,該看到的論文要看,尤其現在發(fā)展實在太快,非确定性很大。我的判斷都(dōu)有一定灰度,不能(néng)說看得很清楚,但大緻是看到是這(zhè)樣(yàng)的結果。學(xué)習花時間,我強烈推薦。

③ 想清楚之後(hòu)要行動導向(xiàng),要果斷、有規劃地采取行動。如果這(zhè)一次變革對(duì)你所在的産業帶來結構性影響,不進(jìn)則退。你不往前走沒(méi)退路的,今天的位置守不住。如果你所在的産業被(bèi)直接影響到,你隻能(néng)采取行動。

接下來我想講幾個維度——每個公司是一組能(néng)力的組合。

① 産品開(kāi)發(fā)能(néng)力方面(miàn),如果你的公司以軟件爲主,毫無疑問一定對(duì)你有影響,長(cháng)期影響大得不得了。尤其是如果你是做C端,用戶體驗的設計一定有影響,你今天就要認真考慮未來怎麼(me)辦。

② 如果你的公司是自己研發(fā)技術,短期有局部和間接影響,它可以幫助你思考技術的設計。長(cháng)期核心技術的研發(fā)也會受影響。今天芯片的設計是大量的工具,以後(hòu)大模型一定會影響芯片研發(fā)。類似的,蛋白質是蛋白質結構設計。不管你做什麼(me),未來的技術它都(dōu)影響。短期不直接影響,長(cháng)期可能(néng)有重大影響。

③ 滿足需求能(néng)力,滿足需求基本就要觸達用戶,供應鏈或運維一定受影響。軟件的運維可以用GPT幫你做,硬件的供應鏈未必。長(cháng)期來看有變革機會,因爲上下遊結構會變。你要判斷你在這(zhè)個産業的結構會不會變。

④ 商業價值的探索、觸達用戶、融資,這(zhè)一切它可以幫你思考、叠代。

1683682143048.png


最後(hòu)是關于人才和組織。

① 首先講創始人。今天創始人技術能(néng)力強,好(hǎo)像很牛、很重要,未來真的不重要。技術ChatGPT以後(hòu)都(dōu)能(néng)幫你做。你作爲創始人,越來越重要、越來越值錢的是願力和心力。願力是對(duì)于未來的獨到的判斷和信念,堅持、有強的韌勁。這(zhè)是未來的創始人越來越重要的核心素養。

② 對(duì)初創團隊,工具能(néng)幫助探索方向(xiàng),加速想法的叠代、産品的叠代,甚至資源獲取。

③ 對(duì)未來人才的培養,一方面(miàn)學(xué)習工具,思考和探索機會,長(cháng)期适當時候培養自己的prompt engineer(提示工程師)。

④ 最後(hòu)講到組織文化建設,要更深入思考,及早做準備,把握時代的機會。尤其是考慮有很多職能(néng)已經(jīng)有副駕駛員,寫代碼也好(hǎo),做設計也好(hǎo),這(zhè)之間怎麼(me)協同?

我們面(miàn)臨這(zhè)樣(yàng)一個時代的機會。它既是機會,也是挑戰。我們建議你就這(zhè)個機會做全方位思考。

OA系統 學(xué)習平台 科投社區
返回頂部
給我留言

驗證碼:

看不清換一張