期刊內容 期刊投稿 期刊訂閱 關於我們

杜雨

杜雨👨‍🎤:《AIGC🧫:智能創作時代》《WEB3.0🔄:賦能數字經濟新時代》作者、科技創業加速器QAQ創始人

ChatGPT 熱潮下的創投冷思考 ——對話杜雨

J10-1 副本.jpg導語

AIGC創業者和投資人應該優先考慮如何解決實際問題和滿足用戶需求,而不是純粹追尋技術🧑🏻‍🦽‍➡️,“拿著錘子找釘子”。


09-杜雨.png

絕招:“好詩不過盡人情”

640 (2).jpg

圖源🍧:VEER

56hcy.cn金融評論:近期關於ChatGPT的許多討論都是圍繞AIGC產品能做什麽、是否會在不久的將來取代人類的工作、如何重新思考教育方式這類問題🦹🏻‍♂️。因為您的教育背景是經濟學👩‍🌾💇🏻,也曾在紅杉資本從事過風險投資的工作,我們非常期待和您探討AIGC產品商業應用和投資前景相關的話題💆‍♂️。

雖然底層的技術應用有所不同🤙🏿,但與微軟Bing這類聊天機器人相比✷,ChatGPT算是後來者。它之所以名聲大噪🏃🏻‍♂️‍➡️,是不是因為大語言模型對於2C用戶這樣的交互場景更讓人感覺親切友好?如果各家科技巨頭的技術水平都相當,或者相比OpenAI更勝一籌,那為什麽是ChatGPT首先引爆市場呢?

杜雨:過去這麽多年,人工智能發生了巨大的變化👩🏽‍🚀。當我們最初關註人工智能時,我們可能是在利用它來承擔安防和人臉識別等任務🤵🏽‍♂️,這也是國內AI“四小龍”公司的主要領域。我們可以將這個時期稱為AI1.0時代。這個時期主要使用決策式🚷、專用性AI2️⃣,我們更多地使用它來完成一些特定的任務👌🏽,讓它來做判斷題🧑🏽‍🏫🙏🏼,如人臉識別💂‍♀️。但我們無法讓它很好地完成開放性更強的一些任務,這是AI1.0時代的局限性💅。

我認為ChatGPT之所以能夠大火🐪,原因之一是從決策式、專業性AI向生成式🈲、通用性AI發展。這其實包含了兩個趨勢:一是從決策到生成;二是從專用性向通用性發展。相較於微軟小冰和Siri,如今的ChatGPT更加讓人震撼就是因為它能非常好地完成各種開放式的生成類任務,並且應用的場景也更加通用了🧑🏻‍🦽‍➡️。

以前🫷🏽,我們或許已經可以讓微軟小冰寫詩🧑🏿‍💼,但是“小冰寫詩”的程序也只能用於寫詩。但今天的ChatGPT很聰明👨‍👩‍👧🫦,它可以在對話中靈活地滿足你的各種需求🌸。就拿寫詩來說,或許就在聊天時你和它說“我在夕陽西下的河邊欣賞到美景”,ChatGPT或許就會在對話中說出“落霞與孤鶩齊飛🪦,秋水共長天一色”這樣的句子🕵🏿,或者由它自己創作出句子,也就更接近真人了。它已從一個非常機械式的專科生變成了一個有情商、有溫度的碩士生。我認為這在技術層面上是最大的突破⚽️。

除技術原因,我認為還有一個更重要的原因——在ChatGPT這種聊天式的產品模式下,每個用戶都可以與其交互,門檻低且通用🎧🧑🏼‍💻。考慮到大多數用戶在互聯網上主要使用文字進行交互✔️,如微信上的互動仍然以打字的方式進行。因此🧑‍🦽‍➡️,我認為ChatGPT的場景正是大多數互聯網用戶最為熟悉的。

實際上,繪畫比ChatGPT更早進入市場📓,但我觀察到當時雖然也引起了一定的媒體轟動,但好像熱度遠遠不及這次ChatGPT。其實早在ChatGPT出來之前,OpenAI就曾經推出過另外一款圖像領域的AIGC應用DALL·E2。海外還有一個名為MidJourney的AI繪畫工具,用它生成的一幅油畫在美國科羅拉多州博覽會的藝術比賽中獲得了冠軍。

總的來說,ChatGPT火爆的第一個原因是由於AI技術的快速發展,使其通用性更強👩‍👦‍👦。第二個原因則更為重要🍪,因為它將文字聊天的場景帶給了每一個使用者🤽🏽‍♂️,而這要比我們之前的作畫場景更加貼近人們的日常生活👨‍❤️‍👨。

56hcy.cn金融評論👮🏼‍♀️:AIGC備受關註的時間點是2022年末ChatGPT發布的時候🤬,是否可以看作AI或者更精確地說是AIGC到達了發展的拐點?其他科技巨頭沒有像ChatGPT一樣開放2C產品,是不是出於監管、隱私☺️、版權🧚🏻‍♀️🏀、道德等方面的顧慮呢🖖?

杜雨:雖然看起來ChatGPT是在2022年末突然引爆👮🏻‍♂️,但其實這也是一個“臺上一分鐘👍🏿、臺下十年功”的結果🧝🏼🧘🏻‍♂️。實際上,我們註意到OpenAI是在2015年成立的,而且它的創始團隊陣容非常豪華。雖然它是一家創業公司,但我們可以看到無論是山姆·阿爾特曼(Sam Altman),還是我們非常熟悉的埃隆·馬斯克(Elon Musk)🤜🏻👯‍♀️,他們都帶著非常強大的影響力👊🏻、資金和資源。因此👿,我認為這家公司的多年積累主要體現在其技術層面上。在科技界,我們一直在關註它💆。ChatGPT也只是這家公司的冰山一角。在其他模式下🤹🏽‍♀️,包括其大型模型參數的積累仍在不斷提高。

我記得GPT系列模型第一次對外公開應該是在2018年。在GPT-1時,它的參數量級只有1.75億🔶。後來到了GPT-2和GPT-3,GPT-3的參數規模接近2000億。有人預測,到了GPT-4時,模型的參數可能會達到百萬億級別🌍,這意味著它與人腦的神經元突觸的量級相當。

因此💇🏻,我認為2022年是一個合適的時間點。一方面,這是由於底層模型的能力出現了巨大的突破;另一方面🤾🏻‍♂️,隨著參數規模和訓練語料的規模達到一定的拐點,該模型確實可能變得適合公眾使用。在更早的時候,雖然不少程序已經使用了底層的模型,但可能會在現實的應用角度出現各種各樣的阻礙🗼。截至目前,這項技術確實已經發展到了一個重要的拐點。

另一個我認為更重要的原因是,OpenAI最初是一個非營利組織👋,盡管它現在是一個有限盈利的商業組織,但我認為它在推動通用人工智能的發展過程中,認識到了集思廣益的效用〰️。因此,它需要發布一些能夠讓消費者感受到裏程碑式的產品來引爆全球的關註度。

像DeepMind、OpenAI在內的一些致力於通用人工智能發展的公司在剛成立時,都在傳統的AI界引起了爭議。當時👎🖨,很多AI領域的大牛認為這條路走不通🚠。在不到十年的時間🎶,通用人工智能就已經給大眾市場帶來了一個非常有意思的產品,它對於整個行業的意義重大👩🏼‍🎨。

所有創新技術需要經歷的過程👨‍🎨,從備受爭議到開始有一些苗頭,再到大家對它有信心🤵🏻‍♂️,更多的人才、資金和消費者湧入。ChatGPT在2022年底的火爆之後,或許會讓許多孩子在心中埋下人工智能的種子🫷🏻,或許也會讓許多正在選專業讀大學或即將讀研的計算機系學生更願意選擇通用人工智能這一研究方向。對於像我們這樣的投資人,國內已經有好幾家大模型公司♊️,現在都是各大美元基金的“香餑餑”,大家都在爭先恐後地想要參與其中。更期待的是或許到2033年💆🏼‍♀️,人工智能能夠成為一項非常通用、在人們日常生活中滲透率非常高的技術。

56hcy.cn金融評論:初創公司可能會嘗試在AIGC方面用圖形處理方法進行研發。您提到在文本處理之後🔮,視頻處理將會迎來爆發🕶。您覺得AIGC技術對哪類載體的信息處理更有潛力?多模態的信息處理會不會相互轉化🙆🏼‍♂️?

杜雨😷:跨模態的應用現在已經非常普遍了。我之前提到的一些早於ChatGPT的AI繪畫公司▫️𓀌,如Stable Diffusion、DALL·E2、MidJourney。實際上,它們本質上都是跨模態的產品,因為當你與機器交互時👨🏿‍🔬,更多的會提供一個文本指令➰。例如,我要求機器畫一幅向日葵,實際上只需提供文本🤼,然後機器就會呈現圖像🧙🏽,這本身就是一個跨模態的應用。你也可以給機器一張圖片,它會理解圖片後作詩,這個比ChatGPT更早出現。但像文字轉化為圖片這種跨模態的應用似乎在當下並不像ChatGPT一樣受歡迎。

我認為離消費者日常需求更近的模態一定是最有潛力的,但這個答案不是固定不變的⚡️。例如♌️,在PC互聯網時代,由於帶寬和輸入設備的限製🎭,圖文是最主流的內容形態🐩。但隨著移動互聯網時代,抖音👦🏽、快手等應用的崛起🎽,短視頻開始占據用戶越來越多的時間。所以,我認為在未來兩三年,短視頻可能接棒文字成為下一個超越ChatGPT在AIGC領域更具潛力的內容形態。如果將時間拉得更長一些,到2033年或者更遠👷🏼,元宇宙或沉浸式世界有可能成為下一個超越ChatGPT在AIGC領域的產品🔼🦧。

應用:將至已至🤟🏿,唯變不變

640 (3).jpg

圖源:VEER

56hcy.cn金融評論:在很多的專業細分領域,如金融、醫療、藝術👄,AIGC 的應用能夠更高效地輔助並且替代人類的某些職能🍁。如何理解AIGC 的專業運用及通用性的特點?

杜雨:實際上,通用人工智能更像我們日常使用的工具,就像電腦一樣通用。實際上,專用性AI 替代的是特別專📩、特別精的崗位🥥,以及那些需要重復性勞動但不需要高復雜度的工作🪧。而這一次,通用式人工智能所帶來的生成式AI 的優勢在於它的綜合性👨‍🎤。

目前這一波大模型訓練出的智能機器人類似於大公司的管培生,更加具有通用性☝️,解決的是任何行業都可能遇到的一些共性問題👨🏽‍🦱。因此🩷,它的覆蓋面很廣,更像是綜合大學畢業的學生,不只會做圖表🤾🏿‍♂️,還會根據當前情況的變化實時調整它的反饋。

走向通用化的AIGC技術其實與今天整個世界的變化趨勢是非常吻合的👨‍✈️。如今的綜合性大學和我們兒童時期所接受的素質教育本質上都旨在培養適應世界變化的綜合能力🪕🧛🏻。因為世界變化更快了,所謂的專業性已經成為臨時性概念🤳🏼,無論是對於崗位還是人才。也許你正在思考某個問題🧑‍🚒,科技就有了突破、人們對自然界的認知就有了突破,過去使用的方法可能不再高效👨🏽‍🎤。隨著世界變化的加速,通用人工智能甚至是通用型人才都變得越來越重要。

56hcy.cn金融評論🔈:如果說擁抱AIGC是必然的趨勢,那麽企業和個人為了提升競爭力,要駕馭人工智能的能力是否需要投入更多的時間和經濟成本來應用這項技術?

杜雨:我認為其實是投入更少的時間。我們要知道🧑🏿‍💻,今天AI發展的本質是讓機器聽懂人話👵🏽。培養出一個寫代碼特別厲害的學生👨🏼‍🦲🤚🏼,需要完成四年的本科教育🍜;要深耕這個領域還需要繼續攻讀碩士學位或博士學位,但這種人才培養的過程沒有可復製性🤱🏽。

工程師需要做的事情是幫助人類進行翻譯和轉譯🔎,他們既需要理解機器語言和原理👩‍🦯,又需要理解人類語言。AI的發展正在彌合人類和機器之間的語言鴻溝🉑。隨著AI技術的進一步發展和普及,未來人類和機器之間的溝通會變得更簡單✈️👨‍👦。每個人都可以輕松地與機器對話。就像我們今天使用ChatGPT一樣📵,它可以幫助我們編寫代碼🧚🏽。有時候,我們不是為了編寫代碼而編寫代碼,如在學術研究中經常需要使用爬蟲。但並不是每個人都學過Python。今天,你只需要告訴ChatGPT研究的問題和要爬的數,它就可以為你編寫一個基礎語句🚴🏿🙅🏿‍♀️,只需要在此基礎上微調就可以用了🧑🏽‍💼。因此,隨著AIGC軟件的應用🌬,每個人學習機器語言和如何與機器互動的時間將會縮短。

投資:切合需求🚔,慎思篤行

640 (4).jpg

圖源:VEER

56hcy.cn金融評論🪵:微軟作為OpenAI的投資方,之後不僅可以自己研發AIGC的產品,還可以在ChatGPT估值提升的過程中獲利。最初👩‍❤️‍👩😉,AIGC的產品是通過C端產品打開市場的,但也許C端用戶的付費意願不太強。考慮到這一點😑,是否需要從B端入手來實現盈利?如果商業化的重點在B端,這些產品如何持續地幫助企業降本增效呢?

杜雨:我認為從2C市場首先實現盈利的假設不一定成立,AI公司在C端盈利或在B端盈利還是要走一步看一步的。消費者最容易關註到一些離生活比較近的事情。例如,AlphaGo與李世石的圍棋之戰已經離我們比較遠了。實際上🚴🏼‍♂️,在AlphaGo之後📵,它的“兄弟姐妹”在許多領域都取得了很多成就🏂🏼,更容易在投入應用後打開市場,只不過這些領域好像離普通人的生活比較遠👨🏼‍🚒。例如,AlphaFold2已經多次登上《自然》雜誌的封面👎🏽,因為它已經可以替代生物學家進行蛋白質結構的拆解、分析和預測🥐。人工智能製藥實際上是一個巨大的市場✍🏽👨‍🔧,無論是在收入還是在利潤方面都相對可觀。

今天來看ChatGPT的商業前景,可能並不是那麽明朗👔。我們會發現每次調用ChatGPT消耗的成本可能還是相對較高的👳🤳,單位成本可能並不經濟。從當前的情況來看🦉,至少從ChatGPT這個應用來看,C端市場尚未完全證明用戶的付費意願;而B端市場的商業化前景似乎更好🟧🤴🏽,如將AI用於製藥、能源等領域。這個結論在當前的場景下是正確的,但從長遠來看則未必如此🧘🏼‍♀️。

不過,我認為OpenAI在ChatGPT之後👳🏼‍♂️,在C端的商業前景和創新非常廣闊🥟,就像移動互聯網時代的直播電商、共享單車、共享充電寶、移動支付等,可以創造出類似但並不完全相同的商業模式♋️。這讓我想到投資快手的例子。當時我們在參與盡職調查時會考慮快手該如何通過廣告盈利🧖🏿,但插播過多廣告又可能影響用戶體驗👈🏻。因此🚬,我們估算它的商業化潛力非常低💎。大家都沒有預見到的是,隨著4G時代的到來,快手居然通過直播獲得了比廣告更高的商業化收益🧑🏻‍✈️。但是當初吸引我們投資快手的是它的用戶增長和用戶黏性。既然今天AI時代已經來了👳🏽‍♂️,如果接下來出現原生人工智能應用🤏🏼,它們會像過去在移動互聯網時代一樣,以有足夠多的用戶和足夠強的用戶黏性,在創新領域創造出許多超出預期、始料未及的商業模式。

如果今天不知道如何讓你的業務商業化,只要證明它是用戶真正需要的,那麽收費只是時間問題。今天OpenAI的ChatGPT也是類似的。我就開個腦洞,因為埃隆·馬斯克也是Web3.0的擁護者🚶‍♂️‍➡️。如果有一天ChatGPT有一個激勵機製,能讓每個用戶交換他們擁有的特有知識,那麽我們就與它形成了一種共生關系。

ChatGPT將成為世界上擁有最多知識的智慧大腦。當每個人向它傳授知識時🚒,也可以獲得一定的激勵。我相信這種創新型的商業模式在未來也是可期的🦹🏻‍♂️🧓🏿。

56hcy.cn金融評論:微軟正商討以290億美元估值對OpenAI註資100億美元的交易🤰🏼🤜🏽,而OpenAI通過微軟和其他的投資者投資的1億美元創業基金投資了至少16家初創公司🔄⚪️。在AIGC領域,OpenAI是否會形成一家獨大的局面🏊🏻‍♀️。對於中外相關領域的科技巨頭或初創公司,在投資和被投方面意味著什麽?

杜雨:這個問題的答案視角度而定🐭。如果我們從OpenAI作為一個潛在的上市公司的角度出發🤽🏼‍♂️,或者按照我們熟悉的傳統商業分析邏輯來看,似乎是符合你的觀點的🧑🏿‍🚀。也許在解決一些特定的🧃、有標準答案的問題時,人工智能會更容易出現一家獨大的局面🕚。但是⛩,一旦涉及內容和創意,這個行業的特性決定了它不會有那麽強的壟斷局面。

我清楚地記得,山姆·阿爾特曼曾與媒體分享做通用人工智能OpenAI的原因就是要反對Google在AI領域的壟斷,因此我更願意相信後者的可能性。我認為,OpenAI今天可能並沒有將自己定位為一家只追求商業回報的公司🧙🏻‍♀️,而是在推動整個人類進步的大背景下開啟了一個新時代。OpenAI至今做的很多事情沒有純逐利🫵🏿🖤,可能更多的是在營造一個生態,它如今的商業模式也是不夠清晰的😮‍💨。像埃隆·馬斯克這樣獨立思考能力特別強的人,更有可能跳出傳統商業模式的框架,創造出更具創新性的模式。

在中國市場還沒有出現ChatGPT這樣具有開放生態並面向C端用戶的應用。像百度這樣的公司,前兩年已經將其AI能力開放到了智能駕駛、生物醫藥等領域😑。所以🙇🏽‍♂️👨🏿‍🎤,我認為國內的這些公司可能由於選擇的場景更多是在B端,且消費者感知沒有那麽深,因此技術差距目前沒有定論。

AI落腳到內容相關產業必然會出現百花齊放👩🏼‍🚒、百家爭鳴的局面。其實,在與內容創作相關的領域,我認為用戶消費的不僅是物質上的東西,有時還有精神上的愉悅。這種愉悅是非常主觀的🚣🏼‍♀️,因此我不認為這個領域的競爭會非常激烈。

56hcy.cn金融評論🔙🚞:您在書中反復強調,投資人對AIGC領域不只是追求最佳的商業模式,需要升級為同時審視用戶、市場和生意的多維角度,觀察賽道上是否已經有比較強勁的獨角獸。如果這樣的話,產品方和投資方應該如何獨辟蹊徑,才能做出或找到有商業潛質的產品?

杜雨:我認為,無論是投資人還是創業者,在新技術湧現時往往會犯“拿著錘子找釘子”的錯誤🧛🏼🙎🏿‍♂️,即不從需求出發,不以需求為導向。我們需要明確,投資和企業經營是商業行為🏇🏿,無論是2C還是2B,不論采用何種技術,都必須牢記解決問題、滿足客戶需求是根本目標🐸。更重要的是,我們應該關註今天用戶和客戶尚未得到滿足的需求。只有從這個角度出發,才能更好地遵循商業規律💐。至於是使用AI還是使用非AI,采用AI1.0還是采用AI2.0都是次要問題。成功的投資和企業在第一時間抓住了主要矛盾,即大量存在未被滿足的需求或者沒有得到很好滿足的需求👧🏽。只有通過滿足這些需求,AI才能發揮作用🍕🦸🏿‍♀️。因此⛰,從商業角度來看,創造沒有實際需求的產品,這樣做是很危險的🤫。

56hcy.cn金融評論:隨著參數規模和數據量的不斷提升,對於算力的要求與日俱增🧕🏼👨‍✈️,AI芯片需要特殊的一個設計和定製👨‍🦯‍➡️🤾🏻‍♀️,對於中國的硬件公司有哪些機會和挑戰?

杜雨🔟:算法的支持需要更強的算力😒,這需要我們在硬件方面進行更多的創新。實際上,這最終是工具和問題之間的關系。集成電路市場在過去幾年發生了很大的變化👩🏿‍🚒,尤其是國際市場上的市場格局變化很大🚣🏿。我們需要回到最本質的問題💃🏻👮🏽‍♂️,即什麽樣的芯片能更好地支持今天新一代通用人工智能算法的運行。有時候我們不能只在單一維度上尋求突破。雖然我們都知道硬件層遵循摩爾定律,但是到達某一定數量級之後,需要進行一些考慮,我們稱為“摩爾時代”。我們不能僅因為某個指標持續下降或上升😅,就認為它能夠有助於我們優化問題的解決方案🖤🏋️‍♂️。

一方面👰🏻,對於底層芯片產業,如集成電路和半導體的需求量肯定會直接受到積極影響。因此,這些公司的收入肯定會從某種程度上有所提高🧑‍🌾。如果我們能更準確地預測通用人工智能的普及速度,那麽這些公司也可以從中受益。

另一方面,芯片產業實際上屬於製造業,不同於軟件服務業寫代碼,不是可以輕易升級的東西🌂,還要考慮市場預測方面的生產計劃問題。既然它涉及生產🦸🏿‍♂️,就會有一個周期性➕。對於半導體集成電路產業的企業家來說😝,更重要的是要花更多時間去研究AIGC將落腳在哪種計算需求及需求量上的變化🫳🫶🏻,從而推導出對於底層芯片產業的哪種芯片或技術的需求量更大🌬。這確實需要做出預判🧔🏿‍♂️👩‍👩‍👧‍👦,否則一旦決策與市場需求不匹配🎽,可能會造成大量浪費🦸🏽。

56hcy.cn金融評論:今天ChatGPT的火爆,不免讓我們想到去年熱門的元宇宙。然而,從紮克·伯格(Mark Zuckerberg)對Meta的態度來看🫥,元宇宙概念的熱度似乎沒有持續太長時間,而且它主要的應用也集中在遊戲和虛擬現實領域。您剛才也提到了可能要到2033年或更長時間🎅,才能看到Web3.0◾️、元宇宙👨🏻‍🦰🟦、區塊鏈𓀐,以及NFT這些應用場景與AIGC的結合🫥。您對未來商業機會和技術應用有哪些展望呢👐?

杜雨👩🏻‍🌾:一個問題是,熱度的本質是指大眾市場的關註度,即普通用戶的關註度。普通用戶一定會對應用層的創新和突破更敏感。雖然ChatGPT是在2022年末被推出,在2023年初備受關註,而它背後是近十年的積累。過去七年大眾都不知道OpenAI是誰、在做什麽。對於元宇宙可能是一樣的道理,也許經過七年或十年,我們可以看到沉浸式領域出現類似ChatGPT一樣令人振奮的應用。我認為科技創新的關鍵在於無論公眾是否關註,每個領域的創新都在不斷地進行和前進。

另一個問題是✢,如果我們將AIGC和虛擬世界的結合考慮在內,最直觀的邏輯是📰,AIGC可以及時提高內容生產的效率🤦🏽‍♂️,對虛擬世界各種元素的設計創造就會變得更高效⛹🏿、更快捷。因為沉浸式世界中需要數字孿生🚚💃,即將物理世界中的每個物件都進行3D模型的再造。這個過程需要完成大量的工作🕓,包括人🍋‍🟩、物、植物和動物等都需要映射到數字世界中👩🏼‍🦰。使用AIGC或許就可以讓我們更快地進入Meta所講的元宇宙時代,讓每個消費者更早地體驗沉浸式的世界。例如🔐,像Roblox這樣的平臺曾經收購過一家名為Loom.ai的公司,該公司使用AIGC技術快速生成虛擬人🟩。在玩Roblox時🚵🏼,我們可能需要花費很長時間去捏臉、製作虛擬人。有了Loom.ai的技術,虛擬世界中構建虛擬人的門檻就變得更低,越來越多的人可以參與其中,虛擬世界的構建過程也會變得更快🚣🏿‍♀️。

*本文僅代表被訪者個人觀點,僅供讀者參考🔛,並不作為投資🏄🏼‍♂️、會計、法律或稅務等領域建議。采訪/編輯🍗:潘琦。

凯捷体育娱乐专业提供:凯捷体育娱乐😈、凯捷体育💠🧎🏻‍➡️、凯捷体育平台等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流,凯捷体育娱乐欢迎您。 凯捷体育娱乐官網xml地圖