|
關(guān)于GPT-4的產(chǎn)品化狂想關(guān)于GPT-4的產(chǎn)品化狂想 GPT-4是條件,而不是結(jié)果。 如今打開互聯(lián)網(wǎng)一看,會看到鋪天蓋地的“GPT-4好厲害”“太牛了”“科技革命到來了”“人類都要失業(yè)了”…… 但這么偉大的變革到底是怎么到來呢?答案好像比較含糊。只有ChatGPT基礎(chǔ)的問答、代寫能力,以及微軟已經(jīng)開始做的搜索、辦公是目前比較清楚的大語言模型落地方案。如果僅僅有這些東西,似乎也還達不到科技革命的效果。 為什么會這樣? 答案在于,任何技術(shù)想要最終發(fā)揮效應(yīng),都要經(jīng)歷一個“技術(shù)-產(chǎn)品-經(jīng)濟效益”的三階段發(fā)展。這其中,產(chǎn)品化是承上啟下不可或缺的一步,很多優(yōu)秀的技術(shù)就是因為無法產(chǎn)品化,最終只能停留在特殊或小眾領(lǐng)域,也有很多變革并不需要明確的技術(shù)指向,僅僅是因為產(chǎn)品出色,就可以引發(fā)變革。就像iPhone集成了很多新技術(shù),但本身是產(chǎn)品創(chuàng)新。 在如今這個節(jié)骨眼上,每個人都能感覺到GPT蘊藏的變革能量。但我們對他如何產(chǎn)品化還知之甚少,能看見的應(yīng)用方案,主要還是以API的形式完成,更多屬于極客和開發(fā)者。 那么,這輪AI熱潮下,到底有可能產(chǎn)生哪些“殺手級”產(chǎn)品呢?我們以GPT-4的一些關(guān)鍵特性作為線索,來和大家分享幾個大語言模型的產(chǎn)品可能性。 先別提顛覆世界,那太虛,也別僅僅盯著已有的技術(shù)能力,那又太實。只有中程的產(chǎn)品化階段,才是絕大多數(shù)人在這輪AI爆發(fā)中的機會所在。 信息時代3.0,主線是“命令” 信息時代有兩條顛撲不破的主線:信息獲取與個人娛樂。搜索、信息流、門戶網(wǎng)站、直播、短視頻等,這些互聯(lián)網(wǎng)產(chǎn)品樣態(tài)都離不開信息獲取效率的升級,以及個人娛樂體驗的加強。GPT-4代表的大語言模型,可以在短時間內(nèi)生成大量內(nèi)容,甚至生成PPT、網(wǎng)站、視頻,這些傳統(tǒng)意義上AIGC難以做到的內(nèi)容。 這個能力推演下去,最大的產(chǎn)品價值在于,大語言模型帶來人與信息交互方式的徹底改變。 英偉達 GTC 2023 大會上,黃仁勛說:“生成式 AI 就是一種新型的計算機,我們可以用人類語言進行編程,任何人都可以命令計算機來解決問題! “命令”這個詞非常關(guān)鍵。當(dāng)GPT-4以及未來更多大語言模型成為產(chǎn)品基底,用戶與信息產(chǎn)品、娛樂產(chǎn)品之間的互動方式,最大可能性就是命令。 在信息1.0時代,你的需求可以被查詢到,這是搜索機制,代表產(chǎn)品就是搜索引擎。 信息2.0時代,你的需求可以被迎合,這是推薦機制,代表產(chǎn)品是信息流和短視頻。 當(dāng)AI能力進一步提升,你的需求可以被短時間內(nèi)訂制且滿足,GPT-4乃至5、6、7帶來的新機制,就是命令機制。 在這個階段,信息不是已經(jīng)成型,然后根據(jù)用戶需求進行查找,而是信息本身不存在,當(dāng)用戶發(fā)出指令后再進行AIGC。比如說,我在搜索引擎時代,想要寫一篇關(guān)于芯片的文章,就需要依靠關(guān)鍵詞、關(guān)鍵信息去搜索、查詢各種數(shù)據(jù)報告,需要用戶有耐心和信息查找能力。而在信息流時代,AI推薦機制會根據(jù)我查找、瀏覽了芯片相關(guān)信息,自動推送相關(guān)內(nèi)容,這些內(nèi)容有的有益,有的沒用,需要用戶來辨別。 當(dāng)“命令”成為主要的信息交互方式,我可以直接命令A(yù)I找到近期關(guān)于芯片的所有數(shù)據(jù),并生成一份專屬報告給我。如果不滿意,我還可以命令它修改。 如果說,這種命令式信息收集,改變的生產(chǎn)、學(xué)習(xí)效率,以及信息獲取方式。那么類似技術(shù)驅(qū)動的AI生成視頻則可以極大改變娛樂模式。今天我們會覺得很多短視頻的模式化、快餐化,簡直像AI做的,未來這個擔(dān)心或許就沒有了,因為視頻就是AI做的。 電影解說、明星八卦、勁歌熱舞,AIGC未來將會隨時訂制大量視頻內(nèi)容,里面的電影信息是GPT抓取的,明星八卦是AI搜羅的,跳舞的男孩女孩形象都是AI生成的,不用再去尋找內(nèi)容,不用再讓AI推薦,也不需要大量短視頻創(chuàng)作者、UP主費時費力制作剪輯,只需要一個命令,輕輕松松幾個小時的娛樂時間就打發(fā)掉了。 如果說,信息時代1.0是人找信息,2.0是信息找人,那么AIGC帶來的信息3.0時代,就是誰也不用找誰,AI自己可以生成。 這個產(chǎn)品化機會的核心是繼搜索引擎、信息流之后,打造“命令引擎”這種新的產(chǎn)品形態(tài)。我猜“阿拉丁神燈”應(yīng)該是個好名字。 游戲NPC正盯著你 GPT-4發(fā)布的那個晚上,我看到群里很多開發(fā)者都在討論,而第一條蹦出來關(guān)于GPT-4應(yīng)用的消息,是有人說可以把他放在游戲里當(dāng)NPC。 讓NPC使用大語言模型作為底座,來跟玩家進行內(nèi)容豐富、高自由度的多輪對話,應(yīng)該是一件很容易想到的事情,但這位朋友說的卻不是這個意思。 GPT-4的一個關(guān)鍵創(chuàng)新特性,是讓AI來識別圖片,并且理解圖片中的細(xì)節(jié)、內(nèi)涵等,比如可以理解一張搞笑梗圖中的幽默點到底在哪。 這種能力如果用到游戲里,將賦予游戲和游戲NPC一個前所未有的能力:看見玩家。 從電子游戲誕生之日起,玩家要做的就是去看到、聽到一個虛擬世界,并沉浸其中。這個過程中,玩家要盡可能脫離自己周遭的現(xiàn)實,游戲感始終是單向的。雖然AR游戲、體感游戲的出現(xiàn),一定程度上改變了這種情況,讓玩家的體態(tài)、運動、力量以及游玩環(huán)境進入到游戲當(dāng)中,但游戲本身對玩家是缺乏理解的。 如果讓GPT-4成為游戲NPC,或者作為游戲本身機制的一部分,那或許我們距離游戲能夠理解玩家,并做出對應(yīng)反應(yīng)已經(jīng)不遠(yuǎn)了。你在觀察游戲NPC的時候,他們可能也在觀察著你,嘗試?yán)斫饽愕谋砬、你的體態(tài),解讀你在游戲中的困惑、激動,或者卡關(guān)之后想摔手柄的暴怒。 如果這種機制被放置在一些游戲大師手中,最終作品一定是震撼人心的。事實上,AI生成關(guān)卡、環(huán)境,完成自動渲染等技術(shù),已經(jīng)極大改變了游戲開發(fā),而GPT-4與游戲的深度融合,未來也是極大概率事件。 這種融合在兩個領(lǐng)域最有可能性,一個是強調(diào)互動的AR、VR游戲,另一個是注重NPC自由互動的開放世界與多結(jié)局角色扮演游戲。 除了游戲之外,“看懂”這個能力還可以被用到數(shù)字人,甚至機器人身上。也可以帶來相當(dāng)有分量的產(chǎn)品機會。 “一嘴通辦” 說了toC的,讓我們再聊聊toB。今天很多人都知道一個詞,叫做“一網(wǎng)通辦”。就是說在政務(wù)系統(tǒng)中打通各個部門的信息系統(tǒng)界限,從而避免辦事人要在不同部門之間來回奔波,產(chǎn)生辦不完的手續(xù)、蓋不完的章、跑不完的路。 在全球很多地方,一網(wǎng)通辦都是城市服務(wù)、政務(wù)、金融、財稅等領(lǐng)域的數(shù)字化核心發(fā)展方向,在中國的東部沿海地區(qū)和一線城市,“一網(wǎng)通辦”也正在高速發(fā)展。 但是“一網(wǎng)通辦”這種模式,其實依舊有痛點存在: 一是“通辦”僅僅是數(shù)據(jù)打通了,但辦理邏輯和辦理方式依舊與之前無異,用戶該不會的還是不會,該卡住的還是卡住,可能需要花費大量時間在反復(fù)詢問、填寫材料、咨詢上。 另一個是“一網(wǎng)通辦”的效率高度依賴操作人員能力。由于操作人員精力和專業(yè)能力有限,必然不了解各個業(yè)務(wù)領(lǐng)域,因此一旦出現(xiàn)復(fù)雜的情況,就會出現(xiàn)操作員雖然能處理,但不知道如何處理的問題,需要層層請示領(lǐng)導(dǎo)或者跨部門溝通,這樣反而降低了效率。 大語言模型與這些領(lǐng)域的融合,必然能夠解決一些問題。辦事人可以直接咨詢AI,了解復(fù)雜的部門、業(yè)務(wù)之間的內(nèi)在邏輯、辦事方法,從而盡量一次性完成辦事需求;而操作人員也可以依靠AI來獲取跨部門的操作方法、操作樣例,從而能夠完成較復(fù)雜情況的高效率處理。最關(guān)鍵的是,類似能力可以更多用AI替代人工。 這種依靠大語言模型知識抓取、邏輯分析能力的服務(wù)平臺,可以把“一網(wǎng)通辦”升級成“一嘴通辦”,辦事人說清楚訴求就全面搞定。當(dāng)然這個名字純屬開玩笑,但城市服務(wù)的核心,一定要從“網(wǎng)”轉(zhuǎn)變?yōu)椤叭恕,這一點是毫無疑問的,也是大模型時代的toB產(chǎn)品核心機遇。 類似的能力,最具有落地需求的就是政務(wù)與金融方面,這兩個領(lǐng)域涉及事項多、專業(yè)性強,并且與民眾需求緊密相連,從更遠(yuǎn)一點考慮,可能也包括財稅、法律、醫(yī)療。GPT代表的大語言模型,可以打破公眾服務(wù)的邊界,讓AI連接起專業(yè)知識與用戶需求。 集成了咨詢、數(shù)據(jù)匯總、事項辦理、文書認(rèn)證等功能的新型AI服務(wù)平臺,將是接下來toB市場AI技術(shù)的核心機遇。 超級無代碼開發(fā) 移動互聯(lián)網(wǎng)創(chuàng)業(yè)熱潮的時候,經(jīng)常有人開玩笑說,“我創(chuàng)意、機會、方法論都有了,距離拿到融資就差一個程序員”。 這當(dāng)然是一個笑談,但笑著笑著我們可能會發(fā)現(xiàn),連那個程序員都不差了。 ChatGPT讓人驚艷的一點,就在于代碼的自動生成和修改。其實很多程序員朋友都說,類似AI模型的能力還主要是輔助工作,根本代替不了一個懂業(yè)務(wù)、懂產(chǎn)品邏輯與實現(xiàn)方式的程序員。 但復(fù)雜的開發(fā)可能做不了,簡單的難道不行嗎?GPT-4發(fā)布時演示的創(chuàng)新點之一,就是讓模型根據(jù)需求自動生成一個網(wǎng)站,雖然生成結(jié)果比較粗糙,但已經(jīng)實現(xiàn)了基本的開發(fā)需求。 在云計算與軟件業(yè),低代碼開發(fā),甚至無代碼開發(fā)是近兩年流行的熱門概念。核心邏輯是利用代碼庫,將已有開發(fā)樣例進行快速復(fù)寫,但GPT-4的邏輯顯然更加先進,他甚至不需要用戶懂架構(gòu),而是直接根據(jù)需求生成開發(fā)程序。 這種能力,在短時間內(nèi)生成復(fù)雜的軟件應(yīng)用或許不行,但對于很多沒有編程與開發(fā)能力的人來說,通過AI來獲取一個小程序、一個電商平臺、一個簡單的APP還是非常有意義的。 用一些模板搭配GPT-4,可以形成“超級無代碼”的產(chǎn)品形式。用戶只需要下達需求并支付費用,就可以獲得屬于自己的軟件應(yīng)用,整個開發(fā)過程中的人工成本趨近于0。 為人提供這種AI主導(dǎo),模板+微調(diào)的軟件開發(fā),或許也將變成一個全新風(fēng)口。其實想想,現(xiàn)在隨手就能拉個群聊,這在早期的互聯(lián)網(wǎng)聊天室時代簡直難以想象,那么未來人手幾個APP,一堆網(wǎng)站,一群數(shù)字人,可能也不是什么難事。 從預(yù)訓(xùn)練大模型崛起,再到今天的ChatGPT、GPT-4,最值得關(guān)注的是智能涌現(xiàn)效應(yīng)驅(qū)動下,一些作為信息化常識的東西被改變了。換句話說,GPT-4是條件,而不是結(jié)果。 只有運用好這些新條件,得出新方法,創(chuàng)造新產(chǎn)品的人才能獲得AI時代最好的結(jié)果。 有人會擔(dān)心,這么大的變化之下,我的工作、生活會不會被顛覆? 其實吧,這種焦慮什么時候都有,但從沒有真正變成災(zāi)難。 1999年,樸樹有首歌叫做《New Day》,里面有句歌詞是這么寫的,“快來吧奔騰電腦,就讓它們代替我來思考”。 20多年過去了,人類還在思考,奔騰電腦在哪里? |