新智元報(bào)道
編輯:桃子
【新智元導(dǎo)讀】GPT-5,一夜又成為了編碼圈的頂流。AI大牛Karpathy發(fā)文狂贊,Claude Code折騰一小時(shí)沒搞定的難題,GPT-5 Pro十分鐘就完成了,奧特曼秒回感謝。
GPT-5 Pro再次得到了AI大佬的認(rèn)可。
今天,Karpathy一早激動(dòng)發(fā)文,「必須再吹一波OpenAI的GPT-5 Pro,真的太強(qiáng)了」!
這究竟是腫么回事兒?
在工作流中,Karpathy遇到了一個(gè)棘手的問題,但Claude Code折騰了一個(gè)小時(shí)還是沒有搞定。
最后,他決定換GPT-5 Pro去跑,沒想到僅用十分鐘,就直出一個(gè)開箱即用的解決方案。
更有趣的是,他讓Claude看了GPT-5 Pro的解法,它居然寫了「兩段小作文」瘋狂夸贊。
最后,Karpathy還真誠地建議,「誰要是不把最刁鉆的問題交給GPT-5 Pro,簡直虧大了」。
在編碼PK的這一局中,GPT-5 Pro又上分了。
奧特曼立即感謝Karpathy,順便好奇地問了一句,「你是更希望它變得更聰明,還是跑得更快」?
OpenAI總裁Greg還不忘借此宣傳一波,「GPT-5 Pro就是編碼的下一代產(chǎn)品」。
編碼王者之戰(zhàn)
GPT-5 Pro上大分
當(dāng)前,在編碼領(lǐng)域,每位開發(fā)者都有各自青睞的模型。
有的人喜歡Claude,有的人喜歡Gemini,還有的人更傾向于GPT-5/Codex,又或是Grok Code。
評(píng)論區(qū),一位網(wǎng)友問Karpathy有沒有嘗試過grok-code-fast-1?
顯然沒有,不過已在他的計(jì)劃之中。每隔幾天,Karpathy就會(huì)把現(xiàn)有的工具輪著用一遍。
接下來,他再次談了自己使用OpenAI模型的感受——
說實(shí)話,大概三周前,我還覺得Codex在處理基準(zhǔn)編輯和整體體驗(yàn)上,還不如現(xiàn)在Claude Code好用。
不過單說GPT-5 Pro,目前確實(shí)甩別的模型好幾條街。
另一位網(wǎng)友稱,「AI模型互相贊賞彼此的工作成果,這才是未來感拉滿的巔峰時(shí)刻」!
在Karpathy看來,這是一個(gè)超強(qiáng)的評(píng)估方法,而且自己經(jīng)常這樣做。
讓所有模型都生成一段內(nèi)容,然后把所有結(jié)果混在一起,再讓每個(gè)模型去給所有內(nèi)容輸出排名。
一開始,比較令人擔(dān)心的是,AI會(huì)偏向自己的生成結(jié)果,但在Karpathy有限的測(cè)試中,事實(shí)并非如此。
這就好像是「生成-判別差距」的現(xiàn)實(shí)版演示——寫好內(nèi)容很難,但識(shí)別優(yōu)秀的東西容易多了,而且模型在這方面做的確實(shí)不錯(cuò)。
沒想到,這一觀點(diǎn),深得網(wǎng)友認(rèn)同。
給GPT-5 Pro編碼好評(píng)的,可不止Karpathy一人。
一位開發(fā)者測(cè)試后,深刻感受到了GPT-5 Pro的強(qiáng)大。在大約6分鐘,一次性完成應(yīng)用開發(fā),能夠自由組合各種圖像、文本、箭頭等元素。
多輪交流后,GPT-5 Pro還能將SMILES轉(zhuǎn)換為ASCII的代碼。
HubSpot聯(lián)創(chuàng)也是非常認(rèn)可GPT-5 Pro的實(shí)力,但OpenAI Codex的用戶體驗(yàn)還沒有CC更友好,不過這一差距正在逐漸縮小。
半個(gè)月
使用量暴增10倍
今年5月,OpenAI正式推出了AI編程智能體Codex,這是一款專為軟件工程設(shè)計(jì)的模型。
最初,它是基于o3打造的codex-1模型提供能力。
自GPT-5發(fā)布后,Codex又集成了最新模型,性能一夜暴漲,吸引了不少開發(fā)者的使用。
兩天前,奧特曼曾官宣,過去兩周Codex使用量增長了大約10倍。
他還表示,內(nèi)部有一個(gè)非常高效的模型,能提供大量的使用量。
在PR競(jìng)技場(chǎng)中,Codex實(shí)力最強(qiáng),大幅超越了Devin、GitHub Copilot、Cursor Agent。
或許你根本無法想象,不用一行代碼,就能打造一個(gè)應(yīng)用的感受。
一位Claude Code資深開發(fā)者,在嘗試Codex 48小時(shí)后,分別點(diǎn)評(píng)了它們的之間的差異:
這位開發(fā)者同樣認(rèn)為,Codex在Claude遇到棘手問題上,以及編寫代碼方面表現(xiàn)良好。
不知,大家更傾向于哪個(gè)編碼模型?
參考資料:
https://x.com/karpathy/status/1964020416139448359 https://x.com/sama/status/1964032346975588371
關(guān)于我們|版權(quán)聲明| 違法和不良信息舉報(bào)電話:010-84151598 | 網(wǎng)絡(luò)敲詐和有償刪帖舉報(bào)電話:010-84151598
Copyright ? 2008-2024 by {當(dāng)前域名}. all rights reserved