蜜桃狠狠色伊人亚洲综合网站,亚洲一区有码,久久久av一区

上手ChatGPT威力加強版后，我發現它很強，但也有點拉。。。互聯網+

差評 2023-03-16 12:41

分享到：

導讀

OpenAI 發布了最新的 GPT-4。

OpenAI 發布了最新的 GPT-4。今天凌晨，OpenAI 發布了最新的 GPT-4。根據發布會披露的內容來看，這個新一代比早先大家使用的 ChatGPT 的 GPT-3.5 內核 強悍了一大截，再次刷新了編輯部對 AI 的認知。首先，非常非常重要的一點是， GPT-4 可以接受文字以外的內容輸入了，目前支持文字與圖像的混合輸入。 在官方的示例中，用戶給 GPT-4 上傳了一張梗圖，問 GPT-4 這張圖為什么好笑：

GPT-4 非常詳細且精準地描述出了圖片上的內容。并且有思維條理的解釋了，為什么這張圖會讓人覺得好笑。

這還不算完，就算是十分抽象的 Meme，它也能一本正經地給你解釋笑點在哪里。

只不過么，GPT4 也還沒到能通過圖靈的程度。 當然，這個功能并不只是能解釋梗圖那么簡單，它擁有無限的想象空間，比如：在今天凌晨的官方直播視頻中，GTP 的開發人員演示了 GPT-4 可以識別他手繪的一張網頁草圖，并且根據草圖寫出網頁的前端代碼。 手繪的網頁草圖，非常抽象▼

GPT-4 給出的網頁以及代碼 ▼

雖然這個示例里的網站非常簡單，但 GPT-4 的理解能力和創造力還是讓人覺得不可思議： 重要的不是它能不能做得很好，而是它能做到，這是一個質的飛躍。 甚至，目前已經有公司在搞這項技術的落地應用，打算把它和導盲服務結合起來。這樣一來，盲人只需要拍張照，GPT-4 就能立即復述出面前物品的信息。

而在文字問答方面，GPT-4 也有非常大的提升，輸入字增加到了 2.5 萬。在專業領域上的回答， 特別是 “ 問題復雜度足夠高的時候……GPT-4 比老版本更細、更可信、更富有創造力 ”。 比如，在統一律師考試（ Uniform Bar Exam ）中，GPT-4 可以超過 90% 的人類考生，而老版本只能超過 10% 的人類考生，妥妥學渣學霸的區別。在 GRE 數學和語文（閱讀與填空）考試中，GPT-4 的考試成績 已經是哈佛、麻省理工、斯坦福大學生的水平了。

不僅自己回答問題能力變強了，GPT-4 還會人格扮演。比如你提出一個問題，ChatGPT 只會機械式地回答，而 GPT-4 可以按你的要求 以蘇格拉底風格給你作答。 那這個玩法就多了呀。 向下滑動▼

不過，說了這么多，百聞不如一試。 即使已經是凌晨 2 點，編輯部依舊花重金（ 20 美元/月），連夜讓美國同事幫忙升級試用了一波。遺憾的是，OpenAI 考慮到用戶們搞幺蛾子的能力太狠，所以目前 GPT-4 的 圖片輸入功能暫時不對公眾開放，也沒有說啥時候可以用上。

不過，我們還是可以試試它聰明的小腦瓜子。先是給了一個全網瘋傳的“ 華為、阿里入職面試題 ”，挑戰大獲成功。而隔壁的 ChatGPT 就有點拉了。

作為擊敗了 90% 人類的大律師，GPT-4 的推理能力應該強無敵吧。所以我們又搞了道法考的經典案件，想掂量掂量 GPT-4 到底有幾斤幾兩。問：乙去甲家吃飯，結果電動車被偷了。于是乙準備偷輛別人的電動車，此時，喝醉的甲來幫忙撬鎖，幫乙成功得手。結果調查后發現，乙偷的是甲的電動車，問甲算不算是盜竊罪？雖然新舊兩款結論都是正確的，但是舊版的解題過程，就有點亂來了。。

而在一些 更需要 “ 創造性 ” 或是 “ 思考 ” 的問題，比如：關于最近一次特斯拉投資者大會上 “ 實現全球可持續能源 ” 的計劃，你覺得是可行的嗎？為什么可行？ GPT-4 的表現就更讓人吃驚了。雖然 GPT-4 的知識庫停留在 2021 年 9月，并沒有覆蓋半個月前的那場投資者大會， 但它卻神奇地未卜先知了。

而老版本 ChatGPT 的回答就遜色了很多，沒有條理，還有一堆車轱轆話，沒有建設性觀點。

隨后，我們又問了一個行業思考相關的問題：你如何看待全球的碳排放戰略，它能成功嗎？老版只能浮于表面籠統地給點泛泛的概念，而 GPT-4 的回答明顯 維度更寬、思考更深，洋洋灑灑列了 10 點，更加細致有條理，并且含有更多專業詞匯與內容，可以說幾乎完美地回答了這個問題。

上面這些，還僅僅只是我們編輯部的試驗，在一些大佬們手上，GPT-4 令人恐懼的表現就更多了。比如僅僅只用了 60 秒，就做出了一款 Pong 游戲，20 秒就能做出貪吃蛇游戲。

不可否認，GPT-4 比起舊版來說，強的不是一點半點。不過我們試出來的問題，其實也不少。我們搞了套 高中數學競賽試卷來考它，結果，一試就尷尬了。。 第一道選擇題，新舊兩個版本就都解錯了。難道說，斯坦福、麻省理工還不如。。？

因為 GPT-4 可以支持更長的輸入文本，所以我們就又測試了它的總結概括能力。這下餡露得更大了。我們甩給它的是，差評君之前發過的一篇文章的鏈接，其實 GPT-4 是沒有聯網的，正常來說是沒法總結的。結果，它愣是 憑空捏造了兩個文章總結，而且和我們給的文章沒有任何關系。直到在我反復指正兩次，語氣都加重了，它才承認自己的錯誤。

直到后面我們把原文直接貼進去后，GPT-4 才展露了它超強的總結能力。

說實話，這個胡編亂造的能力讓我們心里一驚，于是就又想了個測試方法。前兩天，小黑胖把“ 手拿把攥 ”記混成“ 手拿把蒜 ”，被編輯部嘲笑了很久，于是我們就問 GPT-4 “ 手拿把蒜什么意思？” 結果牛掰了，GPT-4 在理解了一部分“ 把蒜（攥）”是形容事情輕而易舉的基礎上，引經據典地胡編亂造，頗有種當年我寫作文時，引用的俄羅斯文學家“ 沃茲基索德 ”的味道了。要知道，如果是真實場，這個半真半假、引用權威的胡說八道的后果將是非常嚴重的，堪稱最高級的謊言。

明明連更老的 ChatGPT 也不敢這么捏造來源地胡說，更高級的 GPT-4 怎么會這樣呢？我們猜測，就是因為 新版本更傾向于表現出 “ 更具有深度思考 ”，這么一來，在回答很多問題的時候，GPT-4 會自己給自己加戲，才會出現這些鬧劇 。 雖然我們試了這么多漏洞，但總的來講，這次發布的 ChatGPT，無論是基礎功能、想象空間、邏輯能力、思考能力，都比之前強了一大截。明明距離老版本 ChatGPT 顛覆我們的認知才沒幾個月，它們就又掏出了一個船新版本，我們只能說： 恐怖如斯。 更恐怖的是，其實 GPT-4 誕生時間，可能比我們想的還要早很多，之前 OpenAI 發布基于 GPT-3.5 的 ChatGPT 時，內部員工就質疑過為啥發個這么古早的版本。而我們也早就接觸過 GPT-4 了，New Bing 官方今天發了個公告，承認了 New Bing 其實就是 GPT-4。

所以這么說的話，有沒有種可能，GPT-5 也已經近了呢？我已經開始期待除了文字、圖片以外，視頻、音頻等形式的輸入了。 撰文： 大餅 & 小陳 & 四大 & 八戒編輯：面線 & 江江封面：萱萱 圖片、資料來源： OpenAI、New Bing 官網、Twitter、Be My Eyes New York Times：How ChatGPT Kicked Off an A.I. Arms Race 如果您覺得本文寫的還不錯歡迎關注差評孵化的商業財經類賬號：知危（ ID:BusinessAlert ）

GPT- ChatGPT 能力問題回答

分享到：

1.TMT觀察網遵循行業規范，任何轉載的稿件都會明確標注作者和來源；
2.TMT觀察網的原創文章，請轉載時務必注明文章作者和"來源：TMT觀察網"，不尊重原創的行為TMT觀察網或將追究責任；
3.作者投稿可能會經TMT觀察網編輯修改或補充。

欧美亚洲丝袜传媒另类_日韩在线免费视频_国内一区在线_亚洲一区二区三区日本久久九

上手ChatGPT威力加強版后，我發現它很強，但也有點拉。。。互聯網+

上手ChatGPT威力加強版后，我發現它很強，但也有點拉。。。互聯網+