欧美亚洲丝袜传媒另类_日韩在线免费视频_国内一区在线_亚洲一区二区三区日本久久九

上手ChatGPT威力加強版后,我發現它很強,但也有點拉。。。互聯網+

差評 2023-03-16 12:41
分享到:
導讀

OpenAI 發布了最新的 GPT-4。

OpenAI 發布了最新的 GPT-4。 今天凌晨,OpenAI 發布了最新的 GPT-4。  根據發布會披露的內容來看,這個新一代比早先大家使用的 ChatGPT 的 GPT-3.5 內核 強悍了一大截,再次刷新了編輯部對 AI 的認知。  首先,非常非常重要的一點是, GPT-4 可以接受文字以外的內容輸入了,目前支持文字與圖像的混合輸入。 在官方的示例中,用戶給 GPT-4 上傳了一張梗圖,問 GPT-4 這張圖為什么好笑: GPT-4 非常詳細且精準地描述出了圖片上的內容。 并且有思維條理的解釋了,為什么這張圖會讓人覺得好笑。 這還不算完,就算是十分抽象的 Meme,它也能一本正經地給你解釋笑點在哪里。  只不過么,GPT4 也還沒到能通過圖靈的程度。 當然,這個功能并不只是能解釋梗圖那么簡單,它擁有無限的想象空間,比如: 在今天凌晨的官方直播視頻中,GTP 的開發人員演示了 GPT-4 可以識別他手繪的一張網頁草圖,并且根據草圖寫出網頁的前端代碼。 手繪的網頁草圖,非常抽象 GPT-4 給出的網頁以及代碼  雖然這個示例里的網站非常簡單,但 GPT-4 的理解能力和創造力還是讓人覺得不可思議: 重要的不是它能不能做得很好,而是它能做到,這是一個質的飛躍。  甚至,目前已經有公司在搞這項技術的落地應用,打算把它和導盲服務結合起來。 這樣一來,盲人只需要拍張照,GPT-4 就能立即復述出面前物品的信息。 而在文字問答方面,GPT-4 也有非常大的提升,輸入字增加到了 2.5 萬。 在專業領域上的回答, 特別是 “ 問題復雜度足夠高的時候……GPT-4 比老版本更細、更可信、更富有創造力 ”。 比如,在統一律師考試( Uniform Bar Exam )中,GPT-4 可以超過 90% 的人類考生,而老版本只能超過 10% 的人類考生,妥妥學渣學霸的區別。 在 GRE 數學和語文 ( 閱讀與填空 )考試中 ,GPT-4 的考試成績 已經是哈佛、麻省理工、斯坦福大學生的水平了。 不僅自己回答問題能力變強了,GPT-4 還會人格扮演。 比如你提出一個問題,ChatGPT 只會機械式地回答,而 GPT-4 可以按你的要求 以蘇格拉底風格給你作答。 那這個玩法就多了呀。  向下滑動 不過,說了這么多,百聞不如一試。 即使已經是凌晨 2 點,編輯部依舊花重金( 20 美元/月 ),連夜讓美國同事幫忙升級試用了一波。 遺憾的是,OpenAI 考慮到用戶們搞幺蛾子的能力太狠,所以目前 GPT-4 的 圖片輸入功能暫時不對公眾開放,也沒有說啥時候可以用上。 不過,我們還是可以試試它聰明的小腦瓜子。 先是給了一個全網瘋傳的“ 華為、阿里入職面試題 ”,挑戰大獲成功。  而隔壁的 ChatGPT 就有點拉了。 作為擊敗了 90% 人類的大律師,GPT-4 的推理能力應該強無敵吧。 所以我們又搞了道法考的經典案件,想掂量掂量 GPT-4 到底有幾斤幾兩。  問:乙去甲家吃飯,結果電動車被偷了。于是乙準備偷輛別人的電動車,此時,喝醉的甲來幫忙撬鎖,幫乙成功得手。結果調查后發現,乙偷的是甲的電動車,問甲算不算是盜竊罪? 雖然新舊兩款結論都是正確的,但是舊版的解題過程,就有點亂來了。。 而在一些 更需要 “ 創造性 ” 或是 “ 思考 ” 的問題,比如:  關于最近一次特斯拉投資者大會上 “ 實現全球可持續能源 ” 的計劃,你覺得是可行的嗎?為什么可行? GPT-4 的表現就更讓人吃驚了。 雖然 GPT-4 的知識庫停留在 2021 年 9月,并沒有覆蓋半個月前的那場投資者大會, 但它卻神奇地未卜先知了。 而老版本 ChatGPT 的回答就遜色了很多,沒有條理,還有一堆車轱轆話,沒有建設性觀點。  隨后,我們又問了一個行業思考相關的問題: 你如何看待全球的碳排放戰略,它能成功嗎? 老版只能浮于表面籠統地給點泛泛的概念,而 GPT-4 的回答明顯 維度更寬、思考更深,洋洋灑灑列了 10 點,更加細致有條理,并且含有更多專業詞匯與內容,可以說幾乎完美地回答了這個問題。  上面這些,還僅僅只是我們編輯部的試驗,在一些大佬們手上,GPT-4 令人恐懼的表現就更多了。 比如僅僅只用了 60 秒,就做出了一款 Pong 游戲,20 秒就能做出貪吃蛇游戲。  不可否認,GPT-4 比起舊版來說,強的不是一點半點。不過我們試出來的問題,其實也不少。 我們搞了套 高中數學競賽試卷來考它,結果,一試就尷尬了。。 第一道選擇題,新舊兩個版本就都解錯了。  難道說,斯坦福、麻省理工還不如。。?  因為 GPT-4 可以支持更長的輸入文本,所以我們就又測試了它的總結概括能力。 這下餡露得更大了。 我們甩給它的是,差評君之前發過的一篇文章的鏈接,其實 GPT-4 是沒有聯網的,正常來說是沒法總結的。 結果,它愣是 憑空捏造了兩個文章總結,而且和我們給的文章沒有任何關系。  直到在我反復指正兩次,語氣都加重了,它才承認自己的錯誤。 直到后面我們把原文直接貼進去后,GPT-4 才展露了它超強的總結能力。 說實話,這個胡編亂造的能力讓我們心里一驚,于是就又想了個測試方法。 前兩天,小黑胖把“ 手拿把攥 ”記混成“ 手拿把蒜 ”,被編輯部嘲笑了很久,于是我們就問 GPT-4 “ 手拿把蒜什么意思?” 結果牛掰了,GPT-4 在理解了一部分“ 把蒜(攥)”是形容事情輕而易舉的基礎上,引經據典地胡編亂造,頗有種當年我寫作文時,引用的俄羅斯文學家“ 沃茲基索德 ”的味道了。 要知道,如果是真實場,這個半真半假、引用權威的胡說八道的后果將是非常嚴重的,堪稱最高級的謊言。 明明連更老的 ChatGPT 也不敢這么捏造來源地胡說,更高級的 GPT-4 怎么會這樣呢? 我們猜測,就是因為 新版本更傾向于表現出 “ 更具有深度思考 ”,這么一來,在回答很多問題的時候,GPT-4 會自己給自己加戲,才會出現這些鬧劇 。 雖然我們試了這么多漏洞,但總的來講,這次發布的 ChatGPT,無論是基礎功能、想象空間、邏輯能力、思考能力,都比之前強了一大截。  明明距離老版本 ChatGPT 顛覆我們的認知才沒幾個月,它們就又掏出了一個船新版本,我們只能說: 恐怖如斯。 更恐怖的是,其實 GPT-4 誕生時間,可能比我們想的還要早很多,之前 OpenAI 發布基于 GPT-3.5 的 ChatGPT 時,內部員工就質疑過為啥發個這么古早的版本。 而我們也早就接觸過 GPT-4 了,New Bing 官方今天發了個公告,承認了 New Bing 其實就是 GPT-4。 所以這么說的話,有沒有種可能,GPT-5 也已經近了呢? 我已經開始期待除了文字、圖片以外,視頻、音頻等形式的輸入了。 撰文: 大餅 & 小陳 & 四大 & 八戒編輯:面線 & 江江封面:萱萱 圖片、資料來源: OpenAI、New Bing 官網、Twitter、Be My Eyes New York Times:How ChatGPT Kicked Off an A.I. Arms Race 如果您覺得本文寫的還不錯 歡迎關注差評孵化的商業財經類賬號:知危( ID:BusinessAlert )
GPT- ChatGPT 能力 問題 回答
分享到:

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。