ChatGPT熱度還未散去,ChatGPT開發商OpenAI發布了更強大的GPT-4,堪稱“王炸”產品。
(資料圖片)
當地時間3月14日,OpenAI公開發布大型多模態模型GPT-4,與ChatGPT所用的模型相比,GPT-4不僅能夠處理圖像內容,且回復的準確性有所提高。目前GPT-4沒有免費版本,僅向ChatGPT Plus的付費訂閱用戶及企業和開發者開放。
來源:OpenAI官網
“這是OpenAI努力擴展深度學習的最新里程碑。”OpenAI介紹,GPT-4在專業和學術方面表現出近似于人類的水平。例如,它在模擬律師考試中的得分能夠排進前10%左右,相比之下,GPT-3.5的得分只能排在倒數10%左右。
與此前的GPT系列模型相比,GPT-4最大的突破之一是在文本之外還能夠處理圖像內容。OpenAI表示,用戶同時輸入文本和圖像的情況下,它能夠生成自然語言和代碼等文本。
目前圖像處理功能還未公開,不過該公司在官網上展示了一系列案例。例如,輸入如下圖片并詢問“這張圖片有什么不尋常之處”,GPT-4可作出回答“這張照片的不同尋常之處在于,一名男子正在行駛中的出租車車頂上,使用熨衣板熨燙衣服。”
來源:OpenAI官網
在官方演示中,GPT-4幾乎就只花了1-2秒的時間,識別了手繪網站圖片,并根據要求實時生成了網頁代碼制作出了幾乎與手繪版一樣的網站。
除了普通圖片,GPT-4還能處理更復雜的圖像信息,包括表格、考試題目截圖、論文截圖、漫畫等,例如根據專業論文直接給出論文摘要和要點。
GPT-4可對論文進行解讀,來源:OpenAI官網
與此前的模型相比,GPT-4的準確性有所提高。OpenAI稱,該公司花費6個月的時間,利用對抗性測試程序和ChatGPT的經驗教訓迭代調整GPT-4,從而在真實性、可操縱性和拒絕超出設定范圍方面取得了有史以來最好的結果,“至少對我們而言,GPT-4訓練運行前所未有地穩定,成為首個能夠提前準確預測其訓練性能的大型模型。”
OpenAI稱,在公司內部的對抗性真實性評估中,GPT-4的得分比最新的GPT-3.5高40%,相應的“不允許內容請求的傾向”降低了 82%,根據政策響應敏感請求(如醫療建議和自我傷害)的頻率提高了29%。
不僅是英語,該模型在多種語言方面均表現出優越性。OpenAI稱,在測試的26種語言中,GPT-4在24種語言方面的表現均優于GPT-3.5等其他大語言模型的英語語言性能。其中GPT-4的中文能夠達到80.1%的準確性,而GPT-3.5的英文準確性僅為70.1%,GPT-4英文準確性提高到了85.5%。
來源:OpenAI官網
不過, 與早期的GPT模型一樣,GPT-4仍然存在一定的局限性。
OpenAI稱,它并不完全可靠,可能會出現推理錯誤 ,“GPT-4缺乏對絕大多數數據切斷后(2021年9月)發生的事件的了解,并且無法從中吸取經驗教訓……它有時會出現簡單的推理錯誤,它會輕信用戶明顯的虛假陳述,有時它會像人類一樣在難題上失敗,例如在它生成的代碼中引入安全漏洞。”
基于此,OpenAI提醒,用戶在使用語言模型時應格外小心,最好輔助以人工審查、附加上下文、或完全避免在高風險情況下使用它。
值得注意的是,GPT-4雖然于14日才正式公開,但早在一個月前,微軟的新版搜索引擎必應(Bing)就已經在GPT-4 上運行。微軟表示,“如果您在過去五周內的任何時間使用過新版必應,那么您已經體驗過GPT-4的早期版本。”
與免費的ChatGPT不同,GPT-4目前僅向ChatGPT Plus的付費用戶開放,它也將作為API(應用程序編程接口)提供給企業及開發者,開發者需進入等候名單上,將該模型集成到他們的應用程序中。
OpenAI表示,已經有多家公司將GPT-4搭載到他們的產品中,包括語言學習工具軟件多鄰國(Duolingo)、移動支付公司Stripe和可汗學院(Khan Academy)。
相關報道
更強更可靠!OpenAI公布GPT-4:可在考試中超過90%的人類
GPT-4來了!支持以圖生文 OpenAI付款系統被擠爆 首批用戶連夜寫測評
ChatGPT進化到GPT-4!一文解讀OpenAI模型的應用場景和商業模式
未來已來?GPT-4剛上線就引發馬斯克恐慌 一文梳理其與3.5版本區別
ChatGPT成“西南偏南”熱議話題 OpenAI聯合創始人:未來AI更像一個全天候助手 將首先替代基于認知的工作
(文章來源:澎湃新聞)
標簽: