Skip to Content Facebook Feature Image

OpenAI新AI模型GPT-4o或將重塑人機互動 教師、同聲傳譯要失業?
AI手機還會遠嗎?

博客文章

OpenAI新AI模型GPT-4o或將重塑人機互動 教師、同聲傳譯要失業?
AI手機還會遠嗎?
博客文章

博客文章

OpenAI新AI模型GPT-4o或將重塑人機互動 教師、同聲傳譯要失業?
AI手機還會遠嗎?

2024年05月15日 11:32 最後更新:11:46

當地時間5月13日10時,OpenAI首席技術官Mira Murati在全球矚目的春季發佈會上揭幕了新一代AI巨擘——GPT-4o。這款全能型AI模型以其超乎尋常的實時多模態對話能力,引發全球關注。

OpenAI首席技術官Mira Murati。

OpenAI首席技術官Mira Murati。

據《華爾街見聞》,GPT-4o的特性在於其高度的即時響應和表達能力,如同真實人類一般,能夠同時處理文字、圖像、視頻和語音信息,且接受和中斷對話自如。OpenAI創始人Sam Altman暗示了GPT-4o強大的擬人化能力,他在社交平台上引用了電影《Her》中的概念,預示人機交互或開啓新篇章。

電影《Her》中,男主角愛上了一個像人類一樣「有血有肉」的AI。

電影《Her》中,男主角愛上了一個像人類一樣「有血有肉」的AI。

Murati宣佈,相較於GPT-4 Turbo,GPT-4o速度提升了兩倍,開放API接口的同時,用戶請求速率上限提升至之前的五倍。

更為引人關注的是,這一先進模型將全面免費開放,惠及ChatGPT的所有用戶,取消其他所有限制,API價格降低50%。

發佈會還展示了桌面版ChatGPT及全新用戶界面(UI)。

GPT-4o即日起逐步向用戶開放,未來還將增加語音和視頻理解等功能。

Murati稱,GPT-4o為每個用戶都提供了GPT-4級別的智能,同時還改進了GPT-4在文本、視覺以及音頻方面的能力。

借助GPT-4o,OpenAI通過跨文本、視覺和音頻端到端訓練了新模型,使得所有輸入和輸出都由同一神經網絡處理,進一步降低了延遲。

AP圖片

AP圖片

據稱,GPT-4o的語音響應延遲已顯著降低,平均為320毫秒,接近人類對話的反應速度。

演示環節,Murati邀研究主管Mark Chen和後訓練團隊負責人Barret Zoph共同展示了GPT-4o的強大功能,包括解方程、解讀代碼、實時翻譯,甚至能通過視頻識別面部情緒。

1)看圖指導解方程
演示中,Zoph在白板上寫了一個方程式3x+1=4,ChatGPT給他提示,引導他完成每一步解答,識別他的書寫結果,幫助他解出了X的值。

2)解讀屏幕信息
Zoph將一段Python代碼輸入ChatGPT,並讓ChatGPT用一句話總結這段代碼在做什麼。GPT回答無誤,並詳細說明瞭數據是如何被處理的。

隨後,Zoph又運行了這段代碼,GPT能夠準確地描述出所生成圖表的具體含義,包括圖表主題、XY軸信息、峰值水平。

3)實時交替翻譯
GPT還在演示中扮演了翻譯員的角色。應社交媒體X的用戶請求,Murati現場對ChatGPT說起了意大利語,GPT則將她的話翻譯成英語,轉告Zoph和Chen;聽完Murati說的意大利語,GPT再將其翻譯為英文並告訴Chen:「Mark,她(Murati)想知道鯨魚會不會說話,它們會告訴我們什麼?」 

4)通過視頻識別面部情緒
演示中,Zoph將手機舉到自己面前正對著臉,要求ChatGPT檢測他現在的情緒。最初,GPT參考了他之前分享的一張照片,將他識別為「木質表面」。經過第二次嘗試,GPT表示:「你看起來非常的開心,可能還有一點激動,看樣子你應該心情很不錯。」

Zoph贊揚了GPT的回答並表示自己正在進行一場演示,以展示「你有多不可思議」,此時GPT情緒頗為激動地表示:「快別說了!你讓我害羞了。」

這些演示彷彿證實了GPT-4o的特性,其「o」代表著「omni」,象徵著「全能」。

在後續的網絡實測視頻中,官方和用戶還探索出了GPT-4o的花樣玩法。

將老照片中的手寫字轉錄為電子文本。

將老照片中的手寫字轉錄為電子文本。

共享iPad屏幕後,讓GPT實時指導教學幾何題目。

和GPT視頻玩「石頭剪刀布」。

和GPT視頻玩「石頭剪刀布」。

正如Murati說,GPT-4o的發佈意味著OpenAI在大模型的易用性方面邁出了一大步,Ta正在改變人機交互的協作模式。

那麼,AI手機還會遠嗎?

此前有媒體報道透露,蘋果已經與OpenAI達成協議,將在全新操作系統iOS 18中引入ChatGPT技術,以升級Siri的對話體驗。

AP圖片

AP圖片

這不由令人猜想,GPT-4o和Siri將如何結合?OpenAI和蘋果會締造出具有跨時代意義的AI手機嗎?

英偉達高級研究科學家Jim Fan在X平台表示,iOS集成GPT技術可能會有三個層級:
1)放棄Siri。OpenAI為iOS提煉出更小型、純設備上的GPT-4o,並可選擇付費升級以使用雲。
2)將相機或屏幕傳輸到模型中的基礎功能。對神經音頻/視頻編解碼器的芯片級支持。
3)集成iOS系統操作API和智能家居API。Siri快捷方式是時候復活了。

有分析指出,蘋果和OpenAI的合作能夠解決彼此在發展邊緣AI方面的痛點,真正做到各取所需。

目前,有分析預測,蘋果將在6月10日的WWDC大會上官宣和OpenAI的合作夥伴關係,並推出基於蘋果LLM的AI聊天機器人。

AP圖片

AP圖片

令人激動的是,已經有移動端App開始接入GPT-4o了。

用於輔助盲人和弱勢群體日常生活的手機App Be My Eyes嘗試了接入GPT-4o,發現日常決策的效率被大大提高。

AP圖片

AP圖片

宣傳視頻顯示,一名盲人打開Be My Eyes後,能夠通過和GPT-4o對話,讓GPT詳細告訴他眼前的景象,從而快速做出決策。

有網友表示,這是GPT-4o的最佳用例,它將為視障人士創造一個全新的世界。

AP圖片

AP圖片

在所有演示結束後,Murati總結道:「正如大家所見,(如今的ChatGPT)真的很神奇。」




深喉

** 博客文章文責自負,不代表本公司立場 **

Tags:

理文OpenAI

美國稅務局長又再換人!由馬斯克推舉上任的加里·沙普利擔任代理局長僅三天,就被總統特朗普撤換,預計由財政部副部長邁克爾·福肯德接任,成為今年來第五位擔任該職位的人,亦是一周內第三次換人。

由馬斯克推舉上任的加里·沙普利(圖)擔任代理局長僅三天,就被總統特朗普撤換

由馬斯克推舉上任的加里·沙普利(圖)擔任代理局長僅三天,就被總統特朗普撤換

原本由特朗普所提名的國稅局局長正式人選是來自密蘇里州的前共和黨眾議員比利·朗,但他尚未在參議院獲確認聽證,在他正式獲任命之前,其工作由代理局長代為執行,而今次再次換馬,不單反映特朗普政府混亂的一面,有分析認為,背後揭示了美國財長貝森特與馬斯克之間的權力鬥爭,而貝森特青睞人選最終獲特朗普支持,也被認為是特朗普和馬斯克關係進一步降溫的信號。

預計財政部副部長邁克爾·福肯德將成為今年來第五位擔任美國稅務局長之人。

預計財政部副部長邁克爾·福肯德將成為今年來第五位擔任美國稅務局長之人。

據美國媒體報道,這場人事風波背後是貝森特向特朗普抱怨馬斯克繞過自己,推動沙普利獲得了這一職位的任命。事實上,雖然稅務機構應向貝森特匯報,但馬斯克的政府效率部(DOGE)通過白宮渠道強行推動了沙普利的任命,而沒有徵求或獲得貝森特的批准。

馬斯克和貝森特之間的不和於周四深夜公開。當時馬斯克放大了極右翼研究員勞拉·魯默(Laura Loomer)在社交媒體上發布的一篇帖子,談到貝森特與非營利組織「希望行動」(Operation HOPE)首席執行官約翰·霍普·布萊恩特(John Hope Bryant)的會面,該帖子指責貝森特與「特朗普仇恨者」勾結。馬斯克在轉發時寫道:「令人不安。」

美國財長貝森特

美國財長貝森特

本月初,在勞拉·魯默的影響下,已經有多名美國國家安全委員會的官員被清理。此前,她先是在網上攻擊了一些官員,然後前往橢圓形辦公室與特朗普會面,並向他提交了一份她認為「不忠誠」的官員名單。但此次國稅局代理局長的任免問題上,特朗普決定站在貝森特一邊。

這一決定出現在馬斯克最近幾周在特朗普身邊出現頻率降低的背景下。有白宮官員表示,與特朗普在任的頭幾周相比,「馬斯克已經沒有那麽讓人頭疼了」。

馬斯克

馬斯克

馬斯克

馬斯克

白宮新聞發言人萊維特並未直接回應爭端細節,但表示:「眾所周知,特朗普總統組建了一個充滿熱情的團隊。分歧是任何健康政策過程的正常部分,而且最終每個人都知道他們是為總統服務的。」

報道稱,雖然特朗普仍然公開對馬斯克表示友好,但他私下也承認馬斯克犯了錯誤。

報道稱,雖然特朗普仍然公開對馬斯克表示友好,但他私下也承認馬斯克犯了錯誤。

報道稱,雖然特朗普仍然公開對馬斯克表示友好,但他私下也承認馬斯克犯了錯誤,並表示他相信馬斯克不久將回到自己的私人公司。

報道稱,雖然特朗普仍然公開對馬斯克表示友好,但他私下也承認馬斯克犯了錯誤

報道稱,雖然特朗普仍然公開對馬斯克表示友好,但他私下也承認馬斯克犯了錯誤

值得注意的是,馬斯克並非首次公開攻擊特朗普的顧問。在過去兩周內,馬斯克曾在社交媒體平台X上批評特朗普的貿易顧問納瓦羅。

你 或 有 興 趣 的 文 章