人工智慧新聞: 探索OpenAI在通用人工智慧方面的進展和最新發展

探索 OpenAI 從聊天機器人到 AI 組織的 AGI 開發路線圖。了解他們的新型 Strawberry 推理技術,以及圍繞 OpenAI 的最新新聞和爭議。探索 AI 如何改變教育、影片創作等領域。緊跟 AI 新聞和發展的最新動態。

2025年1月13日

party-gif

探索人工智慧的最新進展,從OpenAI邁向通用人工智慧的進程,到新的AI模型和工具的發佈,這些都可以徹底改變您的工作方式。本篇部落格文章提供了您需要了解的最重要的AI新聞和發展的全面概述。

Open AI的五個層次邁向AGI

開放人工智慧(Open AI)已概述了實現人工通用智慧(AGI)的五個進度階段:

  1. 聊天機器人和具有對話語言能力的人工智慧: 這個階段代表了目前聊天機器人和語言模型(如ChatGPT、Claude和LLaMA)的現狀。

  2. 能夠進行人類水平問題解決的推理系統: 開放人工智慧聲稱他們已經非常接近實現這個階段,這涉及到能夠以人類水平進行推理和解決問題的系統。

  3. 能夠代表我們採取行動的代理人或系統: 這個階段包括能夠執行如預訂航班、回覆電子郵件等任務的人工智慧代理。

  4. 能夠協助創新的人工智慧: 這個階段的人工智慧系統可以創造新的想法,並協助發明過程。

  5. 能夠完成整個組織工作的組織和人工智慧: 最終階段涉及能夠執行整個組織工作的人工智慧系統。

開放人工智慧相信他們目前處於第二個階段的臨界點,並期望通過這些階段實現真正的AGI。

草莓:Open AI的新推理技術

開放人工智慧一直在開發一種名為「草莓」的新推理技術。根據一份內部洩露的文件,開放人工智慧內部的團隊正在開發這個項目,目的是創造一個不僅能夠回答查詢,而且能夠提前計劃並自主瀏覽互聯網進行「深度研究」的模型。

開放人工智慧正在針對「草莓」的關鍵功能,包括:

  • 執行需要規劃和一系列長期行動的長期任務和複雜問題。
  • 利用這些功能自主瀏覽網絡,在電腦代理的協助下進行研究。

雖然關於「草莓」的具體進度信息有限,但它似乎是開放人工智慧朝著他們概述的五個人工智慧能力階段前進的重要一步,更接近真正的人工通用智慧(AGI)。據報導,這個項目之前被稱為「QAR」,但這一點尚未得到官方確認。

開放人工智慧一直對即將推出的模型保持緊密的保密,所以更多關於「草莓」的信息可能要等到公開發布時才會浮出水面。

對Open AI做法的擔憂

開放人工智慧因其商業行為受到了質疑,有內部人士指控該公司非法阻止員工向政府監管機構透露工作中的問題,並剝奪他們舉報的權利。

一封寄給SEC主席的信指稱,開放人工智慧有一項政策禁止員工進行受保護的披露。這並非開放人工智慧的政策和合同首次受到審查,該公司之前被發現強迫人們簽署不得貶低公司的協議,否則可能會失去已歸屬的股權。

雖然開放人工智慧否認了這些指控,聲稱他們有保護員工舉報者權利的政策,但這些報告表明,隨著公司規模和知名度的增長,它可能正在重新審視其合同,以應對日益增加的公眾審視。這些指控引發了人們對開放人工智慧對待員工以及組織內部潛在問題透明度的擔憂。

Dolly圖像模型的潛在更新

有人猜測,OpenAI的Dolly圖像模型最近可能已經得到更新。這是基於觀察到該模型生成圖像中的文字能力有所改善,文字看起來比以前更清晰可讀。

具體來說,X(原Twitter)用戶「angry penguin」發布的一張圖像清楚地顯示了「evolve」這個單詞 - 這與該模型之前在生成可讀文字方面的困難相比是一個顯著的進步。

此外,如果提示Dolly生成一張「機器人手持標牌上寫著'請訂閱'」的圖像,結果顯示文字比之前更清晰。

這些觀察表明,OpenAI可能已經對Dolly模型進行了更新,提升了其文字生成能力。但是,任何潛在更新的具體範圍和細節都未得到該公司的官方確認。

值得一提的是,如果你沒有ChatGPT Plus帳戶,你可以在Bing Image Creator網站上免費使用Dolly 3模型。這可能是一個方便的選擇,讓你在不需要付費訂閱的情況下也能試用Dolly模型。

Sora的新演示

我們收到了更多來自Sora的演示視頻,這只是讓人們更加渴望能真正使用它。然而,我們確實有一些像Runway Gen 3和Luma's Dream Machine這樣的工具,可以創造出相當不錯的AI生成視頻,這稍微減弱了人們對Sora的興奮感。

儘管如此,Sora可以創造出更長的視頻,而且Open AI通常都會在他們推出的東西中設定新的標準,所以我仍然對它感到興奮。Matthew Berman在X上分享的新演示視頻看起來相當出色,展示了黑白片段和海浪撞擊的場景。雖然我們現在有一些工具可以暫時滿足這種需求,但Sora的潛在能力仍然備受期待。

HubSpot為在工作中使用ChatGPT提供的資源

如果你在工作中使用人工智慧,或者正在考慮在工作中使用人工智慧,你需要查看HubSpot提供的一個完全免費的套件,名為「在工作中使用ChatGPT的五個必備資源」。

這個資源包括:

  • 關於何時應該或不應該使用ChatGPT的有趣流程圖
  • 一個模板,確保ChatGPT生成的內容遵循您品牌的語音
  • 一份AI生成內容修改檢查清單
  • 在工作場所採用AI的全面檢查清單
  • 一份指南,介紹如何使用ChatGPT提升您的工作效率,包括100種嘗試方法

這個來自HubSpot的完全免費資源的鏈接在下面的描述中。如果你還沒有採用人工智慧,請記住Nvidia CEO Jensen Huang的話 - 人工智慧將是21世紀最具變革性的技術,並將影響每個行業和我們生活的各個方面。所以如果你還沒有使用人工智慧來加快和提高工作質量,你的競爭對手可能已經在這樣做了。

Andre Karpathy的新教育公司Eureka Labs

Andre Karpathy,之前曾在OpenAI工作,最近離開後,剛剛宣布了他正在從事的一個新的創業項目。他說他「很高興分享我正在創辦一家名為Eureka Labs的人工智慧加教育公司」。

在Eureka Labs,他們正在建立一種全新的「人工智慧原生」學校。他們表示,擁有深厚專業知識、擅長教學、無限耐心,並精通世界上所有語言的專家學者是非常稀缺的,無法親自為全球80億人提供一對一輔導。

這項宣布表明,Eureka Labs正在創建一個在線教育平台,教師仍然負責設計課程材料,但他們會得到一個經過優化的人工智慧教學助手的支持、利用和擴展。這個人工智慧助手旨在幫助指導學生完成課程內容。

雖然細節有限,但這個概念似乎是將教師的專業知識和教學材料訓練到人工智慧模型中,使人工智慧能夠以任何語言為學生提供個性化的輔導和支持,這可能會大大擴大個別專家學者的影響力。

Anthropic發布Android版本的CLA

如果你是Anthropic的CLA的粉絲,而且你沒有iPhone,那麼好消息 - 他們剛剛在Android上發布了它。它在iOS上已經推出了幾個月,現在他們也推出了Android版本。

就個人而言,我仍然更喜歡ChatGPT應用程式,主要是因為ChatGPT應用程式的對話語音功能非常出色。當我在電腦上時,我通常會使用CLA或Perplexity。但當我在手機上時,我仍然傾向於使用ChatGPT應用程式。

不過,我明白大多數人可能不想為單獨的聊天訂閱付費。所以如果你真的喜歡與人工智慧進行語音對話的功能,ChatGPT應用程式仍然是最好的選擇。但如果你不在乎這個,只想要最好的模型在手,CLA可能是更好的選擇。現在他們也有了Android應用程式。

關於AI訓練數據和被盜用的YouTube視頻的爭議

本週有一些關於各種AI模型訓練數據來源的爭議。Proof News的一篇文章聲稱,Apple、Nvidia和Anthropic使用了數千個被盜的YouTube視頻來訓練他們的AI模型。

這個問題源於一家名為Uther AI的公司,它是一個開源項目,收集了一個名為「the Pile」的大型數據集,來自於公開可用的數據。事實證明,這個數據集的很大一部分是直接從YouTube視頻中抄錄的文字稿。

包括MKBHD、Mr. Beast和PewDiePie等多位知名YouTuber都注意到他們的內容被包含在這個數據集中。Proof News甚至創建了一個搜索引擎,讓人們可以檢查他們的視頻是否被包括在內。

在這一爭議浮出水面後,Apple承認使用了「the Pile」進行某些研究目的,但表示用於Apple Intelligence的模型並未訓練於這些數據。使用AI創建圖像的Microsoft Designer平台也被牽連到使用被盜的YouTube內容。

未經許可使用版權材料來訓練AI模型引發了人們對這種做法的道德和法律影響的擔憂。隨著AI技術的不斷進步,數據來源和內容創作者權利的問題很可能會成為該行業持續面臨的挑戰。

Microsoft Designer在應用程式中的整合

Microsoft推出了一個名為Designer的平台,非常類似於Canva。這是一個用於創建各種內容的平台,如YouTube縮略圖、橫幅廣告、Instagram圖像等。這個Designer平台現在正被集成到微軟的各種應用程式中。

這個集成的主要功能包括:

  • Co-Pilot側邊欄:用戶可以在微軟應用程式內訪問Co-Pilot側邊欄,以創建特定風格的圖像。
  • 圖像生成:Designer平台可以根據用戶的提示生成圖像,然後直接拉入用戶的文檔、PowerPoint或其他微軟工具。
  • 移動應用程式:微軟還發布了iOS和Android的免費Designer移動應用程式,讓用戶能夠在移動設備上輕鬆創建和編輯圖像。

Designer平台更新的其他值得注意的功能包括:

  • 重塑功能:用戶可以上傳一張圖像,平台會將其重塑為不同的風格。
  • 擴展功能:Designer平台獲得了許多新功能和能力,以增強圖像創建和編輯體驗。

總的來說,將Microsoft Designer集成到各種微軟應用程式中,為用戶提供了一個強大的AI驅動工具,可以直接在他們日常使用的應用程式中生成和操作圖像。

Mistol發布Cod Stroll Mamba語言模型

法國AI公司Mistol,開發了一個名為Cod Stroll Mamba的

常問問題