就在OpenAI宣布獲得史上最大規模66億美元融資的第二天,又推出了自ChatGPT問世兩年來的首次重大界面更新“canvas(畫布)”。
canvas是一個全新設計的交互界面,專為寫作和編程任務設計。不再局限于傳統的聊天模式,而是通過在标準對話框旁開啟的獨立窗口,提供一個用戶與ChatGPT的深度協作空間,共同創建和優化項目。
它基于特别訓練的GPT-4o構建,用戶可以直接在這裡編輯文本或代碼。選定任何需要修改的部分,ChatGPT就會基于上下文環境給出精準的優化建議。系統還提供了包含調整文本長度、更改閱讀水平、代碼審查修複、添加等在内的快捷菜單。此外,通過 “返回”按鈕,用戶可以輕松恢複之前的工作版本。
打開canvas很簡單:在模型選擇器中選擇“GPT-4o with canvas”,隻需輸入“使用canvas…”或“啟動canvas…”之類的提示,新窗口就會彈出。當ChatGPT檢測到可能有幫助的場景時,無需用戶調用,canvas也會自動打開。
具體來看看它的各項功能。
canvas輔助寫作
canvas可以根據指令為你生成一個項目初稿,供你與AI一起編輯,也可以對現有草稿進行優化。适合長文章、報告、策劃案或電子郵件等内容撰寫。
内置5項實用的寫作快捷功能:
建議編輯:由ChatGPT提供行内建議和反饋。
調整長度:将文檔長度擴充或精簡。
更改閱讀水平:調整閱讀水平,範圍涵蓋從幼兒園、中學、大學到研究生。
最終潤色:全面檢查語法、清晰度和一緻性。
添加emoji:添加相關表情符号以增強趣味色彩。
矽星人也淺試了一下,在canvas裡讓GPT寫一篇介紹OpenAI本周新聞的文章,然後翻譯為中文。可以看到中文稿直接覆蓋原英文生成,而不是以問答形式另起對話。
進一步用“建議編輯”補充内容後,分别生成“Graduate School”和“Kindergarten”版本來對比看看差異。
除了AI智能改進之外,還能直接在原文調整字體加粗、斜體、字号等格式。
簡單來說,canvas拓展了一種與ChatGPT的全新交互方式。集成多種工具,讓用戶在聊天和文檔編輯之間無縫轉換,輕松将對話中的想法變為成熟的最終版本。在一個平台完成全套寫作過程,有效避免了工作流的中斷。
用canvas編程
與寫作類似,編程也是一個需要反複疊代的過程,且對邏輯的嚴密性有更高的要求。為了幫助開發者更高效完成代碼編寫和調試,canvas 也配備了一些相關的便捷功能,包括:
代碼審查:ChatGPT提供編建議,供用戶批準或拒絕,幫助優化代碼質量。
添加logs:插入print日志輸出,幫助開發者跟蹤程序運行情況,方便調試。
添加comments:為代碼添加注釋,便于理解代碼。
修複錯誤:自動檢測并修複代碼中的問題,減少調試時間。
代碼移植:将現有代碼轉換為不同編程語言,如JavaScript、Python、Java等,便于跨語言開發。
使用o1-preview輸出的合成數據特别訓練
OpenAI對canvas集成的GPT-4o進行了專門訓練,使其能夠在創作過程中擔任更積極的協作者角色,并且具備更好的上下文感知能力。
為此,研究團隊開發了“在寫作和編程任務中自動觸發畫布、生成多樣化内容類型、執行有針對性的編輯、重寫文檔、提供内嵌批注與建議”等核心功能。
訓練方法上,應用了他們一直強調的合成數據生成技術,從o1-preview模型中提取輸出,幫助GPT-4o針對目标功能進行後期訓練。這一方法使ChatGPT能夠快速提升寫作質量,并适應新的用戶交互模式,無需依賴人工生成的數據。
(如果擔心自己上傳的内容被OpenAI用于模型訓練,記得到用戶設置裡關閉“數據共享”選項。)
canvas集成模型評估
為了評估模型表現,OpenAI進行了超過20項内部自動化測試。
其中一個關鍵挑戰是定義何時觸發canvas功能。研究團隊教會模型在處理複雜寫作任務時正确觸發畫布,比如“撰寫博客文章”,而避免在類似“幫我做一道晚餐食譜”這樣的簡單問答中過度觸發。經過優化後,GPT-4o在寫作任務中的正确觸發率達到83%,編程任務的正确率更高,達到了94%。
第二個挑戰是模型在canvas被觸發後的編輯行為。比如在用戶明确選擇特定文本時進行有針對性的編輯(targeted edit),其他情況下則傾向于重寫(rewriting)。結果顯示,特别訓練後的GPT-4o在針對性編輯上的準确率比基線模型提高了18%。
此外,團隊還通過人工評估驗證了模型生成高質量評論的能力。相比零樣本提示的GPT-4o,canvas集成的模型在評論準确性上提升30%,在評論質量上提升16%。
OpenAI開始卷應用
可用性方面,canvas測試版已對Plus和Team用戶開放,下周起擴展至教育及企業用戶,最終會讓所有用戶都能免費訪問。
OpenAI表示,canvas目前仍處于早期階段,但他們計劃迅速提升其功能。對于那些需要頻繁編輯和修改的複雜任務,讓canvas成為傳統聊天界面的有力補充,實現“更自然”的人機協作願景。
Canvas并不算OpenAI掀起的全新交互模式,也離最理想的AI與人類交互形态還很遠。而且,在canvas身上,用戶能看到很多OpenAI對手已經做出來的産品形态的影子。它就像Anthropic的Artifacts工具及AI代碼編輯器Cursor等明星應用産品功能的大雜燴,然後在這些基礎上做了一些細節的升級。
很明顯,卷應用是OpenAI新的發力方向。此前OpenAI其實在應用的交互體驗和細節設計上都有些遲緩,這家公司在GPT模型依然能保持領先的階段,并沒有體現出對産品的重視。現在模型能力的格局已經完全不同,不僅差距縮小,而且當前多家大模型和消費級AI提供商都将可編輯工作空間作為生成式AI的最新突破點。
除了上面提到的幾款應用,此前谷歌不僅将Gemini集成到Docs,它的NotebookLM近期創新的AI播客功能也大受好評,現在OpenAI也加入了進來。
随着大量資金仍在流向矽谷的AI公司,消費者在未來一年内可以期待更多基于現有工具的結構性實驗新品推出。隻不過這個過程裡,OpenAI變得更像一個追随者,而非引領者了。