中文 AI 观察家 xiaohu 5 月 10 日分享一個結合 GPT 與 Gemini 3.1 Pro 的工作流範例:先用 GPT 生成圖像、再用 Gemini 3.1 Pro 把圖像轉換為 3D 互動內容、可把 будь-яку знання विषय做成可旋轉、可操作的科學應用。xiaohu 推文展示的範例包括 3D 行星展示、互動科學模型等、是「跨模型工作流」(multi-model workflow)的具體實踐。
工作流結構:GPT 生圖 → Gemini 3.1 Pro 3D 化
整個工作流的兩階段設計:
階段一:用 GPT(GPT-image-1 或 ChatGPT 內建的圖像生成)產出主題圖像、提供視覺基礎
階段二:把圖像輸入 Gemini 3.1 Pro、由 Gemini 把 2D 圖像轉換為 3D 互動內容
輸出形式:可在瀏覽器內旋轉、縮放、互動的 3D 物件
適用場景:科學教育、產品展示、知識互動內容
「跨模型工作流」是 2026 年 AI 應用層的關鍵趨勢之一—單一模型不再是萬能工具、開發者把不同模型最強的部分串接起來、做出單一模型做不到的應用。
具體展示:3D 行星、互動科學內容、機器人售貨網站
xiaohu 同步發布的多個範例:
3D 行星展示:可旋轉的太陽系或單一行星模型
互動科學內容:把抽象知識做成 3D 視覺化、適合教育用途
機器人售貨機未來網站:用 GPT 生圖加上 Tripo 3D 平台、做出展示型網頁
這些範例的共同特徵是「視覺生成 + 互動轉換」—GPT 負責創意視覺、Gemini 或其他 3D 工具負責把靜態圖像轉成可操作的互動形式。每一段單獨拿出來都不算新、但串接後的最終體驗比任何單一工具強。
意義:跨模型工作流逐漸成為主流開發模式
對開發者的具體啟示:
選對工具比選最強模型重要—GPT 強的視覺、Gemini 強的多模態理解、Claude 強的長 context、各有各的甜蜜點
模型 API 整合成本下降、串接多個模型在實作層級變得可行
新型應用很可能是「多模型 pipeline」、不是「最強單一模型」的延伸
本案的價值不在技術突破、而在工作流設計的範本
後續可追蹤的具體事件:Gemini 3.1 Pro 的 3D 生成能力是否被 Google 在後續活動正式公告為產品功能、跨模型工作流是否在 LangChain/LlamaIndex 等框架中取得預設模板支援、以及商業化案例(如教育、電商、行銷)的具體採用範例。
這篇文章 xiaohu 示範跨模型工作流:GPT 生圖 + Gemini 3.1 Pro 轉 3D 互動內容 最早出現於 鏈新聞 ABMedia。
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
Alibaba Cloud запускає план командних токенів із 10+ моделями сьогодні
Згідно з Beating, Alibaba Cloud сьогодні запустила свою Team Token Plan, пропонуючи підписки на 10+ великі мовні моделі, зокрема Qwen 3.6, Kimi-K2.6, GLM-5.1 і Wan 2.7. Користувачі можуть гнучко перемикатися між моделями для генерації коду, синтезу зображень та інших задач. Командна версія відрізняється від персональних планів функціями керування для підприємств. Адміністратори можуть керувати розподілом місць, відстежувати використання та встановлювати бюджетні обмеження в трьох тарифах: Standa
GateNews4год тому
Дунгуань відправить половину глобальних AI-окулярів у 2025 році
Компанії з Дунгуаню відправили понад 4 мільйона пар AI-окулярів у 2025 році, що становить майже половину від загального обсягу у світі — 8,7 мільйона пар, повідомляє дослідницька компанія Omdia. Місто в провінції Гуандун посіло перше місце у світі за обсягом відвантажень, тоді як глобальні поставки AI-окулярів зросли на 322% порівняно з попереднім роком. Ринкова позиція Дунгуаню та підтримка з боку уряду Перевага міста в виробництві AI-окулярів відображає як наявну електронну інфраструктуру, так
CryptoFrontier7год тому
UXLINK інтегрує інфраструктуру AI-обчислень Origins Network для масштабування Web3
Згідно з офіційним оголошенням UXLINK від 11 травня, Web3-соціальний протокол повідомив про стратегічну співпрацю з Origins Network, щоб інтегрувати інфраструктуру децентралізованих обчислень на основі ШІ в його екосистему. Партнерство має на меті посилити платформу UXLINK завдяки вбудовуванню модульної блокчейн-інфраструктури Origins Network, що покращить обчислювальні можливості для ШІ-орієнтованих децентралізованих застосунків. Інтеграція використовуватиме механізм Proof-of-Computation від Or
GateNews11год тому
Tencent Cloud забезпечує AI-банкінг-сервіс Ryt Bank для 50 000 користувачів у день запуску
За даними Tencent Cloud, 11 травня компанія співпрацювала з малайзійським цифровим банком Ryt Bank, щоб підтримати його AI-орієнтований розмовний банкінг-сервіс із використанням Tencent Cloud Chat для обміну повідомленнями в режимі реального часу. Система обробляла 50 000 активних користувачів у день запуску без простоїв, даючи клієнтам змогу формулювати інструкції щодо платежів простою мовою замість навігації меню застосунку. Ryt Bank досяг 1,2 мільйона користувачів менш ніж за сім місяців.
GateNews12год тому
Reactor запускає демонстрацію реальної моделі світу в реальному часі, зібравши 7,8 мільйона переглядів
За Beating, Reactor сьогодні запустила демонстрацію real-time world model, що дає змогу користувачам генерувати інтерактивні 3D-сцени завдяки хмарній обробці на основі ШІ. Модель працює на глобальній хмарній інфраструктурі компанії з низькою затримкою, тож немає потреби в локальному обладнанні. У демонстраційному відео із червоним спортивним авто, яке їздить по інопланетній пустелі, ШІ в реальному часі відтворив фізику місцевості та об’єкти на далеких планетах, одночасно відстежуючи керування гр
GateNews13год тому
Minara запускає перший AI-копілот для прогнозних ринків Hyperliquid на базі HIP-4 сьогодні
За даними BlockBeats, Minara AI сьогодні (11 травня) запустила AI Prediction Copilot, ставши першим інструментом для prediction market на базі ШІ, інтегрованим із ринком Hyperliquid HIP-4. Система аналізує короткострокові тренди BTC, рівні підтримки та опору, а також розбіжності в ринковому ціноутворенні, щоб надавати торгові рекомендації YES/NO. Copilot виводить імовірність від ШІ, ринково-імпліковану ймовірність, значення edge та очікувані прибутки в реальному часі.
GateNews13год тому