Xiaohu mendemonstrasikan alur kerja lintas model: GPT untuk menghasilkan gambar + Gemini 3.1 Pro mengubahnya menjadi konten interaktif 3D

ChainNewsAbmedia

Pengamat AI berbahasa Tionghoa, xiaohu, pada 10 Mei membagikan contoh alur kerja yang menggabungkan GPT dan Gemini 3.1 Pro: pertama menggunakan GPT untuk menghasilkan gambar, lalu Gemini 3.1 Pro mengubah gambar tersebut menjadi konten interaktif 3D, yang dapat mengubah topik pengetahuan apa pun menjadi aplikasi ilmiah yang bisa diputar dan dapat dioperasikan. Contoh yang ditunjukkan xiaohu di cuitannya mencakup pameran planet 3D, model sains interaktif, dan lainnya—ini merupakan praktik nyata dari “alur kerja lintas model” (multi-model workflow).

Struktur alur kerja: GPT gambar-ke-bangun → Gemini 3.1 Pro 3D

Desain dua tahap dari seluruh alur kerja:

Tahap satu: gunakan GPT (GPT-image-1 atau gambar generator bawaan di ChatGPT) untuk menghasilkan gambar utama topik serta menyediakan dasar visual

Tahap dua: masukkan gambar ke Gemini 3.1 Pro, lalu Gemini mengubah gambar 2D menjadi konten interaktif 3D

Format keluaran: objek 3D yang bisa diputar, dizoom, dan diinteraksikan langsung di dalam browser

Skenario yang cocok: pendidikan sains, pameran produk, konten pengetahuan interaktif

“Alur kerja lintas model” adalah salah satu tren kunci di lapisan aplikasi AI tahun 2026—bukan lagi satu model saja yang bisa menyelesaikan semuanya. Pengembang merangkai bagian terbaik dari berbagai model untuk membuat aplikasi yang tidak bisa dicapai oleh satu model.

Tampilan spesifik: planet 3D, konten sains interaktif, situs web penjualan robot

Beberapa contoh yang juga dipublikasikan xiaohu secara bersamaan:

Pameran planet 3D: tata surya yang dapat diputar atau model planet tunggal

Konten sains interaktif: mengubah pengetahuan abstrak menjadi visualisasi 3D yang cocok untuk tujuan edukasi

Situs web masa depan mesin penjual otomatis robot: menggunakan GPT untuk menghasilkan gambar, lalu ditambah platform Tripo 3D untuk membuat halaman web yang bersifat pameran

Ciri bersama dari contoh-contoh ini adalah “generasi visual + konversi interaktif”—GPT bertanggung jawab atas visual kreatif, sementara Gemini atau alat 3D lainnya bertanggung jawab untuk mengubah gambar statis menjadi bentuk interaktif yang bisa dioperasikan. Mengambil setiap bagian secara terpisah tidak dianggap baru, tetapi setelah dirangkai, pengalaman akhirnya lebih kuat daripada alat tunggal mana pun.

Makna: alur kerja lintas model secara bertahap menjadi pola pengembangan arus utama

Implikasi spesifik bagi pengembang:

Memilih alat yang tepat lebih penting daripada memilih model paling kuat—GPT kuat di sisi visual, Gemini kuat di pemahaman multimoda, Claude kuat di long context, masing-masing punya “titik manis” sendiri

Biaya integrasi API model menurun, merangkai beberapa model dalam implementasi menjadi layak

Aplikasi tipe baru kemungkinan besar adalah “multi-model pipeline”, bukan sekadar pengembangan dari “model tunggal paling kuat”

Nilai dari kasus ini tidak terletak pada terobosan teknis, melainkan pada templat desain alur kerja

Peristiwa spesifik yang bisa diikuti selanjutnya: apakah kemampuan generasi 3D Gemini 3.1 Pro akan diumumkan Google secara resmi sebagai fitur produk dalam aktivitas berikutnya; apakah alur kerja lintas model akan memperoleh dukungan templat bawaan dalam framework seperti LangChain/LlamaIndex; serta contoh penerapan kasus komersial (misalnya pendidikan, e-commerce, pemasaran) yang spesifik.

Artikel ini yang mendemonstrasikan alur kerja lintas model xiaohu: GPT menghasilkan gambar + Gemini 3.1 Pro mengubahnya menjadi konten interaktif 3D, pertama kali muncul di 鏈新聞 ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Alibaba Cloud Meluncurkan Rencana Token Tim dengan 10+ Model Hari Ini

Menurut Beating, Alibaba Cloud meluncurkan Program Token Tim hari ini, menawarkan langganan ke 10+ model bahasa besar termasuk Qwen 3.6, Kimi-K2.6, GLM-5.1, dan Wan 2.7. Pengguna dapat berpindah model secara fleksibel untuk pembuatan kode, sintesis gambar, dan tugas lainnya. Versi tim berbeda dari paket personal melalui fitur manajemen perusahaan. Administrator dapat mengelola alokasi kursi, memantau penggunaan, dan menetapkan kontrol anggaran di tiga tingkat: Standard, Premium, dan Elite. Platf

GateNews5jam yang lalu

Dongguan Mengirimkan Setengah dari Kacamata AI Global pada 2025

Perusahaan berbasis Dongguan mengirim lebih dari 4 juta pasang kacamata pintar AI pada 2025, menyumbang hampir setengah dari total global 8,7 juta pasang, menurut firma riset Omdia. Kota di Guangdong itu menempati peringkat pertama di dunia berdasarkan volume pengiriman, sementara pengiriman kacamata pintar AI global naik 322% dibanding tahun sebelumnya. Posisi Pasar Dongguan dan Dukungan Pemerintah Dominasi kota itu dalam manufaktur kacamata pintar AI mencerminkan baik infrastruktur elektronik

CryptoFrontier7jam yang lalu

UXLINK Mengintegrasikan Infrastruktur Komputasi AI dari Origins Network untuk Skalabilitas Web3

Menurut pengumuman resmi UXLINK pada 11 Mei, protokol sosial Web3 mengumumkan kolaborasi strategis dengan Origins Network untuk mengintegrasikan infrastruktur komputasi AI yang terdesentralisasi ke dalam ekosistemnya. Kemitraan ini bertujuan untuk meningkatkan platform UXLINK dengan memasukkan infrastruktur blockchain modular dari Origins Network, sekaligus memperbaiki kemampuan komputasi untuk aplikasi terdesentralisasi berbasis AI. Integrasi ini akan memanfaatkan mekanisme Proof-of-Computation

GateNews11jam yang lalu

Tencent Cloud Menggerakkan Layanan Perbankan AI Ryt Bank untuk 50.000 Pengguna pada Hari Peluncuran

Menurut Tencent Cloud, pada 11 Mei, perusahaan bermitra dengan bank digital berbasis di Malaysia, Ryt Bank, untuk mendukung layanan perbankan percakapan yang digerakkan oleh AI dengan menggunakan Tencent Cloud Chat untuk pesan real-time. Sistem tersebut menangani 50.000 pengguna aktif pada hari peluncuran tanpa gangguan, memungkinkan pelanggan memberikan instruksi pembayaran dalam bahasa sehari-hari alih-alih menavigasi menu aplikasi. Ryt Bank telah mencapai 1,2 juta pengguna dalam lebih dari tu

GateNews12jam yang lalu

Reactor Meluncurkan Demo Model Dunia Real-Time, Mengumpulkan 7,8 Juta Tampilan

Menurut Beating, Reactor meluncurkan demo model dunia real-time hari ini, memungkinkan pengguna menghasilkan adegan 3D interaktif melalui pemrosesan AI berbasis cloud. Model ini berjalan di infrastruktur cloud global berlatensi rendah milik perusahaan, sehingga menghilangkan kebutuhan perangkat keras lokal. Dalam video demonstrasi yang menampilkan mobil sport merah melintasi lanskap gurun asing, AI merender fisika medan dan objek planet yang jauh secara real time sambil melacak kontrol pemain, m

GateNews13jam yang lalu

Minara Meluncurkan AI Copilot Pasar Prediksi Hyperliquid HIP-4 Pertama Hari Ini

Menurut BlockBeats, Minara AI meluncurkan AI Prediction Copilot hari ini (11 Mei), menjadi alat AI pasar prediksi pertama yang terintegrasi dengan pasar HIP-4 milik Hyperliquid. Sistem ini menganalisis tren jangka pendek BTC, level support dan resistance, serta perbedaan harga pasar untuk memberikan rekomendasi trading YES/NO. Copilot menampilkan probabilitas AI, probabilitas tersirat pasar, nilai edge, dan estimasi imbal hasil secara real time.

GateNews13jam yang lalu
Komentar
0/400
Tidak ada komentar