Xiaohu demonstra um fluxo de trabalho entre modelos: GPT gera imagens + Gemini 3.1 Pro transforma em conteúdo 3D interativo

ChainNewsAbmedia

O observador de IA chinês xiaohu compartilhou em 10 de maio um exemplo de fluxo de trabalho que combina GPT e Gemini 3.1 Pro: primeiro, usar GPT para gerar imagens e, depois, usar Gemini 3.1 Pro para transformar as imagens em conteúdo interativo 3D. Isso permite transformar qualquer tema de conhecimento em aplicações científicas rotacionáveis e acionáveis. O post do xiaohu no Twitter mostra exemplos como exibições de planetas em 3D, modelos científicos interativos etc., que são uma prática concreta de “fluxo de trabalho entre modelos” (multi-model workflow).

Estrutura do fluxo de trabalho: GPT cria imagens → Gemini 3.1 Pro as transforma em 3D

O design do fluxo de trabalho em duas etapas:

Etapa um: usar GPT (GPT-image-1 ou geração de imagens embutida no ChatGPT) para produzir imagens temáticas e fornecer base visual

Etapa dois: inserir a imagem no Gemini 3.1 Pro, que transforma imagens 2D em conteúdo interativo 3D

Formato de saída: objetos 3D que podem ser rotacionados, ampliados e interagidos dentro do navegador

Cenários de uso: educação científica, demonstração de produtos, conteúdos de conhecimento interativo

“Fluxo de trabalho entre modelos” é uma das principais tendências da camada de aplicações de IA em 2026 — um único modelo não é mais uma solução universal; desenvolvedores conectam partes mais fortes de modelos diferentes para criar aplicações que um único modelo não conseguiria fazer.

Demonstração específica: planetas em 3D, conteúdo científico interativo, site de vendas com robôs

Vários exemplos publicados pelo xiaohu em paralelo:

Exibição de planetas em 3D: sistema solar rotacionável ou modelo de um único planeta

Conteúdo científico interativo: transformar conhecimento abstrato em visualização 3D, adequado para fins educacionais

Site futuro de máquina de venda com robôs: usar GPT para gerar imagens e a plataforma Tripo 3D para criar uma página de demonstração

As características em comum desses exemplos é “geração visual + conversão interativa” — o GPT fica responsável pela visão criativa, enquanto o Gemini ou outras ferramentas 3D ficam responsáveis por transformar imagens estáticas em formatos interativos acionáveis. Tirado uma peça por vez, cada trecho isolado não é algo novo, mas ao conectar, a experiência final é melhor do que a de qualquer ferramenta única.

Significado: fluxo de trabalho entre modelos se torna gradualmente o modo de desenvolvimento principal

Implicações concretas para desenvolvedores:

Escolher a ferramenta certa é mais importante do que escolher o modelo mais forte — o GPT é forte em visual, o Gemini em compreensão multimodal, o Claude em long context, e cada um tem seu ponto forte

O custo de integração de APIs de modelos cai, e conectar vários modelos em nível de implementação fica viável

Aplicações novas provavelmente serão “pipelines entre modelos”, e não uma extensão de “um único modelo mais forte”

O valor deste caso não está em uma ruptura técnica, e sim em um modelo de design de fluxo de trabalho

Eventos específicos que podem ser acompanhados depois: se a capacidade de geração 3D do Gemini 3.1 Pro será anunciada oficialmente pela Google como função de produto em atividades posteriores; se o fluxo de trabalho entre modelos receberá suporte a templates padrão em frameworks como LangChain/LlamaIndex; e exemplos concretos de adoção em casos comerciais (como educação, e-commerce, marketing).

Este artigo, em que o xiaohu demonstra o fluxo de trabalho entre modelos: GPT gera imagens + Gemini 3.1 Pro transforma em conteúdo interativo 3D, surgiu pela primeira vez em 鏈新聞 ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

A Alibaba Cloud lança um plano de token de equipe com 10+ modelos hoje

De acordo com Beating, a Alibaba Cloud lançou hoje seu Team Token Plan, oferecendo assinaturas para mais de 10 grandes modelos de linguagem, incluindo Qwen 3.6, Kimi-K2.6, GLM-5.1 e Wan 2.7. Os usuários podem alternar de forma flexível entre os modelos para geração de código, síntese de imagem e outras tarefas. A versão para equipes difere dos planos pessoais por meio de recursos de gerenciamento empresarial. Administradores podem gerenciar a alocação de assentos, acompanhar o uso e definir cont

GateNews3h atrás

Dongguan enviará metade das lentes/óculos de IA do mundo em 2025

Empresas sediadas em Dongguan enviaram mais de 4 milhões de pares de óculos de IA em 2025, respondendo por quase metade do total global de 8,7 milhões de pares, segundo a empresa de pesquisa Omdia. A cidade chinesa de Guangdong ficou em primeiro lugar no mundo em volume de remessas, enquanto as remessas globais de óculos de IA subiram 322% em comparação com o ano anterior. Posição de Mercado de Dongguan e Apoio do Governo A liderança da cidade na fabricação de óculos de IA reflete tanto sua infr

CryptoFrontier5h atrás

UXLINK integra a infraestrutura de computação de IA da Origins Network para escalar a Web3

De acordo com o anúncio oficial da UXLINK em 11 de maio, o protocolo social Web3 anunciou uma colaboração estratégica com a Origins Network para integrar infraestrutura descentralizada de computação de IA ao seu ecossistema. A parceria visa aprimorar a plataforma da UXLINK ao incorporar a infraestrutura modular de blockchain da Origins Network, melhorando as capacidades computacionais para aplicações descentralizadas orientadas por IA. A integração vai aproveitar o mecanismo de Proof-of-Computat

GateNews10h atrás

A Tencent Cloud impulsiona o serviço bancário com IA do Ryt Bank para 50.000 usuários no dia do lançamento

De acordo com a Tencent Cloud, em 11 de maio, a empresa fez parceria com o banco digital Ryt Bank, com sede na Malásia, para apoiar seu serviço de banking conversacional orientado por IA usando o Tencent Cloud Chat para mensagens em tempo real. O sistema atendeu 50.000 usuários ativos no dia do lançamento, sem interrupções, permitindo que os clientes dessem instruções de pagamento em linguagem simples em vez de navegar pelos menus do aplicativo. A Ryt Bank chegou a 1,2 milhão de usuários em mais

GateNews11h atrás

Reactor lança demonstração de um modelo de mundo em tempo real, alcançando 7,8 milhões de visualizações

De acordo com Beating, a Reactor lançou hoje sua demonstração de modelo de mundo em tempo real, permitindo que os usuários gerem cenas 3D interativas por meio de processamento de IA baseado na nuvem. O modelo é executado na infraestrutura global de nuvem com baixa latência da empresa, eliminando a necessidade de hardware local. Em um vídeo de demonstração com um carro esportivo vermelho navegando por uma paisagem desértica alienígena, a IA renderizou a física do terreno e objetos planetários dis

GateNews12h atrás

A Minara lança hoje seu primeiro copilot de IA para mercado de previsões Hyperliquid HIP-4

De acordo com a BlockBeats, a Minara AI lançou hoje (11 de maio) o AI Prediction Copilot, tornando-se a primeira ferramenta de IA para mercados de previsão integrada ao mercado HIP-4 da Hyperliquid. O sistema analisa tendências de curto prazo do BTC, níveis de suporte e resistência e discrepâncias de preços do mercado para fornecer recomendações de trading YES/NO. O Copilot gera, em tempo real, a probabilidade da IA, a probabilidade implícita pelo mercado, o valor da vantagem (edge) e os retorno

GateNews12h atrás
Comentário
0/400
Sem comentários