A Xiaomi revela detalhes do treino do MiMo-V2-Pro: parâmetros do modelo 1T, milhares de GPUs implementadas

Mensagem do Gate News, 24 de Abril — A responsável da equipa de modelos de linguagem da Xiaomi, Luo Fuli, revelou numa entrevista aprofundada que o modelo MiMo-V2-Pro tem, no total, 1 bilião de parâmetros e que foram necessários milhares de GPUs para o treino. Ela referiu que a escala de 1T representa o limiar mínimo para obter desempenho a aproximar-se do nível do Claude Opus 4.6 e garantir um bilhete de entrada competitivo para a próxima fase dos agentes de IA.

Tecnicamente, a versão Pro utiliza um mecanismo de atenção esparsa extrema, com uma proporção de 7:1 entre a atenção global e a atenção por janela deslizante, controlando os custos de inferência para o processamento de longos contextos. O modelo mantém também a arquitectura MTP (Multi-Token Prediction) para aproveitar o poder de computação excedente e acelerar a inferência.

Do lado da gestão, a equipa MiMo, com 100 pessoas, tem apenas 30-40 indivíduos directamente envolvidos nas iterações centrais. A equipa opera sem hierarquias formais ou divisões explícitas em subgrupos e sem prazos de entrega. Quando se depara com problemas numéricos instáveis, como picos de perda durante o treino, a equipa dá prioridade a interromper o treino para investigação, mesmo que isso signifique parar as operações durante uma ou duas semanas e incorrer em milhões de dólares de custos de computação.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

O CEO da Microsoft, Nadella, presta depoimento no processo de Musk contra a OpenAI, Altman na segunda-feira

De acordo com a CNBC, o CEO da Microsoft, Satya Nadella, prestou declarações em tribunal federal em Oakland, Califórnia, na segunda-feira, 12 de maio, no processo em curso de Musk contra a OpenAI e o CEO Sam Altman. A Microsoft também é citada como arguida no caso. Musk alega que a Microsoft “prestou auxílio e cumplicidade” à OpenAI no incumprimento das suas obrigações perante a confiança de cariz solidário. Documentos do tribunal mostram que a Microsoft investiu mais de $13 mil milhões na OpenA

GateNews5m atrás

A Anthropic assina um acordo de 1,8 mil milhões de dólares de infraestruturas de cloud com a Akamai, podendo ultrapassar a avaliação de $852B da OpenAI

De acordo com a Bloomberg, a Anthropic assinou um contrato de 1,8 mil milhões de dólares de infraestruturas cloud com a Akamai durante a call de resultados do primeiro trimestre de 2026 da empresa. O acordo de sete anos assinala o maior negócio com um cliente da história da Akamai, conforme confirmado pelo CEO Frank Thomson Leighton, que descreveu a contraparte como uma “leading frontier model company”. O contrato vai expandir a capacidade de computação distribuída da Anthropic, ao mesmo tempo q

GateNews12m atrás

Augustus, apoiado por Peter Thiel, obtém aprovação da OCC para banco de IA e stablecoins

A startup de pagamentos Augustus recebeu aprovação condicional da Office of the Comptroller of the Currency (OCC) dos EUA para criar um banco nacional focado em pagamentos baseados em IA e stablecoins. A aprovação permite à Augustus expandir-se a partir das suas operações bancárias europeias existentes para o mercado norte-americano. O banco nacional proposto da Augustus foi concebido como banco de compensação para a era da IA, construído para interagir diretamente com agentes de máquina em vez

GateNews21m atrás

A OpenAI segue um modelo de consultoria à Palantir? Investe 4 mil milhões para criar uma empresa independente, enviando a FDE para uma integração profunda dos fluxos de trabalho de IA nas empresas

A 11 de maio, a OpenAI anunciou a criação da OpenAI Deployment Company, uma nova empresa especializada em ajudar as empresas a criar, implementar e operar sistemas de IA. O objetivo é permitir que as empresas não se limitem a usar o ChatGPT ou uma API, mas sim a integrar profundamente a IA nos fluxos de trabalho, na estrutura organizacional e na operação diária das suas atividades mais importantes. A OpenAI anunciou também que concordou em adquirir a consultora e empresa de engenharia de IA Tomo

ChainNewsAbmedia2h atrás

Protestos no estado de Maryland: taxa de 2 mil milhões de dólares para atualização da rede elétrica para pagar pelos centros de dados de IA na Virgínia

O Gabinete do Provedor dos Cidadãos (Maryland Office of People’s Counsel, OPC) do estado de Maryland apresentou, a 8 de maio, uma reclamação à Comissão Federal de Regulamentação da Energia (FERC): protesta contra o facto de a PJM Interconnection incluir, nos 22 mil milhões de dólares de custos de modernização da rede elétrica, 2 mil milhões de dólares a cargo dos contribuintes de Maryland. A queixa sustenta que essas atualizações, na prática, servem para dar resposta à procura dos centros de dad

ChainNewsAbmedia2h atrás

A OpenAI anuncia um investimento de 4 mil milhões de dólares na empresa de implementação: adquire a Tomoro

OpenAI a 11 de maio anunciou a criação da subsidiária «OpenAI Deployment Company», com um compromisso de capital de 4 mil milhões de dólares e uma avaliação de 10 mil milhões de dólares, para entrar no mercado de serviços de implementação de IA para empresas, e também adquiriu em simultâneo a consultora de IA britânica Tomoro, trazendo 150 engenheiros de implementação em linha («Forward Deployed Engineers»). De acordo com a Yahoo Finance, esta combinação é a resposta oficial da OpenAI à investid

ChainNewsAbmedia2h atrás
Comentar
0/400
Nenhum comentário