De acordo com Beating, a equipa Kaldi do AI Lab da Xiaomi publicou de forma open-source o OmniVoice, um modelo de TTS para clonagem de voz zero-shot que suporta 646 línguas. O modelo consegue replicar as características da voz a partir de apenas segundos de áudio de referência e funciona entre línguas — uma única voz pode sintetizar fala em mandarim, japonês, coreano e outras línguas. Todo o código, pesos e dados de treino foram disponibilizados open-source sob a licença Apache-2.0.
O OmniVoice utiliza uma arquitectura simplificada com um único Transformer bidireccional que mapeia directamente texto em tokens acústicos discretos, conseguindo uma inferência 40x mais rápida do que em tempo real no PyTorch. Treinado com 580 mil horas de áudio provenientes de 50 conjuntos de dados open-source, o OmniVoice superou sistemas comerciais em semelhança vocal e inteligibilidade em 24 línguas testadas, e igualou ou excedeu gravações humanas em 102 línguas.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A Alibaba Cloud lança um plano de tokens para a equipa com 10+ modelos hoje
De acordo com Beating, a Alibaba Cloud lançou hoje o seu Team Token Plan, oferecendo subscrições a mais de 10 grandes modelos de linguagem, incluindo Qwen 3.6, Kimi-K2.6, GLM-5.1 e Wan 2.7. Os utilizadores podem alternar de forma flexível entre modelos para geração de código, síntese de imagem e outras tarefas. A versão para equipas difere dos planos pessoais ao incluir funcionalidades de gestão empresarial. Os administradores podem gerir a alocação de lugares, acompanhar a utilização e definir
GateNews3h atrás
Dongguan Envia Metade dos Óculos de IA do Mundo em 2025
As empresas sediadas em Dongguan enviaram mais de 4 milhões de pares de óculos de IA em 2025, representando quase metade do total mundial de 8,7 milhões de pares, segundo a empresa de investigação Omdia. A cidade de Guangdong ficou em primeiro lugar a nível mundial em volume de expedições, enquanto as remessas globais de óculos de IA aumentaram 322% face ao ano anterior. Posição de Mercado de Dongguan e Apoio do Governo A supremacia da cidade na produção de óculos de IA reflecte tanto a sua infr
CryptoFrontier5h atrás
UXLINK integra a infra-estrutura de computação de IA da Origins Network para escalar a Web3
De acordo com o anúncio oficial da UXLINK a 11 de maio, o protocolo social Web3 anunciou uma colaboração estratégica com a Origins Network para integrar infraestruturas de computação de IA descentralizada no seu ecossistema. A parceria tem como objetivo reforçar a plataforma da UXLINK ao incorporar a infraestrutura modular de blockchain da Origins Network, melhorando as capacidades computacionais para aplicações descentralizadas orientadas por IA. A integração vai tirar partido do mecanismo de P
GateNews10h atrás
A Tencent Cloud dá poder ao serviço de banca com IA do Ryt Bank para 50.000 utilizadores no dia do lançamento
Segundo a Tencent Cloud, a 11 de maio, a empresa fez parceria com o banco digital Ryt Bank, com sede na Malásia, para apoiar o seu serviço de banca conversacional orientado por IA, utilizando o Tencent Cloud Chat para mensagens em tempo real. O sistema geriu 50.000 utilizadores ativos no dia de lançamento sem interrupções, permitindo que os clientes dessem instruções de pagamento em linguagem simples em vez de navegarem pelos menus da aplicação. A Ryt Bank atingiu 1,2 milhão de utilizadores em m
GateNews11h atrás
A Reactor lança uma demonstração de modelo mundial em tempo real, gerando 7,8 milhões de visualizações
De acordo com Beating, a Reactor lançou hoje a sua demo do modelo de mundo em tempo real, permitindo aos utilizadores gerar cenas 3D interactivas através de processamento de IA baseado na cloud. O modelo é executado na infra-estrutura global de cloud da empresa, de baixa latência, eliminando a necessidade de hardware local. Num vídeo de demonstração que mostra um carro desportivo vermelho a navegar por uma paisagem desértica alienígena, a IA fez o rendering da física do terreno e de objectos pla
GateNews12h atrás
Minara lança hoje o primeiro copiloto de IA para mercados de previsão do Hyperliquid, HIP-4
De acordo com a BlockBeats, a Minara AI lançou hoje (11 de maio) o AI Prediction Copilot, tornando-se na primeira ferramenta de IA para mercados de previsão integrada com o mercado HIP-4 da Hyperliquid. O sistema analisa tendências de curto prazo do BTC, níveis de suporte e resistência e discrepâncias de preços do mercado para fornecer recomendações de negociação YES/NO. O Copilot disponibiliza em tempo real a probabilidade de IA, a probabilidade implícita no mercado, o valor de vantagem (edge)
GateNews12h atrás