Blockify reescreve empresas com RAG: usa IdeaBlock em vez de chunking, comprime 40 vezes, reduz tokens em 3 vezes

ChainNewsAbmedia

A nova ferramenta de otimização de dados para IA corporativa Blockify, em 9 de maio, foi organizada e divulgada por akshay_pachaar, que alega que, no processo de RAG (Retrieval-Augmented Generation), é possível comprimir os bancos de dados corporativos em 40 vezes, reduzir em 3 vezes o consumo de tokens na busca e aumentar a precisão da pesquisa vetorial em 2,3 vezes. A documentação oficial do GitHub da Blockify diz que o produto foi desenvolvido pela Iternal Technologies, usando unidades estruturadas de conhecimento do tipo “IdeaBlock” para substituir o tradicional chunking, e mantendo o banco de conhecimento compacto, coerente e governável por meio de desduplicação com mesclagem de sobreposições.

Conceito central: usar IdeaBlock em vez de chunking tradicional

Projeto técnico do Blockify:

Abordagem tradicional: dividir documentos longos em chunks de tamanho fixo, incorporar vetores e, na recuperação, pegar top-k

Abordagem do Blockify: converter o conteúdo original em IdeaBlock — unidades estruturadas de conhecimento em formato XML

Cada IdeaBlock inclui: perguntas embutidas, respostas confiáveis, tags, entidades, palavras-chave

IdeaBlocks semelhantes fazem desduplicação e mesclagem automaticamente, e a base de conhecimento não aumenta de tamanho de forma explosiva conforme o conteúdo cresce

O problema do chunking tradicional é que a mesma informação pode aparecer repetida em vários chunks, gerando redundância na recuperação e desperdício de tokens; o IdeaBlock melhora a densidade da informação com a desduplicação, representando o mesmo conteúdo com menos espaço de armazenamento.

Benefícios específicos: compressão de 40 vezes, tokens -3 vezes, precisão +2,3 vezes

Indicadores de benefício específicos divulgados pela Blockify:

Compressão de dados: a base de dados corporativa foi reduzida para cerca de 2,5% do tamanho original (40 vezes de compressão), mantendo mais de 99% das informações

Tokens por consulta: de cerca de 303 (chunk tradicional) para cerca de 98 (IdeaBlock) — eficiência 3,09 vezes maior

Precisão da recuperação vetorial: aumento de 2,29 vezes

Melhoria geral de precisão: cerca de 78 vezes (efeito combinado entre desduplicação e melhorias na recuperação)

Simulação de economia de custos: 100 milhões de consultas/ano, economizando cerca de US$ 738 mil em custos de tokens

O aumento geral de precisão de 78 vezes é um efeito composto: a desduplicação reduz ruído, o conteúdo estruturado em IdeaBlock favorece a recuperação por busca vetorial e a quantidade de tokens por resposta diminui ao mesmo tempo que reduz a margem de erro do modelo.

Escopo de integração: LlamaIndex, LangChain, Milvus, Cloudflare e outras estruturas populares

Ferramentas de desenvolvimento e infraestrutura já integradas na Blockify:

Frameworks RAG: LlamaIndex, LangChain

Gestão de conhecimento: Obsidian

Banco de dados vetorial: Milvus, Elastic, Supabase

Computação de borda: Cloudflare

Integração low-code: n8n (via templates de fluxos de trabalho)

A estratégia de integração da Blockify é “não substituir os frameworks RAG existentes, e sim atuar como uma camada de otimização de dados na frente”. Os desenvolvedores podem substituir o passo de chunking pelo Blockify dentro dos fluxos existentes do LlamaIndex ou LangChain, mantendo o restante inalterado.

Próximos eventos específicos a acompanhar: crescimento de estrelas no GitHub da Blockify e adoção da comunidade, se a Iternal Technologies vai solicitar ou divulgar detalhes técnicos sobre a estrutura IdeaBlock (atualmente em destaque “patented ingestion”) e se os principais frameworks RAG vão incorporar lógicas semelhantes de desduplicação como função padrão.

Este artigo “Blockify reescreve o RAG corporativo: usa IdeaBlock no lugar de chunking, comprime 40 vezes, reduz tokens em 3 vezes” apareceu pela primeira vez em Cadeia de Notícias ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

A Alibaba Cloud lança um plano de token de equipe com 10+ modelos hoje

De acordo com Beating, a Alibaba Cloud lançou hoje seu Team Token Plan, oferecendo assinaturas para mais de 10 grandes modelos de linguagem, incluindo Qwen 3.6, Kimi-K2.6, GLM-5.1 e Wan 2.7. Os usuários podem alternar de forma flexível entre os modelos para geração de código, síntese de imagem e outras tarefas. A versão para equipes difere dos planos pessoais por meio de recursos de gerenciamento empresarial. Administradores podem gerenciar a alocação de assentos, acompanhar o uso e definir cont

GateNews6h atrás

Dongguan enviará metade das lentes/óculos de IA do mundo em 2025

Empresas sediadas em Dongguan enviaram mais de 4 milhões de pares de óculos de IA em 2025, respondendo por quase metade do total global de 8,7 milhões de pares, segundo a empresa de pesquisa Omdia. A cidade chinesa de Guangdong ficou em primeiro lugar no mundo em volume de remessas, enquanto as remessas globais de óculos de IA subiram 322% em comparação com o ano anterior. Posição de Mercado de Dongguan e Apoio do Governo A liderança da cidade na fabricação de óculos de IA reflete tanto sua infr

CryptoFrontier8h atrás

UXLINK integra a infraestrutura de computação de IA da Origins Network para escalar a Web3

De acordo com o anúncio oficial da UXLINK em 11 de maio, o protocolo social Web3 anunciou uma colaboração estratégica com a Origins Network para integrar infraestrutura descentralizada de computação de IA ao seu ecossistema. A parceria visa aprimorar a plataforma da UXLINK ao incorporar a infraestrutura modular de blockchain da Origins Network, melhorando as capacidades computacionais para aplicações descentralizadas orientadas por IA. A integração vai aproveitar o mecanismo de Proof-of-Computat

GateNews13h atrás

A Tencent Cloud impulsiona o serviço bancário com IA do Ryt Bank para 50.000 usuários no dia do lançamento

De acordo com a Tencent Cloud, em 11 de maio, a empresa fez parceria com o banco digital Ryt Bank, com sede na Malásia, para apoiar seu serviço de banking conversacional orientado por IA usando o Tencent Cloud Chat para mensagens em tempo real. O sistema atendeu 50.000 usuários ativos no dia do lançamento, sem interrupções, permitindo que os clientes dessem instruções de pagamento em linguagem simples em vez de navegar pelos menus do aplicativo. A Ryt Bank chegou a 1,2 milhão de usuários em mais

GateNews14h atrás

Reactor lança demonstração de um modelo de mundo em tempo real, alcançando 7,8 milhões de visualizações

De acordo com Beating, a Reactor lançou hoje sua demonstração de modelo de mundo em tempo real, permitindo que os usuários gerem cenas 3D interativas por meio de processamento de IA baseado na nuvem. O modelo é executado na infraestrutura global de nuvem com baixa latência da empresa, eliminando a necessidade de hardware local. Em um vídeo de demonstração com um carro esportivo vermelho navegando por uma paisagem desértica alienígena, a IA renderizou a física do terreno e objetos planetários dis

GateNews15h atrás

A Minara lança hoje seu primeiro copilot de IA para mercado de previsões Hyperliquid HIP-4

De acordo com a BlockBeats, a Minara AI lançou hoje (11 de maio) o AI Prediction Copilot, tornando-se a primeira ferramenta de IA para mercados de previsão integrada ao mercado HIP-4 da Hyperliquid. O sistema analisa tendências de curto prazo do BTC, níveis de suporte e resistência e discrepâncias de preços do mercado para fornecer recomendações de trading YES/NO. O Copilot gera, em tempo real, a probabilidade da IA, a probabilidade implícita pelo mercado, o valor da vantagem (edge) e os retorno

GateNews15h atrás
Comentário
0/400
Sem comentários