Blockify Tulis Ulang RAG Perusahaan: Gunakan IdeaBlock untuk Menggantikan Chunking, Kompres 40 Kali, Turunkan Token 3 Kali

ChainNewsAbmedia

Alat baru optimasi data AI perusahaan Blockify, disusun dan dipromosikan oleh akshay_pachaar pada 9 Mei, mengklaim bahwa dalam proses RAG (Retrieval-Augmented Generation), alat ini dapat mengompresi basis data perusahaan 40 kali, menurunkan penggunaan token kueri 3 kali, dan meningkatkan akurasi pencarian berbasis vektor 2,3 kali. Penjelasan resmi GitHub Blockify menyebutkan: produk diluncurkan oleh Iternal Technologies, menggunakan struktur unit pengetahuan terstruktur “IdeaBlock” untuk menggantikan chunking tradisional, serta menjaga basis pengetahuan tetap ringkas, konsisten, dan dapat dikelola melalui penggabungan de-duplikasi.

Konsep inti: mengganti chunking tradisional dengan IdeaBlock

Rancangan teknis Blockify:

Pendekatan tradisional: memotong dokumen panjang menjadi chunk berukuran tetap, menyematkan vektor, lalu mengambil top-k saat melakukan pencarian

Pendekatan Blockify: mengubah konten mentah menjadi IdeaBlock—unit pengetahuan terstruktur berbasis XML

Setiap IdeaBlock berisi: pertanyaan bawaan, jawaban tepercaya, tag, entitas, kata kunci

IdeaBlock yang serupa otomatis dihapus duplikasinya dan digabung, sehingga basis pengetahuan tidak membengkak seiring pertumbuhan konten

Masalah chunking tradisional adalah informasi yang sama dapat muncul berulang di beberapa chunk, menyebabkan redundansi pada hasil pencarian dan pemborosan token; IdeaBlock meningkatkan kepadatan informasi melalui de-duplikasi, dengan konten yang sama diekspresikan menggunakan ruang penyimpanan yang lebih kecil.

Manfaat spesifik: kompresi 40 kali, token turun 3 kali, akurasi naik 2,3 kali

Indikator manfaat spesifik yang dipublikasikan Blockify:

Kompresi data: basis data perusahaan menyusut menjadi sekitar 2,5% dari ukuran semula (kompresi 40 kali), mempertahankan lebih dari 99% informasi

Token per kueri: dari sekitar 303 (chunk tradisional) turun menjadi sekitar 98 (IdeaBlock)—efisiensi 3,09 kali

Akurasi pencarian vektor: meningkat 2,29 kali

Peningkatan akurasi keseluruhan: sekitar 78 kali (termasuk efek gabungan de-duplikasi dan perbaikan pencarian)

Simulasi penghematan biaya: 100 juta kueri/tahun, menghemat biaya token sekitar 738 ribu dolar AS

Peningkatan akurasi keseluruhan 78 kali adalah efek komprehensif—de-duplikasi mengurangi noise, konten terstruktur IdeaBlock ramah untuk pencarian berbasis vektor, jumlah token untuk jawaban sekali jalan turun sekaligus mengurangi ruang model untuk melakukan kesalahan.

Cakupan integrasi: LlamaIndex, LangChain, Milvus, Cloudflare, dan kerangka kerja arus utama lainnya

Alat pengembang dan infrastruktur yang sudah terintegrasi dengan Blockify:

Kerangka kerja RAG: LlamaIndex, LangChain

Manajemen pengetahuan: Obsidian

Basis data vektor: Milvus, Elastic, Supabase

Komputasi tepi: Cloudflare

Integrasi low-code: n8n (melalui template workflow)

Strategi integrasi Blockify adalah “tidak menggantikan kerangka RAG yang sudah ada, melainkan sebagai lapisan optimasi data di depan”. Pengembang dapat mengganti langkah chunking yang semula dengan Blockify di dalam alur LlamaIndex atau LangChain yang sudah ada, sementara alur lainnya tetap.

Peristiwa spesifik yang bisa ditindaklanjuti: pertumbuhan jumlah bintang GitHub Blockify dan tingkat adopsi komunitas, apakah Iternal Technologies akan mengajukan atau mengungkap rincian teknis terkait struktur IdeaBlock (saat ini menonjolkan “patented ingestion”), serta apakah kerangka RAG arus utama akan membenamkan logika de-duplikasi serupa sebagai fitur bawaan default.

Artikel ini tentang Blockify yang mengubah enterprise RAG: menggunakan IdeaBlock alih-alih chunking, mengompresi 40 kali, dan token turun 3 kali pertama kali muncul di 鏈新聞 ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Alibaba Cloud Meluncurkan Rencana Token Tim dengan 10+ Model Hari Ini

Menurut Beating, Alibaba Cloud meluncurkan Program Token Tim hari ini, menawarkan langganan ke 10+ model bahasa besar termasuk Qwen 3.6, Kimi-K2.6, GLM-5.1, dan Wan 2.7. Pengguna dapat berpindah model secara fleksibel untuk pembuatan kode, sintesis gambar, dan tugas lainnya. Versi tim berbeda dari paket personal melalui fitur manajemen perusahaan. Administrator dapat mengelola alokasi kursi, memantau penggunaan, dan menetapkan kontrol anggaran di tiga tingkat: Standard, Premium, dan Elite. Platf

GateNews4jam yang lalu

Dongguan Mengirimkan Setengah dari Kacamata AI Global pada 2025

Perusahaan berbasis Dongguan mengirim lebih dari 4 juta pasang kacamata pintar AI pada 2025, menyumbang hampir setengah dari total global 8,7 juta pasang, menurut firma riset Omdia. Kota di Guangdong itu menempati peringkat pertama di dunia berdasarkan volume pengiriman, sementara pengiriman kacamata pintar AI global naik 322% dibanding tahun sebelumnya. Posisi Pasar Dongguan dan Dukungan Pemerintah Dominasi kota itu dalam manufaktur kacamata pintar AI mencerminkan baik infrastruktur elektronik

CryptoFrontier6jam yang lalu

UXLINK Mengintegrasikan Infrastruktur Komputasi AI dari Origins Network untuk Skalabilitas Web3

Menurut pengumuman resmi UXLINK pada 11 Mei, protokol sosial Web3 mengumumkan kolaborasi strategis dengan Origins Network untuk mengintegrasikan infrastruktur komputasi AI yang terdesentralisasi ke dalam ekosistemnya. Kemitraan ini bertujuan untuk meningkatkan platform UXLINK dengan memasukkan infrastruktur blockchain modular dari Origins Network, sekaligus memperbaiki kemampuan komputasi untuk aplikasi terdesentralisasi berbasis AI. Integrasi ini akan memanfaatkan mekanisme Proof-of-Computation

GateNews11jam yang lalu

Tencent Cloud Menggerakkan Layanan Perbankan AI Ryt Bank untuk 50.000 Pengguna pada Hari Peluncuran

Menurut Tencent Cloud, pada 11 Mei, perusahaan bermitra dengan bank digital berbasis di Malaysia, Ryt Bank, untuk mendukung layanan perbankan percakapan yang digerakkan oleh AI dengan menggunakan Tencent Cloud Chat untuk pesan real-time. Sistem tersebut menangani 50.000 pengguna aktif pada hari peluncuran tanpa gangguan, memungkinkan pelanggan memberikan instruksi pembayaran dalam bahasa sehari-hari alih-alih menavigasi menu aplikasi. Ryt Bank telah mencapai 1,2 juta pengguna dalam lebih dari tu

GateNews12jam yang lalu

Reactor Meluncurkan Demo Model Dunia Real-Time, Mengumpulkan 7,8 Juta Tampilan

Menurut Beating, Reactor meluncurkan demo model dunia real-time hari ini, memungkinkan pengguna menghasilkan adegan 3D interaktif melalui pemrosesan AI berbasis cloud. Model ini berjalan di infrastruktur cloud global berlatensi rendah milik perusahaan, sehingga menghilangkan kebutuhan perangkat keras lokal. Dalam video demonstrasi yang menampilkan mobil sport merah melintasi lanskap gurun asing, AI merender fisika medan dan objek planet yang jauh secara real time sambil melacak kontrol pemain, m

GateNews13jam yang lalu

Minara Meluncurkan AI Copilot Pasar Prediksi Hyperliquid HIP-4 Pertama Hari Ini

Menurut BlockBeats, Minara AI meluncurkan AI Prediction Copilot hari ini (11 Mei), menjadi alat AI pasar prediksi pertama yang terintegrasi dengan pasar HIP-4 milik Hyperliquid. Sistem ini menganalisis tren jangka pendek BTC, level support dan resistance, serta perbedaan harga pasar untuk memberikan rekomendasi trading YES/NO. Copilot menampilkan probabilitas AI, probabilitas tersirat pasar, nilai edge, dan estimasi imbal hasil secara real time.

GateNews13jam yang lalu
Komentar
0/400
Tidak ada komentar