Blockify переписує корпоративний RAG: використовує IdeaBlock замість Chunking, стискає у 40 разів, зменшує token у 3 рази

Компанія, що створює нові інструменти для оптимізації корпоративних даних за допомогою ШІ, Blockify: 9 травня її зібрав і просуває akshay_pachaar, який заявляє, що у процесі RAG (Retrieval-Augmented Generation) вона може стиснути корпоративні бази даних у 40 разів, зменшити витрати на токени під час запиту в 3 рази та підвищити точність векторного пошуку в 2,3 раза. Офіційний GitHub Blockify повідомляє: продукт представила Iternal Technologies; він використовує структуру «IdeaBlock», яка замінює традиційне chunking, а також через дедуплікацію та об’єднання дозволяє тримати базу знань стислою, послідовною та керованою.

Ключова концепція: IdeaBlock замість традиційного chunking

Технічний дизайн Blockify:

Традиційний підхід: розбивати довгі документи на чанки фіксованого розміру, вбудовувати вектори, під час детекції брати top-k

Підхід Blockify: перетворювати вихідний контент на IdeaBlock — XML-структуровані одиниці знань

Кожен IdeaBlock містить: запитання, перевірені відповіді, tag, сутності, ключові слова

Схожі IdeaBlock автоматично дедуплікуються та об’єднуються, тож база знань не роздувається зі зростанням контенту

Проблема традиційного chunking у тому, що одна й та сама інформація може повторюватися в кількох чанках, спричиняючи надмірність під час пошуку та марну витрату токенів; IdeaBlock через дедуплікацію підвищує щільність знань, а той самий зміст виражає в меншому обсязі зберігання.

Конкретні переваги: стиснення в 40 разів, токени — у 3 рази менше, точність — у 2,3 раза вища

Опубліковані Blockify показники конкретної ефективності:

Стиснення даних: корпоративна база даних зменшується до приблизно 2,5% від початкового обсягу (40 разів стиснення), збереження 99% і більше інформації

Токени на кожен запит: із ~303 (традиційний chunk) до ~98 (IdeaBlock) — ефективність у 3,09 раза

Точність векторного пошуку: підвищення в 2,29 раза

Загальне покращення точності: приблизно 78 разів (сумарний ефект від дедуплікації та покращення пошуку)

Розрахунок економії витрат: 1 млрд запитів/рік, економія токен-костів близько 73,8 тис. доларів

Загальне підвищення точності у 78 разів — це комплексний ефект: дедуплікація зменшує шум, IdeaBlock-структурований контент дружніший для векторного пошуку, а також зниження кількості токенів на одну відповідь одночасно зменшує простір для помилок моделі.

Масштаб інтеграції: LlamaIndex, LangChain, Milvus, Cloudflare та інші популярні фреймворки

Вже інтегровані розробницькі інструменти та інфраструктура Blockify:

RAG-фреймворки: LlamaIndex, LangChain

Керування знаннями: Obsidian

Векторні бази даних: Milvus, Elastic, Supabase

Edge-обчислення: Cloudflare

Low-code інтеграції: n8n (через шаблони робочих процесів)

Стратегія інтеграції Blockify — «не замінювати наявні RAG-фреймворки, а бути шаром попередньої оптимізації даних». Розробники можуть у наявних процесах LlamaIndex або LangChain замінити крок chunking на Blockify, тоді інші етапи залишаться без змін.

Конкретні події, за якими можна буде стежити далі: зростання кількості зірок у GitHub Blockify та рівень прийняття спільнотою, чи Iternal Technologies подала або розкрила технічні деталі щодо IdeaBlock-структури (зараз наголошується на «patented ingestion»), а також чи будуть убудовані подібні логіки дедуплікації в налаштуваннях за замовчуванням у популярних RAG-фреймворках.

Ця стаття «Blockify переписує корпоративний RAG: IdeaBlock замість chunking, стиснення в 40 разів, token-и — у 3 рази менше» вперше з’явилась на сайті Мережа новин ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Alibaba Cloud запускає план командних токенів із 10+ моделями сьогодні

Згідно з Beating, Alibaba Cloud сьогодні запустила свою Team Token Plan, пропонуючи підписки на 10+ великі мовні моделі, зокрема Qwen 3.6, Kimi-K2.6, GLM-5.1 і Wan 2.7. Користувачі можуть гнучко перемикатися між моделями для генерації коду, синтезу зображень та інших задач. Командна версія відрізняється від персональних планів функціями керування для підприємств. Адміністратори можуть керувати розподілом місць, відстежувати використання та встановлювати бюджетні обмеження в трьох тарифах: Standa

GateNews4год тому

Дунгуань відправить половину глобальних AI-окулярів у 2025 році

Компанії з Дунгуаню відправили понад 4 мільйона пар AI-окулярів у 2025 році, що становить майже половину від загального обсягу у світі — 8,7 мільйона пар, повідомляє дослідницька компанія Omdia. Місто в провінції Гуандун посіло перше місце у світі за обсягом відвантажень, тоді як глобальні поставки AI-окулярів зросли на 322% порівняно з попереднім роком. Ринкова позиція Дунгуаню та підтримка з боку уряду Перевага міста в виробництві AI-окулярів відображає як наявну електронну інфраструктуру, так

CryptoFrontier6год тому

UXLINK інтегрує інфраструктуру AI-обчислень Origins Network для масштабування Web3

Згідно з офіційним оголошенням UXLINK від 11 травня, Web3-соціальний протокол повідомив про стратегічну співпрацю з Origins Network, щоб інтегрувати інфраструктуру децентралізованих обчислень на основі ШІ в його екосистему. Партнерство має на меті посилити платформу UXLINK завдяки вбудовуванню модульної блокчейн-інфраструктури Origins Network, що покращить обчислювальні можливості для ШІ-орієнтованих децентралізованих застосунків. Інтеграція використовуватиме механізм Proof-of-Computation від Or

GateNews11год тому

Tencent Cloud забезпечує AI-банкінг-сервіс Ryt Bank для 50 000 користувачів у день запуску

За даними Tencent Cloud, 11 травня компанія співпрацювала з малайзійським цифровим банком Ryt Bank, щоб підтримати його AI-орієнтований розмовний банкінг-сервіс із використанням Tencent Cloud Chat для обміну повідомленнями в режимі реального часу. Система обробляла 50 000 активних користувачів у день запуску без простоїв, даючи клієнтам змогу формулювати інструкції щодо платежів простою мовою замість навігації меню застосунку. Ryt Bank досяг 1,2 мільйона користувачів менш ніж за сім місяців.

GateNews12год тому

Reactor запускає демонстрацію реальної моделі світу в реальному часі, зібравши 7,8 мільйона переглядів

За Beating, Reactor сьогодні запустила демонстрацію real-time world model, що дає змогу користувачам генерувати інтерактивні 3D-сцени завдяки хмарній обробці на основі ШІ. Модель працює на глобальній хмарній інфраструктурі компанії з низькою затримкою, тож немає потреби в локальному обладнанні. У демонстраційному відео із червоним спортивним авто, яке їздить по інопланетній пустелі, ШІ в реальному часі відтворив фізику місцевості та об’єкти на далеких планетах, одночасно відстежуючи керування гр

GateNews13год тому

Minara запускає перший AI-копілот для прогнозних ринків Hyperliquid на базі HIP-4 сьогодні

За даними BlockBeats, Minara AI сьогодні (11 травня) запустила AI Prediction Copilot, ставши першим інструментом для prediction market на базі ШІ, інтегрованим із ринком Hyperliquid HIP-4. Система аналізує короткострокові тренди BTC, рівні підтримки та опору, а також розбіжності в ринковому ціноутворенні, щоб надавати торгові рекомендації YES/NO. Copilot виводить імовірність від ШІ, ринково-імпліковану ймовірність, значення edge та очікувані прибутки в реальному часі.

GateNews13год тому
Прокоментувати
0/400
Немає коментарів