企業のAI資料最適化の新ツール「Blockify」。5月9日、akshay_pachaarが整理し、宣伝・普及に努めている。同社はRAG(Retrieval-Augmented Generation)のプロセスにおいて、企業のデータベースを40倍圧縮し、クエリtoken消費量を3倍削減し、ベクトル検索の精度を2.3倍向上できると主張している。
Blockify公式GitHubの説明:製品はIternal Technologiesによって提供され、「IdeaBlock」構造化知識ユニットによって従来のchunkingを置き換える。さらに重複排除と統合により、知識ベースを簡潔・一貫・統治可能に保つ。
コア概念:IdeaBlockで従来のchunkingを置き換える
Blockifyの技術設計:
従来のやり方:長文書を固定サイズのchunkに分割し、埋め込みベクトルを作成し、検索時はtop-kを取得する
Blockifyのやり方:元の内容をIdeaBlock—XMLの構造化知識ユニットへ変換する
各IdeaBlockには以下が含まれる:自前の質問、信頼できる回答、タグ、エンティティ、キーワード
類似するIdeaBlockは自動で重複排除・統合され、知識ベースは内容が増えても膨らまない
従来のchunkingの問題は、同じ情報が複数のchunkに重複して現れ、検索の冗長性とtokenの浪費を招くことにある。IdeaBlockは重複排除によって情報密度を高め、同じ内容をより小さい保存空間で表現する。
具体的な効果:40倍圧縮、tokenを3倍減らす、精度を2.3倍向上
Blockifyが公開した具体的な効果指標:
データ圧縮:企業のデータベースが元の約2.5%まで縮小(40倍圧縮)、99%以上の情報を保持
1回のクエリ当たりtoken:およそ303個(従来chunk)から約98個(IdeaBlock)へ—3.09倍の効率
ベクトル検索の精度:2.29倍に向上
全体の精度改善:約78倍(重複排除と検索改善の総合的な相乗効果を含む)
コスト削減の試算:年あたり1億回のクエリで、tokenコストを約73.8万ドル節約
78倍の全体的な精度向上は、総合効果によるもの—重複排除でノイズを減らし、IdeaBlockの構造化された内容がベクトル検索にとって扱いやすくなり、1回の回答あたりのtoken数が減ると同時に、モデルが誤る余地も減る。
統合範囲:LlamaIndex、LangChain、Milvus、Cloudflareなどの主要フレームワーク
Blockifyが統合している開発者ツールと基盤インフラ:
RAGフレームワーク:LlamaIndex、LangChain
ナレッジ管理:Obsidian
ベクトルデータベース:Milvus、Elastic、Supabase
エッジコンピューティング:Cloudflare
ローコード統合:n8n(ワークフローテンプレートを介して)
Blockifyの統合戦略は「既存のRAGフレームワークを置き換えるのではなく、前段のデータ最適化レイヤーとして機能する」というもの。開発者は既存のLlamaIndexまたはLangChainのプロセス内で、Blockifyを使って元のchunking手順だけを置き換え、他の処理はそのままにできる。
今後追跡できる具体的な出来事:BlockifyのGitHubスター数の成長とコミュニティ採用率、Iternal TechnologiesがIdeaBlockの構造に関して申請または技術詳細を開示するかどうか(現在は「patented ingestion」を標榜)、および主要なRAGフレームワークが同様の重複排除ロジックをデフォルト機能として内蔵するかどうか。
この記事「Blockifyが企業RAGを書き換え:IdeaBlockでchunkingに代わり、40倍圧縮、tokenを3倍削減」は、最初に「鏈新聞 ABMedia」に掲載された。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
アリババクラウドが本日、10以上のモデルによるチームトークン計画を発表
Beatingによると、アリババクラウドは本日「Team Token Plan(チームトークンプラン)」を開始し、Qwen 3.6、Kimi-K2.6、GLM-5.1、Wan 2.7など10以上の大規模言語モデルへのサブスクリプションを提供しました。ユーザーは、コード生成、画像合成、その他のタスクにおいて、モデルを柔軟に切り替えられます。 チーム版は、企業向けの管理機能によって個人向けプランと異なります。管理者は、シートの割り当てを管理し、利用状況を追跡し、3つの階層:Standard、Premium、Eliteにわたって予算の制御を設定できます。このプラットフォームには、マルチテナントの分離とエンタープライズレベルのデータプライバシー保護が含まれ、Claude CodeやCursorなど主要なAIツールとの互換性も備えています。
GateNews4時間前
東莞は2025年に世界のAIメガネの半分を出荷する
広東省東莞(トンカン)の企業は、2025年にAIグラスを400万ペア以上出荷し、調査会社オムディアによると、世界の総計870万ペアのほぼ半分を占めた。同社の研究では、出荷台数で広東省の同市が世界1位となり、世界のAIグラス出荷は前年と比べて322%増加した。 東莞の市場での地位と政府の支援 AIグラスの製造における同市の優位性は、既存の電子機器インフラと、最近の政策による取り組みの両方を反映している。東莞は、技術、企業の発展、アプリケーション、資金面などを含む分野でXRインテリジェント端末を支援するための措置を最近導入した。 東莞市のエグゼクティブ副市長である曾建鵬(Zeng Jianpeng)は、同市の強みは、契約製造業者と地元ブランドの双方にサービスを提供する確立された電子機器のサプライチェーンにあると述べた。 製造エコシステム:中小規模の生産者 東莞のAIグラス・ブームは、中国の珠江デルタ地域にある6〜8社の中小規模メーカーという、より広い層によって支えられている。これらの多くの企業は、二重のモデル戦略をとっている。すなわち、自社ブランドで低コスト製品を販売する一方で、契約業務も
CryptoFrontier6時間前
UXLINKは、Origins NetworkのAI計算インフラをWeb3のスケーリングのために統合します
UXLINKの5月11日の公式発表によれば、Web3ソーシャル・プロトコルは、分散型AI計算インフラをそのエコシステムに統合するために、Origins Networkと戦略的な協業を発表しました。この提携は、Origins Networkのモジュール型ブロックチェーン・インフラを取り入れることで、UXLINKのプラットフォームを強化し、AI駆動の分散型アプリケーションに向けた計算能力を向上させることを目的としています。 統合では、Origins NetworkのProof-of-Computationメカニズムと分散型GPU計算を活用して、AIモデルの学習、データ処理、そして取引の効率を改善しつつ、運用コストを削減します。ソーシャル分散型取引所でのトレーディング、リクイディティ・ステーキング、AI対応アプリケーションをサポートするUXLINKのプラットフォームは、この提携により、スケーラビリティとクロスチェーン機能が向上します。
GateNews11時間前
テンセント・クラウドがローンチ当日に5万人のユーザー向けにRyt BankのAIバンキングサービスを支える
Tencent Cloudによると、5月11日、同社はマレーシア拠点のデジタル銀行Ryt Bankと提携し、Tencent Cloud Chatを使ってリアルタイムのメッセージングを行い、AI駆動の会話型バンキングサービスを支援しました。システムは稼働開始当日にダウンタイムなしでアクティブユーザー5万人を処理し、顧客がアプリのメニューをたどらずに、自然な言葉で支払いの指示を出せるようにしました。Ryt Bankは7か月以上でユーザー120万人に到達しています。
GateNews12時間前
Reactorはリアルタイムのワールドモデルのデモをローンチし、7.8百万回の再生を獲得しました
Beatingによると、Reactorは本日リアルタイムのワールドモデルのデモを立ち上げ、クラウドベースのAI処理によってユーザーがインタラクティブな3Dシーンを生成できるようにしました。このモデルは、同社の世界規模の低遅延クラウド基盤上で動作しており、ローカルのハードウェアは不要です。赤いスポーツカーが異世界の砂漠の景観を走行するデモ動画では、AIがプレイヤーの操作を追跡しながら、地形の物理や遠くの惑星の物体をリアルタイムで描画し、7.8百万回以上の再生を集めました。
GateNews13時間前
ミナラが本日、初のHyperliquid HIP-4予測マーケットAIコパイロットをローンチ
BlockBeatsによると、Minara AIは本日(5月11日)AI Prediction Copilotをローンチし、HyperliquidのHIP-4市場に統合された最初の予測市場AIツールとなりました。 このシステムは、BTCの短期的なトレンド、サポート・レジスタンス水準、そして市場の価格差異を分析し、YES/NOの取引推奨を提供します。 Copilotは、AI確率、市場が織り込む確率、エッジ値、そして期待リターンをリアルタイムで出力します。
GateNews13時間前