omniture
<bdo id="muqew"><strong id="muqew"><p id="muqew"></p></strong></bdo>
    1. <pre id="muqew"><sup id="muqew"></sup></pre>
      <thead id="muqew"></thead>
        <pre id="muqew"></pre>
        <acronym id="muqew"></acronym>
        <tt id="muqew"><option id="muqew"></option></tt>
        乱子伦视频在线看,18分钟处破好疼哭视频在线观看,中文字幕美人妻亅u乚一596,91网站,自拍口爆,少妇人妻邻居,中文一区二区视频,日韩av毛片福利国产福利

        存儲"黑科技"之IBM CAS:單機承載千億級向量數(shù)據(jù)庫,打破 "1% 數(shù)據(jù)困局",實現(xiàn)企業(yè)級 RAG 規(guī)模化

        IBM China
        2026-05-19 11:00 1763

        作者:金鑫,IBM中國區(qū)存儲業(yè)務(wù)銷售總經(jīng)理

        北京2026年5月19日 /美通社/ -- 最近,IBM研究院與英偉達(NVIDIA)、三星共同展示了一項內(nèi)容感知存儲系統(tǒng)(content awareness storage)[1]。該系統(tǒng)在單臺服務(wù)器上成功支持千億級別向量的存儲與檢索,平均查詢延遲為694毫秒,召回精度達90%。系統(tǒng)硬件組合為IBM Storage Scale System 6000全閃存設(shè)備、六顆英偉達H200 GPU以及48塊三星30.72TB容量的PCIe Gen5 NVMe固態(tài)硬盤。IBM Storage Scale System 6000 全閃存設(shè)備將計算與存儲解耦,并通過英偉達 H200 GPU 加速索引重建,將原本基于 CPU 需耗時數(shù)小時的索引構(gòu)建過程,縮短至 GPU 上的數(shù)分鐘。

        打破 “1% 數(shù)據(jù)困局”,讓 AI 走向數(shù)據(jù)
        打破 “1% 數(shù)據(jù)困局”,讓 AI 走向數(shù)據(jù)

        我們一起來看看IBM是如何用單機實現(xiàn)了現(xiàn)在大集群才能實現(xiàn)的結(jié)果。

        今天,大模型版本平均數(shù)天便迎來一次更新,RAG(檢索增強生成)已成為挖掘非結(jié)構(gòu)化數(shù)據(jù)價值的核心。企業(yè) CIO 普遍面臨核心課題:如何借助通用人工智能(AI)與 AI 智能體實現(xiàn)日常運營提效?如何依托現(xiàn)有 IT 資源輸出精準、高價值的業(yè)務(wù)決策?

        高質(zhì)量 AI 應(yīng)答的核心前提,是模型可高效觸達原始可信數(shù)據(jù),而檢索增強生成(RAG)正是優(yōu)化推理效果、提升應(yīng)答準確性與時效性的關(guān)鍵技術(shù)。然而,當向量數(shù)據(jù)量激增至數(shù)十億級別時,CIO們面臨到了傳統(tǒng)全內(nèi)存向量索引方案的容量與成本困境。飛漲的DRAM價格、不穩(wěn)定的貨期和數(shù)據(jù)在CPU與存儲間頻繁搬運造成的"內(nèi)存墻"與"IO墻"瓶頸,正嚴重制約著AI應(yīng)用的規(guī)模化落地,企業(yè)在落地過程中普遍遭遇四大痛點:

        • 非結(jié)構(gòu)化數(shù)據(jù)類型繁雜,僅1% 數(shù)據(jù)能被 AI 有效利用并創(chuàng)造價值;
        • 數(shù)據(jù)失真與模型幻覺為企業(yè)帶來合規(guī)與決策風險;
        • RAG 流程引發(fā)多副本冗余、數(shù)據(jù)反復傳輸,成本居高不下;
        • 面向 PB 級海量數(shù)據(jù)時,傳統(tǒng)架構(gòu)性能瓶頸凸顯,難以規(guī)模化落地。

        打破 "1% 數(shù)據(jù)困局",讓 AI 走向數(shù)據(jù)

        當下企業(yè)被海量非結(jié)構(gòu)化數(shù)據(jù)包圍,PDF、郵件、音視頻、演示文稿、財務(wù)報表等數(shù)據(jù)持續(xù)增長,但能被大模型調(diào)用并產(chǎn)生價值的占比不足 1%。

        RAG 技術(shù)通過數(shù)據(jù)向量化、優(yōu)化批量刷新周期、依托 GPU 集群實現(xiàn)分布式處理,可打破數(shù)據(jù)訪問限制,讓 AI 覆蓋更廣泛的數(shù)據(jù)來源。而 IBM Storage Scale 的核心突破,在于摒棄 "數(shù)據(jù)遷移至 AI" 的傳統(tǒng)模式,實現(xiàn) "AI 走向數(shù)據(jù)" 的全新范式。簡單的說,就是CAS技術(shù)直接在存儲層做文檔的提取和向量化(甚至集成了NVIDIA的微服務(wù))實現(xiàn)了讓 AI 走向數(shù)據(jù),即讓 AI 快速定位合規(guī)、潔凈的可用數(shù)據(jù),從源頭降低模型幻覺風險,這一能力依托 IBM CAS 內(nèi)容感知存儲(Content-Aware Storage技術(shù)實現(xiàn)。

        AI 存儲新范式:CAS 將向量處理下沉至存儲層

        CAS 的顛覆性創(chuàng)新,是讓存儲系統(tǒng)從被動 "數(shù)據(jù)倉庫" 轉(zhuǎn)變?yōu)橹鲃?"AI 參與單元"—— 存儲不再僅保存數(shù)據(jù),而是對數(shù)據(jù)項進行量化理解,將原本由向量數(shù)據(jù)庫承擔的文檔向量化流程,從應(yīng)用層直接下沉至存儲層

        IBM CAS
        IBM CAS

        通俗來講,傳統(tǒng) RAG 需先將數(shù)據(jù)從存儲取出,在外部完成向量化后導入向量數(shù)據(jù)庫;而 CAS 可在存儲系統(tǒng)內(nèi)部完成全流程處理,數(shù)據(jù)無需遷移、無需拷貝

        該技術(shù)源于 IBM 研究院在自然語言處理、向量嵌入模型、硬件加速領(lǐng)域的長期技術(shù)積累。文檔數(shù)據(jù)提取流程深度整合基于 NVIDIA NIM 構(gòu)建的 NVIDIA NeMo Retriever 微服務(wù)(隸屬于 NVIDIA AI Enterprise),確保 AI 助手與 AI Agent 基于最新、最相關(guān)的上下文應(yīng)答,簡化 RAG 運維、提升 AI 應(yīng)用業(yè)務(wù)價值。

        IBM Storage Scale(原 GPFS)為企業(yè)構(gòu)建全局統(tǒng)一數(shù)據(jù)平臺,在多站點、多云、數(shù)據(jù)中心與邊緣環(huán)境間打造單一命名空間,兼容第三方存儲,打破數(shù)據(jù)孤島,實現(xiàn)全域數(shù)據(jù)統(tǒng)一訪問。CAS 作為 Storage Scale 的全新 AI 增強能力,助力企業(yè)從現(xiàn)有數(shù)據(jù)資產(chǎn)中挖掘更大價值,顯著提升 RAG 準確性、減少模型幻覺,讓 AI 模型無需重新訓練即可同步最新數(shù)據(jù),適配科研、客戶服務(wù)、知識型應(yīng)用等企業(yè)級場景。

        企業(yè)級 RAG 規(guī)模化:打破性能瓶頸,加碼安全合規(guī)

        市面主流向量數(shù)據(jù)庫支撐百億級向量,通常需要數(shù)十乃至上百臺服務(wù)器,節(jié)點規(guī)模擴張后,分布式索引同步、故障恢復、擴容遷移等問題頻發(fā),運維與成本壓力巨大。

        IBM Storage Scale System
        IBM Storage Scale System

        IBM Storage Scale 存儲方案實現(xiàn)單服務(wù)器承載 1000 億向量,按企業(yè)典型文檔場景測算,可全面覆蓋 PB 級至數(shù)十 PB 級非結(jié)構(gòu)化數(shù)據(jù),為企業(yè) CIO 帶來四大核心價值:

        1. 基礎(chǔ)設(shè)施成本指數(shù)級下降:無需部署數(shù)十乃至上百臺向量數(shù)據(jù)庫服務(wù)器;
        2. 運維復雜度大幅降低:單一存儲集群即可支撐全流程 RAG 需求;
        3. 企業(yè)級實時性保障:端到端延遲低至694 毫秒,滿足核心業(yè)務(wù)實時要求;
        4. 數(shù)據(jù)安全能力強化:繼承原始數(shù)據(jù)源權(quán)限管控體系,聊天機器人應(yīng)答等衍生數(shù)據(jù)統(tǒng)一遵循安全策略。

        底層核心優(yōu)勢:數(shù)據(jù)就地處理、無需遷移,檢索與計算在數(shù)據(jù)存儲位置直接完成,天然契合數(shù)據(jù)合規(guī)與安全管控要求。

        單服務(wù)器承載千億向量的技術(shù)底氣:核心依托IBM Storage Scale System 6000 全閃存存儲一體機:單節(jié)點配置 48 塊 NVMe 盤,搭載 PCIe Gen5 與 400Gb InfiniBand 高速互聯(lián),結(jié)合 NVIDIA GPUDirect Storage 技術(shù),實現(xiàn) GPU 直接訪問 SSD 數(shù)據(jù),跳過 CPU 數(shù)據(jù)搬運環(huán)節(jié)。

        系統(tǒng)將超大規(guī)模索引拆分為多個獨立子索引,各子索引可獨立優(yōu)化、獨立重建、互不干擾,徹底解決傳統(tǒng)向量數(shù)據(jù)庫 "牽一發(fā)而動全身" 的重構(gòu)痛點。

        實測數(shù)據(jù)對比:純 CPU 環(huán)境下,千億級向量索引重建需 120 天;搭載 6 塊 NVIDIA H200 GPU 的 IBM Storage Scale System 6000,僅需4 天即可完成。

        結(jié)語

        人工智能時代,存儲的角色被重新定義。IBM 給出明確答案:存儲不應(yīng)成為 AI 瓶頸,而應(yīng)是 AI 基礎(chǔ)設(shè)施的核心加速器。

        本次方案提供純軟件版一體機版兩種交付形態(tài),全面兼容 RHEL AI 開源數(shù)據(jù)流水線,深度集成 NVIDIA AI Data Platform,是可直接落地生產(chǎn)環(huán)境的企業(yè)級解決方案。

        以 IBM Storage Scale 為核心的 AI 存儲方案,正在讓 PB 級企業(yè) RAG 從技術(shù)構(gòu)想變?yōu)楝F(xiàn)實。RAG 的規(guī)模上限,不再受限于向量數(shù)量與存儲性能,而取決于企業(yè)可觸達、可利用的數(shù)據(jù)邊界。

        [1] IBM Introduces Content-Aware-Storage for RAG Workloads, Storage review, April 22, 2026.  https://www.storagereview.com/news/ibm-introduces-content-aware-storage-for-rag-workloads 

         

        IBM Corporation logo.
        IBM Corporation logo.
        消息來源:IBM China
        China-PRNewsire-300-300.png
        全球TMT
        微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
        collection
        主站蜘蛛池模板: 亚洲区中文字幕日韩精品| 性夜黄a爽影免费看| 国产中文成人精品久久久| 韩国午夜理论A三级在线观看| 国产精品中文av专线| 午夜福利你懂的| 日韩精品一区二区三区VR| 91在线日韩在线播放| 人人妻人人澡人人爽人人欧美一区| 久久99视频| 影音先锋看av资源网| 91精品国产无线乱码在线| 风韵丰满熟妇啪啪区老熟熟女| 26uuu精品一区二区三区四区| 午夜美女裸体福利视频| 成人亚洲国产精品一区不卡| 人妻丰满熟妇无码区免费| 欧美不卡精品中文字幕日韩| 中文无码日| 秋霞国产午夜伦午夜福利片| 国产国产精品人体在线视| 再看日本中文字幕在线观看| 亚洲欧洲∨国产一区二区三区| 在线涩涩免费观看国产精品 | 人妻中文字幕在线视频无码| 久久国产乱子伦免费精品无码| 江永县| 成人网站国产在线视频内射视频| 内射老阿姨1区2区3区4区| 精品成a人无码| 呦交小U女精品视频| 亚洲人妻精品中文字幕| 国产综合自拍| 色狠狠色噜噜AV一区| 日韩AV高清在线看片| 亚洲自拍成人在线视频| 久久国产精品免费99| 国产成人精品午夜二三区 | 午夜成人福利视频| jizz亚洲| 淫射网|