开云(中国)官网 谷歌一篇著作吓坏市集,三星电子、SK海力士、好意思光等巨头市值一天挥发6200亿元,分析师:看来许多东说念主对技巧一窍欠亨

关于开云

你的位置:开云体育(中国)官方网站 > 关于开云 > 开云(中国)官网 谷歌一篇著作吓坏市集,三星电子、SK海力士、好意思光等巨头市值一天挥发6200亿元,分析师:看来许多东说念主对技巧一窍欠亨


开云(中国)官网 谷歌一篇著作吓坏市集,三星电子、SK海力士、好意思光等巨头市值一天挥发6200亿元,分析师:看来许多东说念主对技巧一窍欠亨

发布日期:2026-03-27 18:44    点击次数:90

开云(中国)官网 谷歌一篇著作吓坏市集,三星电子、SK海力士、好意思光等巨头市值一天挥发6200亿元,分析师:看来许多东说念主对技巧一窍欠亨

记者|郑雨航

从“算力期间”参加“推理期间”,AI对内存的需求激增,大幅提振了公共存储公司事迹和股价。

但谷歌的一篇著作,让好意思国和韩国的内存巨头市值一天挥发了超900亿好意思元(约合东说念主民币6200亿元)。

当地时期3月24日,谷歌盘考院(GoogleResearch)发布了一篇先容名为TurboQuant的向量量化压缩算法的著作,声称在不蚀本准确率前提下,将大模子运行时的关节内存占用压缩至3比特(原有内存占用的1/6)。

有市集不雅点以为,这一算法将减少AI对内存的需求。

但也有分析师称,市集的反应阐发,许多东说念主对技巧“一窍欠亨”。

谷歌发布新算法

存储巨头市值挥发逾6200亿元

当地时期3月24日,谷歌发布名为TurboQuant的内存压缩算法。谷歌方面暗示,TurboQuant不错在不蚀本准确性的情况下,将大型说话模子运行时的关节部分——键值缓存(KVCache)的内存占用减少为原有的1/6,同期在英伟达H100GPU上的特定测试中,性能可升迁高达8倍。

这一音信马上触发市集重估逻辑。

富国银行分析师AndrewRocha以为,这项技巧可能影响异日对内存容量规格的需求判断。他在论说中写说念:“市集很快就会再行评估,AI究竟还需要若干内存容量。”

当地时期3月25日,即音信发布后的第一个好意思股走动日,存储芯片板块在盘中集体跳水。闪迪(SanDisk)股价一度大跌6.5%,收盘时跌幅收窄至3.5%,市值蚀本36.3亿好意思元。同日,好意思光科技(MicronTechnology)下落3.4%,市值蚀本151.66亿好意思元;西部数据(WesternDigital)下落1.63%,市值蚀本16.64亿好意思元;希捷科技(SeagateTechnology)下落2.76%,市值蚀本21.4亿好意思元。3月26日开盘,存储芯片板块不竭集体下落。

负面心理马上扩散至亚洲市集。3月26日,韩国SK海力士股价下落6.23%,市值蚀本44.18万亿韩元(约合293.8亿好意思元);三星电子也下落了4.71%,市值蚀本57.83万亿韩元(约合384.5亿好意思元)。

公共主要内存巨头市值蚀本统共超900亿好意思元(约合东说念主民币6200亿元)。

直击大模子“本钱痛点”:

KV缓存占用减少83%

TurboQuant激励调动的中枢,在于其精确击中了大模子的关节本钱痛点——KV缓存(Key-ValueCache)。

在大模子推理经由中,模子需要保存历史坎坷文信息变成KV缓存,以幸免重迭筹算。但跟着坎坷文窗口增长,KV缓存呈线性膨大,占用深广GPU内存。

举例,一个700亿参数模子在512用户、2048Token输入场景下,仅KV缓存就需约512GB内存,约为模子履行的4倍,已成为买卖化部署中的最大本钱之一。

传统经管决议是“量化”,即用低精度数据替代高精度浮点数,但时时糟跶准确率,且还需零碎存储量化参数,对消部分压缩收益。

TurboQuant通过两步优化经管这一问题。

第一步,应用名为PolarQuant的设施,将数据从笛卡尔坐标调治为极坐标,开云体育官网访佛于“向东走3米,向北走4米”的提醒,简化为“以37度角走5米”。通过随即旋转让数据离别可展望,从而无需零碎量化参数,获胜减少内存支出。

第二步,再应用名为QJL(量化约翰逊-林登施特劳斯变换)的技巧,用只是1个比特来修正第一步压缩后产生的狭窄罅隙,确保最终禁止的准确性。

谷歌暗示,通过该组合决议:

◆KV缓存可压缩至3比特,内存占用减少为原有的1/6(降幅约83%);

◆在Gemma、Mistral等模子测试中,性能与未压缩模子一致,无需零碎进修或微调;

◆在NVIDIAH100测试中,4比特TurboQuant耀目力筹算速率达到32位未量化的8倍。

华尔街舌战:

从简缓存即是减少内存总需求吗?

尽管市集短期剧烈反应,但机构不雅点明显分化。

率先,这项技巧并非初次袒露,关连论文早在2025年4月已公开。

其次,有分析指出,谷歌所谓的“8倍性能升迁”是与32位未量化模子对比得出,而刻下主流已深广给与4位量化,履行升迁或低于宣传值。

市集分析机构CitriniResearch分析师Jukan直言,因TurboQuant导致内存股暴跌,反馈出市集对技巧“一窍欠亨”,就像丰田推出混动发动机却让石油公司暴跌通常。

摩根士丹利则指出,TurboQuant技巧的影响领域是有限的。它仅作用于推理阶段KV缓存,不影响模子权重,也不触及进修法子。因此,这并不料味着举座存储需求下降到原来的1/6,而是升迁单元硬件禁止,让换取的硬件能处理更长的坎坷文或职业更多用户。

此外,摩根士丹利征引“杰文斯悖论”(JevonsParadox),该表面以为,禁止升迁时时不会减少资源破钞,反而会因本钱下降而刺激需求增长。就像瓦特校阅蒸汽机提高了煤炭燃烧禁止,禁止却是公共煤炭需求量的飙升通常。摩根士丹利以为,通过大幅裁汰单次查询的职业本钱,TurboQuant或者让原来只可在云表激动集群上运行的模子迁徙至腹地,灵验裁汰AI限制化部署的门槛,这可能反而能进一步提振举座需求。

Cloudflare首席施行官MatthewPrince将TurboQuant称为谷歌的“DeepSeek时刻”。访佛情况曾在DeepSeek发布时出现:市集一度担忧算力需求下降,但最终AI应用爆发,反而推高硬件需求。一开动下落的英伟达其后再创历史新高。

从行业法律解说“内存帕金森定律”来看,TurboQuant从简的内存不会闲置,而会被马上破钞:每一轮硬件升级或软件优化开释出来的存储余量,很快就会被更长的坎坷文窗口、更大的批处理限制、更复杂的推理需求所吞吃。换言之,从简下来的空间将被用于职业更多并发苦求、处理更长的文档开云(中国)官网,或者运行原来因内存不及而无法加载的大模子,以致可能激动更宏大的AI应用在手机等挪动开荒上成为现实。

凤凰彩票(welcome)APP官网下载

Copyright © 1998-2026 开云体育(中国)官方网站™版权所有

bjshengjiangche.com 备案号 备案号: 京ICP备18033667号-1

技术支持:®开云体育  RSS地图 HTML地图