资讯
`
2025/6/27 08:41
消息称 DeepSeek-R2 AI 模型开发进程因美国当局英伟达 H20 芯片出口限制而延迟
0
0

据外媒 The Information 报道,由于美国当局策略致英伟达 H20 芯片在中国内地供应短缺,继而导致 DeepSeek-R2 AI 模型开发工作延迟。

DeepSeek 使用了 5 万块 Hopper GPU 训练 R1 模型,其中包括 3 万块 H20、1 万块 H800 和 1 万块 H100,这些显卡由其投资方高毅资产(High-Flyer Capital Management)采购。

外媒援引两位知情人士透露,DeepSeek 团队近几个月一直在密集推进 R2 模型开发,但 CEO 梁文锋目前对模型的能力仍不满意,内部仍在继续提升性能,相应模型尚未准备好正式投用

此外,相应报道同时指出,多数用户都是在英伟达的 H20 芯片上部署 / 运行现有 DeepSeek-R1 模型,随着 H20 芯片遭美国当局限制出口,除了令 DeepSeek R2 的研发更加困难外,也对现有 DeepSeek-R1 实际部署造成一定影响。

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销