C114通信网  |  通信人家园

人工智能
2025/3/26 08:40

DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5

快科技  拾柒

昨晚,DeepSeek官宣,DeepSeek V3模型已完成小版本升级。

目前版本号为DeepSeek-V3-0324,用户登录官方网页、App、小程序进入对话界面后,关闭深度思考即可体验,API 接口和使用方式保持不变。

虽然是小版本更新,但从反馈来看,这次升级带来的性能提升却相当显著,特别是在前端开发、数学推理和上下文理解方面有了明显进步。

据了解,新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。

DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5

同时,在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。

在中文写作任务方面,新版V3模型基于R1的写作水平进行进一步优化,同时特别提升了中长篇文本创作的内容质量。

此外,新版V3模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。

其他方面,该模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。

据DeepSeek介绍,DeepSeek-V3-0324与之前的DeepSeek-V3使用同样的base模型,仅改进了后训练方法。

私有化部署时只需更新checkpoint和tokenizer_config.json(tool calls 相关变动)。

模型参数约660B,开源版本上下文长度为128K(网页端、App和API提供64K上下文)。

与DeepSeek-R1保持一致,此次DeepSeek开源仓库(包括模型权重)统一采用MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5

 

DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5

 

给作者点赞
0 VS 0
写得不太好

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2025 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141