4月24日,DeepSeek发布了全新一代模型DeepSeek-V4预览版,并同步开源。该模型具备百万字超长上下文,在Agent能力、世界知识和推理性能方面均达到国内与开源领域的领先水平。昇腾超节点全系列产品支持DeepSeek V4系列模型。

此次发布的DeepSeek-V4预览版包括Pro与Flash两大版本,均具备百万字上下文处理能力,打破了长文本处理的场景限制。新版本支持思考模式切换、Json输出、工具调用、对话前缀续写等企业级功能,FIM补全功能在非思考模式下也可正常使用,适用于开发、办公、法律、金融等复杂场景需求。

DeepSeek-V4按大小分为两个版本:DeepSeek-V4-Pro激活参数为49B,预训练数据33T,定位高性能旗舰;DeepSeek-V4-Flash激活参数13B,预训练数据32T,主打高速与低成本。

API服务信息也进行了更新,兼容OpenAI与Anthropic两大标准接口,开发者只需修改model_name即可快速调用。原有接口将在三个月后停用,现阶段自动映射至Flash版本以降低迁移成本。
定价体系上,DeepSeek-V4延续普惠路线。Flash版缓存命中输入每百万Token仅0.2元、未命中1元、输出2元;Pro版缓存命中1元、未命中12元、输出24元。受限于当前高端算力,Pro版服务吞吐有限,但随着下半年昇腾超节点全系列产品批量上市,价格有望大幅下调,进一步释放高性能AI的普惠空间。
与前代模型相比,DeepSeek-V4-Pro的Agent能力显著增强,在Agentic Coding评测中已达当前开源模型最佳水平,并在其他Agent相关评测中表现优异。DeepSeek-V4已成为内部员工使用的Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式,但仍与Opus 4.6思考模式存在一定差距。
在世界知识测评中,DeepSeek-V4-Pro大幅领先其他开源模型,稍逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越所有已公开评测的开源模型,比肩世界顶级闭源模型。
相比之下,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出接近的推理能力。由于模型参数和激活更小,V4-Flash能够提供更加快捷、经济的API服务。在简单任务上,DeepSeek-V4-Flash与Pro版旗鼓相当,但在高难度任务上仍有差距。
DeepSeek-V4还引入了一种新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力,实现了全球领先的长上下文能力,并且大幅降低了对计算和显存的需求。
目前,国内竞品多聚焦参数竞赛与短文本交互,长上下文能力普遍停留在128K-256K区间,且开源版本能力有限。而DeepSeek-V4以“1M上下文+全开源+双版本+全接口兼容”的组合打法实现差异化升级,也为全链条自主可控打下基础。
东吴证券认为,DeepSeek V4在多个核心领域实现突破性进展,综合能力全面超越当前海外主流顶级大模型,性能表现领先。在训练架构上,DeepSeek V4开始明显转向适配国产算力,成为国产大模型拥抱国产算力的关键里程碑,相关算力标的有望受益。
受DeepSeek-V4预览版发布带动,国证半导体芯片指数今日强势上涨1.06%,成分股海光信息上涨6.43%,龙芯中科上涨5.87%,华润微上涨3.68%,中芯国际、圣邦股份等个股跟涨,半导体ETF鹏华上涨1.08%。
两天前正规股票配资推荐,有消息称腾讯和阿里正在洽谈投资DeepSeek,DeepSeek寻求以超过200亿美元估值筹集资金。不过,DeepSeek对此并未回应。
元鼎证券_元鼎证券官方下载-欢迎下载安装官方APP,轻松使用各项功能提示:本文来自互联网,不代表本网站观点。