DeepSeek在北京时间24日深夜悄悄放了个大招,没有像美国的OpenAI等技术公司那样事先炒作,就默默推出一个新版本DeepSeek-V3-0324。从命名方式看是V3的小幅改进版,然而能力是掩盖不住的,这个新版本的各项指标都有大幅提升,而且对硬件的需要很低,尤其值得注意的是采用了可免费商用的开源方式,等于在AI界又扔了一颗炸弹,立刻引起国外AI研究者的关注。

国外AI研究者测试DeepSeek-V3-0324
DeepSeek发布这个模型时,没有发布任何白皮书、博文或市场推广,除了模型文件本身,只有一个README文件,内容还是空的。这种做法与西方AI公司精心策划的产品发布形成了鲜明对比,OpenAI等公司在发布校招版本之前,经常会炒作几个月。
新的DeepSeek-V3-0324拥有6850亿个参数,从命名方式来看,属于V3的小幅改进版本,然而它的能力却不是小幅改进。
DeepSeek-V3-0324发布后,立刻有国外研究者进行了测试,他们发现该产品较上一版本有了显著改进。AI研究人员Xeophon在社交媒体平台发帖称 "在我的内部工作台上测试了新的DeepSeek V3,它在所有测试中的各项指标都有大幅提升。它现在是最好的非推理模型,超越了Sonnet 3.5。"
升级后的V3在代码编写、数学推理等方面得到显著提升,尤其是代码领域,已经与此前据称代码能力最强的Claude 3.7 Sonnet处于同一水平上,不少网友直呼眼前一亮。

国外AI研究者所做的评比
新的DeepSeek对硬件的需要进一步降低,AI研究员Awni Hannun在社交媒体上说,用苹果公司的消费级Mac Studio本地部署运行DeepSeek-V3-0324,速度达到20 token/秒!虽然Mac Studio的售价接近1万美元,但与英伟达的天价GPU相比,简直是白菜价,小型公司也用得起,不需要建立昂贵的数据中心。
而且DeepSeek-V3-0324采用了新的MIT许可开源方式,可以免费用于商业用途,预计会受到小型企业的欢迎。
国外AI研究人员相信,DeepSeek-V3-0324的发布时间和特点强烈表明,它将成为DeepSeek下一代模型R2的基础。外界预计DeepSeek-R2将在未来几个月内推出,性能有可能直接对标OpenAI的下一代旗舰模型GPT-5。(扬子晚报国际新闻工作室 宋世锋)
校对 石伟
相关文章:
苔藓爬满旧日诺顾砚廷慕晚夏推荐完本_已完结苔藓爬满旧日诺(顾砚廷慕晚夏)04-19
人面桃花长相忆闻砚辞文章简述(阮雾梨闻砚辞)最新章节_人面桃花长相忆闻砚辞文章简述全文阅读04-19
全网独家(苔藓爬满旧日诺言:全文+后续+结局)顾砚廷慕晚夏完整章节已完结阅读_苔藓爬满旧日诺言:全文+后续+结局最新章节列表_笔趣阁(顾砚廷慕晚夏)04-19
(番外)+(全文)此生虽短情意长:全文+番茄:此生虽短情意长:全文+番茄+免费下载阅读_(程微雨傅临淮)此生虽短情意长:全文+番茄:此生虽短情意长:全文+番茄最新章节列表_笔趣阁(程微雨傅临淮)04-19
全本许是曾经有相思:+后续+结局(阮雾梨闻砚辞)最新章节列表_全本许是曾经有相思:+后续+结局全文阅读04-19
云狸越渊结局+番外+结局(佛心不渡红尘劫)全文免费阅读无弹窗大结局_云狸越渊:结局+番外免费阅读最新章节列表_笔趣阁(云狸越渊结局+番外)04-19
顾砚廷慕晚夏:苔藓爬满旧日诺言:+后续+结局(顾砚廷慕晚夏)全文免费阅读无弹窗大结局_苔藓爬满旧日诺言:+后续+结局顾砚廷慕晚夏最新全文阅读(顾砚廷慕晚夏)04-19