DeepSeek-V3盛大发布!6710亿参数开源MoE模型引爆国产AI时代

内容摘要  近日,AI界传来重磅消息!深度求索团队在官方公众号宣布,DeepSeek-V3模型已正式上线并开放源代码,用户现在只需在网注册,就可以与这一最新巨型模型亲密互动。  据官方透露,DeepSeek-V3是一个拥有惊人6710亿参数的专家混合(MoE)模型,通过巧妙地将问题空间细分成多个同质区域,极大增强了模型的处理能力。在预训

  近日,AI界传来重磅消息!深度求索团队在官方公众号宣布,DeepSeek-V3模型已正式上线并开放源代码,用户现在只需在网注册,就可以与这一最新巨型模型亲密互动。

  据官方透露,DeepSeek-V3是一个拥有惊人6710亿参数的专家混合(MoE)模型,通过巧妙地将问题空间细分成多个同质区域,极大增强了模型的处理能力。在预训练过程中,这款模型捉住了高达14.8万亿的token,并激活了其中370亿个参数。这样的体量,使得DeepSeek-V3在众多评测中脱颖而出,不仅超越了众多开源模型如Qwen2.5-72B和Llama-3.1-405B,甚至能与全球顶尖的闭源竞争者如GPT-4o和Claude-3.5-Sonnet相媲美。

  这款模型在知识获取、长文本处理、代码生成、数学计算、中文理解等多个领域都表现出色,尤其在算法代码以及数学问题的处理上,简直是天花板级别。它的生成速度也获得了飞跃性提升,达到了每秒60个token处理能力,相较于V2.5版本,速度提升了整整三倍。

  与此同时,DeepSeek还对API服务价格进行了调整,让更多用户得以体验这款强大模型的魅力。新的定价策略设定为:输入token缓存命中时每百万仅需0.5元、未命中则为2元,而输出token每百万则为8元。

  值得一提的是,从即日起到2025年2月8日,DeepSeek特别推出了一个长达45天的优惠体验期,即使未注册用户也能享受超低价格:缓存命中输入token每百万仅需0.1元、未命中1元,而输出token则仅需2元。这无疑是一个让人振奋的时刻,快来与DeepSeek-V3的巨大潜力碰撞吧!返回搜狐,查看更多

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1