消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达

4月29日消息,据国内媒体报道称,深度求索可能会在下个月有所行动,推出下一代AI大模型DeepSeek-R2。

报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。

此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。

据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。

DeepSeek-R2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。

据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。

消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达

文章来源于网络。发布者:每日电讯网,转转请注明出处:https://www.jnlts.cn/10433.html

(0)
每日电讯网的头像每日电讯网
上一篇 2025年4月29日
下一篇 2025年4月29日

相关推荐

  • 6000多万人同时“失联”!西班牙首相誓言彻查大停电事件

    4月30日消息,当地时间本月28日,西班牙和葡萄牙遭遇了大规模停电事件,影响范围极广,次日,西班牙首相佩德罗桑切斯表示将彻底调查本次停电事件。 据了解,从28日中午起,西班牙全国突然大停电,民众日常生活陷入瘫痪,大停电还蔓延到包括葡萄牙在内的整个伊比利亚半岛,6000多万人在没有电、互联网或手机信号的情况下度过了数小时。 此外,停电还导致飞机停飞,公共交通中…

    2025年4月30日
    1000
  • 杰森·斯坦森力压白雪公主

    杰森斯坦森在新片《制暴:无限杀机》中解锁工地战神成就,就连宣发也教导大家爽片看杰森: 该片剧本有史泰龙的功劳,他与导演大卫艾耶共同根据原著小说《Levon's Trade》编写了剧本,据说在人物塑造方面依稀有《第一滴血》的影子。 杰森扮演的主人公也曾经是特种兵,主动退役只为过平淡日子,于是去工地搬砖。被他视为家人的小姐姐遭人绑架后,怒不可遏的杰森勇…

    2025年3月30日
    2300
  • 郑州到开封的动车火了:车窗竟然是触摸屏 还能放视频

    4月30日消息,最近不少动车车窗变触控屏的视频引发网友关注,不少人直呼自己已经跟不上时代。 据中国铁路科普,这是在郑开城际铁路上运营的C2922次列车,每天上午8:19从郑州东站出发,8:57到达开封。 它归类于CRH3A-A型城际动车组,以复兴号智能技术为依托,集快启快停、公交化运营等特点于一身,最高运行时速200公里,可高效满足短途高频出行需求。 其采用…

    2025年4月30日
    1000
  • 上海交大研发“水平对置两缸增程专用发动机”:成本直降三分之二

    3月29日消息,中国电动汽车百人会论坛(2025)于3月28日至3月30日在北京举行,上海交通大学汽车工程研究院院长许敏出席并演讲。 他介绍,自2008年起,上海交大团队开始研发水平对置两缸增程专用发动机。 对比传统四缸直喷增压发动机,这款发动机采用自然吸气+气道喷射,取消涡轮增压/可变气门等系统。 不采用传统内燃机的铸造和数控机床加工工艺,以塑料机身取代金…

    2025年3月29日
    4600
  • 真相曝光!小米汽车被拼接进醉驾新闻视频 深圳新闻网回应来了

    4月30日消息,针对小米汽车被拼接进醉驾新闻视频一事,深圳新闻网回应称,发现后已立即下架该视频,将举一反三,强化管理。 深圳新闻网发布情况说明称,4月28日,我网发布的《男子醉驾被查时称开了智驾》视频,因编辑误用一秒非涉事品牌车辆资料画面,引发网友关注。 对此,我们发现后立即下架该视频。今后,我们将举一反三强化管理,杜绝此类问题再次发生。 从网友曝光的视频画…

    2025年4月30日
    800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信