AI下围棋能展示思考过程了!上海这款大模型已对外开源

5月23日,澎湃新闻(www.thepaper.cn)从上海人工智能实验室(上海AI Lab)了解到,基于一系列“通专融合”底层技术新进展,实验室推出的书生·思客(InternThinker)获得专业推理能力大幅提升,成为首个既具备围棋专业水平,又能展示透明思维链的大模型。

说起AI下围棋,AlphaGO早在2016年就一战成名。随后,AI在棋力、效率、通用性等方面均有显著提升,但其具体推理过程仍为“黑盒”,即便能输出胜率评估和落子概率,亦无法用人类语言解释“为什么某一步更好”。典型表现为:AI有时会下出违背人类直觉的“天外飞仙”棋步,事后被证明有效,但当时难以解释。

而升级后的InternThinker,在围棋任务上不仅具备较强的专业水平,还在大模型中率先实现打破思维“黑盒”,运用自然语言对弈过程进行讲解。用户在与InternThinker对弈的过程中,大模型能全面地分析当前局面形势,对不同的落子点进行判断和对比,并给出明确的结果,让用户了解每一步棋背后的推理过程和决策依据,从而帮助用户更好地理解和学习围棋。

回顾当年AlphaGO和李世石的交战,第四盘78手李世石落在L11,被世界围棋八冠王古力称为“神之一手”,直接扭转了局势取得最终胜利。在研究人员对该名局的复现中,InternThinker评价这步棋“相当刁钻”,随后给出了落子在L10的应对策略,认为能够完美解决L11的威胁,重新确立中央控制权,为后续进攻埋下伏笔。

InternThinker对于李世石“神之一手”的解析和应对 本文图片均为上海人工智能实验室供图

在棋力方面,InternThinker未来仍有提升空间。新生代世界围棋冠军王星昊九段在与其对弈后评价道:“能解说思考过程的AI还是第一次见,感觉它分析得非常好,从布局看棋力可能在职业3-5段之间。”

研究团队创造性地构建了一个“加速训练营”(InternBootcamp),通过对评价建模,与大模型进行交互并提供反馈,从而使大模型持续进化,获得解决复杂推理任务的能力。通过该方法,InternThinker已实现在奥赛级数学、科学对象理解与推理、算法编程、棋类游戏、智力谜题等多个专业任务同步学习演进,并在多任务混合强化学习过程中出现智能“涌现时刻”。

随着InternBootcamp任务的数量增加、质量提升和难度加大,大模型有望迎来能力的“升华”,高效解决更多、更难、更具实用性的推理任务,在助力大模型推理能力泛化的同时,加速推动科学发现。

InternThinker下棋时的语言风格也很独特。

而这些技术进展,根本上是得益于近期上海AI Lab在“通专融合”路线的底层技术和架构方面的一系列创新突破。大模型发展历程主要分化为专业性和通用泛化性两大路线,上海AI Lab率先提出“通专融合”技术路线,着力解决大模型高度专业化与通用泛化性相互制约的发展困境。这一路径的关键在于同步提升深度推理与专业泛化能力,使模型不仅在广泛的复杂任务上表现出色,还能在特定领域中达到专业水平。

目前,InternBootcamp技术已对外开源。上海AI Lab表示,将系统推进通专融合技术路线的发展与探索,将通专融合的新能力、新进展持续通过InternBootcamp对外开放,加速以新一代通专融合基座模型的方式解决具体科学发现中的关键问题,同时牵引打造垂直领域示范应用案例,为科学发现与产业创新提供关键驱动力。

文章来源于网络。发布者:每日电讯网,转转请注明出处:https://www.jnlts.cn/17644.html

(0)
每日电讯网的头像每日电讯网
上一篇 2025年5月23日
下一篇 2025年5月23日

相关推荐

  • 西尔艾力·外力任吐鲁番市副市长、代理市长,朱继坤任副市长

    吐鲁番市人民代表大会常务委员会任免名单 (2025年5月19日吐鲁番市第二届人民代表大会常务委员会第二十六次会议通过) (一) 决定任命西尔艾力·外力为吐鲁番市副市长、代理市长。 (二) 决定任命朱继坤为吐鲁番市副市长。 (三) 决定任命杨新民为吐鲁番市信访局局长。 (四) 免去何洵的吐鲁番市监察委员会委员职务。

    2025年5月21日
    400
  • 言短意长|新能源领军者密集捐赠母校

    母校校庆在即,多位来自新能源领域的领军人物近日捐赠了巨额资金,支持母校发展。 复旦大学120周年校庆在即,校友李平、廖梅夫妇一次性捐赠10亿元人民币,支持建设复旦大学学敏高等研究院。 复旦大学1989届材料科学系本科毕业合影 李平系复旦大学材料系高分子专业1985级校友,廖梅系历史学系1986级校友,二人相识于复旦。本科毕业后,李平投身商界,是宁德时代联合创…

    2025年4月29日
    2000
  • 中科院院士魏辅文已卸任江西农业大学校长

    江西农业大学官网日前更新后显示,中科院院士魏辅文已不再担任江西农业大学校长。 魏辅文,1964年4月生于重庆市云阳县,1984年和1987年在南充师范学院(现西华师范大学)分别获得学士和硕士学位,1997年获中国科学院动物研究所博士学位。中国科学院院士,发展中国家科学院院士,欧洲科学院院士,保护生物学家,享受国务院政府津贴。 魏辅文 魏辅文曾任中国科学院动物…

    2025年5月8日
    1000
  • 这个假期 很多人为一只“手”来河南

    “五一”假期,博物馆成为旅游度假的热门选项。作为国内首个全景式展现商文明的专题博物馆,河南安阳的殷墟博物馆迎来客流高峰,昨日接待游客量突破1.8万人次。 和文物“握个手” 解锁商代人的故事 在殷墟博物馆,有很多种方式可以近距离感受三千多年前的神秘商朝。比如,可以和小巧精美的青铜手“握个手”,感受精美的纹路。博物馆专门在原件的附近设置了一个1比1模型,吸引了非…

    2025年5月3日
    1500
  • 15岁初中生购得青石佛头盼物归原处,专家初步鉴定佛头或属北齐

    求助,称其在去年购得一尊青石佛头,希望借助全网的力量为其寻找“主人”,并承诺一旦确认文物出处,将无偿捐赠。 小于提供的资料显示,这尊佛头高 30.2 厘米,宽 16.5 厘米,厚 15.8 厘米,材质为青石,佛像头戴高冠,表面有矿物彩,且风化磨损较为严重。大象新闻记者将佛头的影像资料转交给洛阳龙门石窟研究院的相关工作人员,目前有了最新进展。 “这个佛像不太像…

    2025年4月23日
    2200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信