75年后,图灵设想成真!总台这一次全网热议的AI测试如何诞生?

音符科技网

近日,一场别开生面的人机辩论“图灵测试”引发全网热议——国产AI大模型MiniMax以42%的“人类认同率”通过图灵测试,远超75年前“人工智能之父”图灵设定的30%基准线,标志着国内首个通过人机辩论“图灵测试”的大模型诞生。

在由中央广播电视总台精心打造的《2025中国·AI盛典》舞台上,这场特别的思想实验,不仅让观众惊叹于AI的辩论能力,更引发广泛好奇:这场颠覆传统的测试究竟如何诞生?从创意萌芽到技术实现,背后藏着怎样的谋划与突破?

一场恰逢其时的AI思想测验

从舞台上灵动的机器人,到生活中贴心的AI助手,人工智能技术正以前所未有的速度重塑着我们的生活图景。在这个技术变革的关键时刻,“AI盛典”应运而生,它源于总台台长慎海雄在编务会上提出的一个创意:总台能不能举办一场Al晚会盛典之类的活动,既交流国内人工智能发展成果,也推进广电业与AI的融合探索。总台视听新媒体中心负责人当场“揭榜”领命。在总台台长的提议下,总台基于自身资源和技术优势,以“大象也要学会跳街舞”的精神风貌,拥抱人工智能,策划举办“AI盛典”。

最初,节目组计划打造一场以“胜负”为导向的“人机辩论”赛,希望通过直观的输赢结果展现AI的能力。与传统认知中机械呆板的形象不同,在多次彩排中,AI辩手展现出令人刮目相看的辩论智慧。它不仅能够精准拆解人类辩手的论点,更能运用类比、归谬等辩论技巧进行反击。辩论过程中,AI 辩手会利用预训练的模型和实时计算能力,在接收到问题的瞬间,迅速在知识库中查找相关信息,并根据已有的语言模型和逻辑推理规则生成回答。整个过程犹如行云流水,响应速度甚至快于人类思考的时间阈值,使得现场观众完全感受不到任何延迟,而这种表现完全超出了节目组的预期。

就在大模型训练调试的关键阶段,慎海雄台长对总台人工智能发展提出明确要求,打造AI创新实践标杆,让“思想+艺术+技术”合力生光,让更多“从0到1”的突破在这里诞生,为盛典注入了全新维度。节目组意识到,当AI的辩论能力已经达到与人类顶尖选手平分秋色的程度时,简单的胜负评判反而显得狭隘。真正的价值在于展现两种智能如何相互启发、优势互补。正是这种认知的跃升,让节目最终超越了竞技对抗的层面,成为一场探讨“相AI相生”时代命题的深度思想实验,为观众呈现了人机协同发展的无限可能。

“说到人工智能,相信大家脑海中都会立刻浮现出图灵测试这个概念。”节目组回忆道。75年前,图灵提出了著名的设想:如果一台机器在自然语言对话中能“骗过”超过30%的人类参与者,那就可以被视作具有智能。于是,在《2025中国·AI盛典》进行一场图灵测试的想法应运而生。

与传统的对话测试不同,节目组最终决定延续“人机辩论”这一形式。这一决策基于双重考量:从技术层面看,辩论是对智能水平一次“更高维度的检验”。传统图灵测试更注重对话的流畅性,而辩论则要求参与者具备深度理解、即时反应、知识整合和策略博弈等全方位能力。在节目组看来,辩论像一场思维的全方位压力测试,能更深刻地揭示AI是否真正理解了议题的本质,而不仅仅是检索或复述信息。从传播效果看,辩论天然具有的对抗性和戏剧张力,正反双方你来我往,更易碰撞出思维的火花,也能让抽象的智能测试变得可视、可感、可评。

当人机辩论“图灵测试”的创意雏形初现,节目组迅速与中国工程院院士、之江实验室主任王坚,清华大学基础科学讲席教授、清华大学心理与认知科学系主任、北京智源人工智能研究院首席科学家刘嘉,复旦大学特聘教授、上海科学智能研究院院长漆远,人工智能学者、工学博士高庆一以及辩手陈铭都进行了深入研讨。

在辩题设计层面,刘嘉提出应选择带有情感、能激发观众情绪反应、涉及伦理和人文色彩且无标准答案的话题。他认为,此类话题能展现AI与人类在理性和感性方面的差异,引发观众讨论,且能体现AI是工具、人类应发挥创造力和情感优势与之合作的观点。经过数轮思想碰撞,团队最终聚焦于两个颇具哲学张力的命题:“按下一个按钮可以删除痛苦的回忆,该不该按”和“AI会不会真的爱上人类”。前者因其直指人类敏感的情感神经,更能展现人机思维的互补性与差异性,最终被选定为测试的核心议题。

在辩手人选层面,刘嘉建议邀请复旦大学国际关系与公共事务学院副教授蒋昌建作为“老一代”辩手代表参与节目,增加节目话题性和情感共鸣。经过慎重考虑,蒋昌建最终婉拒了这次人机辩论的邀请。节目组尊重这位资深辩手的决定,转而邀请正值当打之年的知名辩手陈铭,与AI展开一场跨越物种的思想对话。节目组还创造性地采用了“双陈铭”对决的形式,由真实的人类辩手陈铭与AI辩手“陈铭”同台竞技。为确保测试的严谨性,节目组对两位辩手使用相同的虚拟形象和语音*,让观众在不知情的情况下进行判断。这样的“真假陈铭”设置,还增强了测试的话题性,吸引更多观众网友见证AI的发展。

盛典现场,当人机辩论落下帷幕,蒋昌建向观众袒露了自己婉拒参赛的心路历程。“人和机器的交互是需要勇气的。”他说,“节目组当初也让我跟机器来一场博弈,我婉拒了。”作为一名曾在辩论舞台上取得荣誉的辩手,蒋昌建坦言自己面临着一个时代性的抉择:在反应速度和知识储备都不复当年的情况下,是否要与一个不知疲倦、拥有海量数据的AI对手同台竞技。这个看似简单的选择背后,实则折射出智能时代人类面临的不确定性。蒋昌建补充道:“通过刚才短短的这场较量,我发现人和机器是相互成就的。如果,我能够赢得机器,就能够促进人工智能向前进一步的发展。如果,我输给了机器,没有关系,我可以向我大脑的纵深处进一步来挖掘我还有哪些赋予人类尊严的新的发展可能。”这番感悟,生动诠释了节目“相AI相生”的深层立意。

AI辩手的“备赛”之路

“骗过”42%观众,AI辩手的“首次突破”并非偶然。作为以线性注意力混合架构(文本模型)为骨、实时语音生成(多模态模型)为翼的智能体,MiniMax多模态大模型学习了万亿条人类数据,拥有4560亿参数,单次激活459亿参数生成智能响应。它在多个基准测试中取得出色成绩,具备强大的数学推理、复杂的问题求解,以及长文本处理能力。

尽管拥有出色的“出厂设置”,这位AI辩手也经历了漫长而艰辛的“备赛”之路。首先,AI辩手需要构建广博的知识体系。它的“学习”过程分为两步:之一步是预训练,让大模型掌握海量知识,理解人类语言规律;第二步是对齐,即让模型学会如何与人类进行有效对话,理解人类意图,并以类人的思维方式回应。其次,AI辩手需要经历“千锤百炼”的模拟演练。研发团队先以人类辩手的大量实战数据为蓝本,对模型的每一次回应进行多维度打分:答案是否准确?与议题是否紧密?逻辑链是否严密?在一次次测试、反馈中,让AI少“打马虎眼”、少“跑题”,说话越来越靠谱。

现场的测试也完全反映出AI辩手的真实水平。在与人类辩手陈铭的交锋中,它既能充分发挥其在逻辑分析和知识整合方面的技术特长,又能敏锐捕捉并恰当回应人类情感和价值判断的微妙之处。当AI辩手说出“(按钮)赋予人们在绝望中重新选择的力量,不是为了逃避,而是为了重生”这样富有哲思的语句时,它展现的不仅是对人类痛苦的关怀,更是一种超越代码的情感共鸣。

从图灵测试预见AI新时代

在图灵提出经典设想的75年后,进行一场人机辩论“图灵测试”有何意义?

在王坚看来,这场“图灵测试”的意义,早已超越了简单的“辨别人机”。他表示:“当年的图灵测试为人工智能定了一个极具挑战的目标,70多年后我们做到了,就像大家今天看到的一样。但这也同时让我们看到通过了图灵测试只是人工智能的下一个新的开始,远不是终结,而这是图灵本人也没有预想到的,下面70年会是人工智能更令人激动的时代!”

“测试中AI展现出的辩证思维能力和即时反应速度,证明我国在自然语言处理和认知智能领域已经达到国际领先水平。”漆远补充道,“这场测试既验证了技术突破,又引发了公众对智能本质的思考。这正是科研与科普的完美结合,为人工智能的健康发展提供了示范。”

作为测试的一线观察者,蒋昌建提出,这场盛典“图灵测试”设置的精妙之处,还在于让观众自己去感受:机器何以机智“过人”,人类何以“性情”中人。这种对比,恰恰凸显了目前人类不可替代的价值——生动的情感、灵动的逻辑,和主动助产新知的追问。

MiniMax技术团队也表示,大模型的“首次突破”验证了自研技术的有效性和先进性。未来,团队希望推动技术在更广泛的生产力场景中发挥作用。例如,在教育领域,AI大模型可以作为智能辅导的数字教师,帮助学生提高思辨能力和语言表达能力;在司法领域,AI可以为法律专业人士提供辩论模拟,帮助他们更好地准备庭审,预测对方观点,完善自己的法律论证,提高法律辩论的质量和效率等。

可以预见的是,随着大模型技术发展,AI通过图灵测试将成为常态。这不禁引发我们思考:在人工智能已迈入新纪元的今天,诞生于20世纪中叶的图灵测试是否仍能胜任智能评估的使命?

“就像牛顿力学无法解释微观世界的量子现象一样,旧框架已不足以衡量新智能的维度。”刘嘉认为,如果未来AI能稳定通过图灵测试,那么“智能”的定义需要新的内涵,例如创造力和自我意识。首先,AI的创造力不应仅停留在已有框架里生成内容,而需具备从0到1的颠覆式非共识的创造能力。这就像莫奈能跳出传统绘画的束缚而开创印象画派;爱因斯坦独辟蹊径,提出牛顿力学框架之外的广义相对论。其次,自我意识是AI从新工具到新物种的关键。自我意识的定义是什么,自我意识涌现的充分和必要条件是什么?这一切,都还待心理学、脑科学和人工智能的研究者来探索和定义。所以,AI通过图灵测试并非标志人类对智能的探索的结束;相反,这一切只是开始。

《2025中国·AI盛典》也是总台持续深化“5G+4K/8K+AI”发展战略,积极推动新质生产力转化为媒体传播力的又一重要实践和创新探索。本届盛典还有多个创新节目共同勾勒出“相AI相生”的美好图景:《迎客鼓》展现传统艺术与智能科技的完美融合,《Passion·人机共振》《茉莉花》演绎人机协同的艺术创造力,《浮光·十二兽首归来》《兵马俑世界奇遇记》则实现了跨越时空的文明对话。这些精彩内容既彰显了科技的温度,又传递了思想的深度,更展现了总台以开放姿态拥抱前沿技术,为加快发展新质生产力营造良好氛围的坚定决心。

未来已来,从《2025中国·AI盛典》出发,总台还将继续探索人机协作的无限可能,让科技更有温度,让传播更具智慧,持续书写“相AI相生”的时代新篇。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 8月18日美股成交额前20:Meta旗下AI业务半年四次重组
  • 周一热门中概股涨跌不一 台积电涨1.04%,拼多多跌0.51%
  • 原油:WTI上涨 特朗普与泽连斯基的会晤打压停火预期
  • 美国债市:国债小幅下跌 受到英债下跌拖累
  • 马斯克旗下星链遭遇网络中断
  • 收盘:美股周一基本持平 市场关注美联储年会与零售商业绩
  • 巴勒斯坦成立临时宪法起草委员会,为大选做准备
  • 向绿而兴协同推进降碳减污扩绿增长(高质量发展故事汇·第10期)
  • 纽约汇市:美元小幅走高 市场聚焦杰克逊霍尔年会
  • 擦亮新型工业化绿色底色
  • 油价在特朗普-泽连斯基会晤后上涨
  • 特朗普寻求在乌克兰问题会谈中解决“几乎所有问题”
  • 着眼拉上普京开三方峰会 特朗普客客气气在白宫迎来泽连斯基
  • 花旗:标普500指数正沿“双轨并行”路径上行
  • 特朗普:俄罗斯接受乌克兰安全保证是“重要的一步”
  • KeyBanc将多邻国评级上调至超配
  • 哈马斯发表官方声明确认同意加沙停火最新提案
  • Evercore ISI将塔吉特纳入其战术性跑赢大盘名单
  • Meta Platforms将对AI业务进行第四次重组
  • 特朗普与欧洲领导人的多边会谈提前开始
  • 特朗普与欧洲领导人举行多边会晤
  • 尾盘:美股基本持平 市场关注美联储年会与零售商业绩
  • 得州总检察长指控Meta与Character.AI以心理健康宣传误导儿童
  • 特朗普放话将颁令废除邮寄选票 以维护中期选举“诚信”
  • 特朗普:将在与泽连斯基会晤后致电普京
  • 特朗普:乌克兰和俄罗斯可以在继续交战的同时达成和平协议
  • 泽连斯基对北约新倡议下美国武器采购表示“感谢”
  • 哈马斯确认已同意加沙地带停火最新提议
  • 泽连斯基:乌克兰准备通过“外交途径”结束冲突
  • 特朗普:若今天一切顺利 将举行三方会谈
  • 泽连斯基身着正装夹克现身白宫,未穿全套西装打领带
  • 泽连斯基时隔半年再入白宫会晤特朗普
  • 乌克兰称其周一对俄罗斯石油管道系统发动了新一轮袭击
  • 欧洲债市:英国30年期通胀挂钩国债收益率升至1998年来最高
  • 乌克兰称美国投资基金代表团将于9月访乌
  • 特朗普政府据称讨论收购英特尔 10% 的股份
  • 欧洲股市盘整待势 利好消息推动诺和诺德股价飙升
  • 王毅同印度外长苏杰生会谈
  • 立讯精密向港交所提交上市申请书
  • 碧桂园:占第2类债务本金总额逾77%的持有人已加入重组支持协议
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码