六年来首次!OpenAI新模型开放权重,Altman称为“全球更佳开放模型”

音符科技网

  来源:华尔街见闻

  OpenAI向开源模型迈出重要一步:六年来首次推出开放权重模型。

  美东时间8月5日周二,OpenAI发布了两款免费试用的开放权重语言模型gpt-oss-120b和gpt-oss-20b。这是OpenAI自2019年推出GPT-2以来首次发布开放权重模型,也是OpenAI与微软签署独家云服务协议六年来问世的首批此类模型。

  两款新模型可以根据用户提示生成文本内容,允许开发者定制,但OpenAI并没有提供用于训练模型的数据。评论认为,OpenAI的新模型直接回应了Meta、微软支持的Mistral AI以及中国初创新星DeepSeek等竞争对手在开放权重模型领域的挑战。

  OpenAI的CEO Sam Altman在社交媒体表示:

“gpt-oss是一个重大突破,这是更先进的开放权重推理模型,具有与o4-mini相当的强大现实世界性能,可以在你自己的电脑(或手机的较小版本)上本地运行。我们相信这是世界上更好、最实用的开放模型。”

  gpt-oss-120b和gpt-oss-20b被设计为低成本的GPT模型选项,开发者、研究人员和企业可以轻松运行和定制。gpt-oss-20b可在16GB内存的笔记本电脑上运行,gpt-oss-120b需要约80GB内存,两款模型均支持高级推理、工具使用和思维链处理。

  Altman称,这两款模型可在个人电脑(PC)甚至手机上本地运行,无需互联网连接,为用户提供完全的控制权和隐私保护。

  同时,亚马逊宣布将首次向客户提供OpenAI的模型,计划在其Bedrock和SageMaker平台上提供OpenAI的开放AI权重新模型。这是云计算巨头亚马逊首次提供OpenAI的产品。

  gpt-oss-20b和120b的发布标志着OpenAI战略转向的重要节点,此前该公司多次推迟开放权重模型发布,并进行了广泛的安全测试和评估,以确保模型不被恶意利用。

  所谓的开放权重是介于开源和闭源的一种中间形态,意味着企业和 *** 机构可以自主运行该模型,因为他们可以查看模型的权重并进行修改。而开源的情况下,用户可以查看模型的源代码组成,有时包括训练和权重分配方式。

  此前评论认为,OpenAI推出开放权重模型可能削弱微软在AI业务中的独家优势。本周二OpenAI称,微软会将gpt-oss-20b 模型的 GPU 优化版本引入 Windows 设备。这些模型由ONNX Runtime支持,支持本地推理,可通过Foundry Local 和 AI Toolkit for VS Code 获取,从而让Windows 开发者更轻松地使用开放模型进行构建。

  gpt-oss-120b部分测试性能甚至超过o4-mini 20b部分测试超过o3‑mini

  OpenAI介绍,两款gpt-oss模型采用了其更先进的预训练和后训练技术,特别注重推理、效率和跨部署环境的实用性。它们都是使用专家混合(MoE)架构的Transformer,以减少处理输入所需的活跃参数数量。

  gpt-oss-120b每个token激活5.1亿参数,总参数量为1170亿;gpt-oss-20b激活3.6B参数,总参数量为210亿。模型使用交替的密集和局部带状稀疏注意力模式,支持高达128k的上下文长度。

  OpenAI称gpt-oss-20b是一款中型开放模型,gpt-oss-120b则是可在“大多数台式机和笔记本电脑”上运行的大型开放模型。

  OpenAI 表示,较小的模型至少需要 16GB 显存或统一内存才能发挥更佳性能,并且“非常适合高端消费级GPU和搭载苹果芯片的Mac电脑”。较大的全尺寸模型则需要至少 60GB 显存或统一内存。

  在性能评估方面,OpenAI披露,gpt-oss-120b在核心推理基准测试中接近OpenAI o4-mini的表现。较小的gpt-oss-20b模型在相同评估中达到或超过OpenAI o3-mini的性能。

  gpt-oss-120b在竞赛编码(Codeforces)、通用问题求解(MMLU 和 HLE)以及工具调用(TauBench)方面均优于 OpenAI o3‑mini,并匹敌甚至超越了 OpenAI o4-mini。它在健康相关查询(HealthBench⁠)和竞赛数学(AIME 2024 和 2025)方面的表现甚至超过o4-mini。

  即使规模较小,gpt-oss-20b在上述同类的评估中也匹敌甚至超越了OpenAI o3‑mini,甚至在竞赛数学和健康方面也超越了后者。

  安全防护与恶意使用预防

  OpenAI对开放权重模型的安全性给予了特别关注,因为一旦发布,对手可能对模型进行恶意微调。该公司在预训练期间过滤了与化学、生物、放射性和核(CBRN)相关的有害数据。

  为直接评估风险,OpenAI对模型进行了专门的生物学和 *** 安全数据微调,创建了攻击者可能 *** 的特定领域非拒绝版本。经过内部和外部测试,这些恶意微调的模型无法达到其准备框架中的“高能力”阈值。

  OpenAI还与三个独立专家组合作,对其恶意微调评估提供反馈。Altman强调:“我们努力减轻最严重的安全问题,特别是在生物安全方面。gpt-oss模型在内部安全基准测试中的表现与我们的前沿模型相当。”

  生态系统部署与市场影响

  两个模型在Apache 2.0许可下免费提供,用户可以通过Hugging Face和GitHub等平台下载。云服务提供商亚马逊、Baseten和微软也将提供这些模型。

  OpenAI与包括Azure、vLLM、Ollama、AWS、Fireworks等领先部署平台合作,使开发者能够广泛使用这些模型。微软还将GPU优化版本的gpt-oss-20b模型引入Windows设备。

  该公司正在举办红队挑战赛,奖金池为50万美元,鼓励全球研究人员、开发者和爱好者帮助识别新的安全问题。Altman表示:“我们相信这将带来更多好处而非坏处,我们期待这一发布能够实现新型研究并创造新型产品。”

  竞争压力推动战略转变

  OpenAI此次发布开放权重模型很大程度上受到市场竞争压力驱动,特别是来自中国DeepSeek的挑战。自2019年以来,该公司一直专注于通过API提供专有模型服务,而竞争对手纷纷推出开放权重替代方案。

  OpenAI总裁Greg Brockman在本周二的记者会上表示:“看到生态系统的发展令人兴奋,我们很高兴能为此做出贡献,真正推动前沿发展,然后看看会发生什么。”

  OpenAI与英伟达、AMD、Cerebras和Groq等芯片制造商合作,确保模型在各种芯片上良好运行。英伟达CEO黄仁勋在声明中称:“OpenAI向世界展示了在英伟达AI上可以构建什么——现在他们正在推进开源软件的创新。”

  风险提示及免责条款

  市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 半导体材料板块短线拉升,上海合晶涨超15%
  • 8月12日隔夜特朗普都做了啥?新浪财经APP一网打尽!
  • “抓我当天就得放”,对未成年人犯罪,如何做到“宽容不纵容”?
  • 时隔十年,沪深两市融资余额再次突破2万亿元
  • 张忆东:专心找机会,震荡是长牛的蓄电池——港股行情展望及投资建议
  • 美国国债市场深度调整的原因、潜在风险及我国应对措施
  • 租房“脚踏两条船”?退款协议成空谈,女子贷款20万开店梦碎
  • 白银遭遇"黑色星期一":关税政策摇摆+美元走强双重压制,技术面关注38美元争夺战
  • 寒武纪登顶A股吸金榜!新易盛再创新高,A股成长型宽基“小霸王”——双创龙头ETF(588330)盘中涨超1.4%
  • 上半年全国新设经营主体超1300万户,民企、外企增长趋势延续
  • OpenAI CEO呛声马斯克:希望对马斯克操纵X展开反调查
  • 陈建斌担任影片解说,《山河为证》8月15日全国上映
  • 纯碱连续主力合约涨6%
  • AI红利兑现,工业富联陷入薄利困境
  • 阜博集团老板兜售版权,6天飙涨50亿
  • 马斯克指控苹果应用商店涉垄断 威胁立即采取法律行动
  • 云南铁路暑运以来发送旅客超1800万人次,同比增长14.3%
  • 液冷服务器板块短线拉升,大元泵业涨停
  • 特朗普:与普京会面开始两分钟我就能知道结果因为我是做交易的
  • 汇源纠纷背后:遭董事长起诉,创始人朱新礼或“闪现”丨消费一线
  • 抓住存储市场变化窗口,佰维存储AI时代率先破局
  • 韩国总统李在明与特朗普将于8月25日举行峰会讨论安全和经济问题
  • 燃气板块持续拉升,新疆火炬涨停
  • 赣锋锂业在深圳成立能源科技新公司,注册资本1.5亿元
  • 七部门重磅发布!脑机接口概念走强,三博脑科飙升逾8%!A股最大医疗ETF(512170)溢价涨逾1%!
  • 印尼哥伦打洛省附近海域发生5.3级地震
  • 特朗普打消市场疑虑:不会对黄金征收关税!
  • CEO和CFO年薪合计超过2000万元!均胜电子准备香港IPO!
  • 中国有色金属工业协会锂业分会倡议:抵制“内卷式”恶性竞争共同营造公平公正、平稳有序的市场环境
  • 内蒙古婚内强奸案开庭男方律师:婚内不存在强奸
  • 习近平同巴西总统卢拉通电话
  • 中国有色金属工业协会锂业分会倡议:抵制“内卷式”恶性竞争,共同营造公平公正、平稳有序的市场环境
  • 华晨中国早盘涨近9% 预计上半年溢利同比增加13%至16%
  • 宝武镁业重大人事变动:董事长、总经理辞职,孔祥宏接任董事,曾任宝钢、武昆要职
  • 日经225指数午间收盘涨2.46%
  • 力劲科技盘中涨近5% 公司与多家合作伙伴启动镁合金人形机器人联合研发项目
  • 特朗普:与普京会面开始两分钟我就能知道结果,因为我是做交易的
  • AI服务器概念股早盘走高 鸿腾精密涨近9%比亚迪电子涨近6%
  • 马斯克指责苹果在iPhone应用商店偏袒OpenAI
  • 马斯克再因人工智能扬言开启司法论战这次盯上了苹果
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码