没能等到GPT-5,但OpenAI在深夜却很突然地open了一下——
开源两个推理模型:gpt-oss-120b和gpt-oss-20b。
要知道,上一次OpenAI开源模型还是6年前,也就是2019年的GPT-2。
而这次的名字也是非常的直接,gpt-oss,即Open Source Series,意思就是“开源系列”。
它们的亮点如下:
gpt-oss-120b:1170亿参数(MoE架构,激活参数约51亿),可在单张80GB GPU上运行,性能接近闭源的o4-mini。
gpt-oss-20b:210亿参数(Moe架构,激活参数约36亿),可在16GB内存的消费级设备上运行,性能接近o3-mini。
并且它俩均采用Apache 2.0许可证,允许商用无需付费或授权。
从性能角度来看,gpt-oss已经达到了开源模型里推理性能的第一梯队,但在代码生成和复杂推理任务中仍略逊于闭源模型(如GPT-o3和o4-mini)。
在模型发布的第一时间,Sam Altman在自己的社交平台上也道出了这俩模型的“价值”:
可以在本地笔记本(20b的可以在手机上)运行;耗资数十亿美元的研究成果。