
你敢相信吗?被誉为AI教母的华裔科学家李飞飞团队仅仅花费50美元成功训练出了一个与OpenAI的o1和DeepSeek的R1模型的表现不相上下名为s1的AI推理模型。
该模型是以谷歌推理模型为基础模型,通过蒸馏法提炼出来的。
李飞飞团队构建了一个小型数据集s1K,通过难度、多样性和质量三个标准来筛选,其中包括1000个经过精心挑选的问题以及相应答案,并附上了“推理”过程,仅使用了16台英伟达H100 GPU,耗时26分钟就完成了训练。
这种方法与传统的大规模强化学习方法形成鲜明对比,后者的成本通常较高,DeepSeek、OpenAI都采用了这种方法。而s1的研究通过较小的数据集和监督微调蒸馏推理模型,大大降低了训练成本并提高了效率。
毫无疑问,S1模型的出现大大降低了人工智能技术的门槛,使得更多的企业和开发者能够利用AI技术进行创新。这一变革推动了AI技术的普及,加速了各个行业的数字化转型进程。同时,S1模型的出现也加剧了市场竞争,促使企业不断提升自身的技术实力和服务水平,以在激烈的市场竞争中脱颖而出。
但同时也应该看到S1对新AI模型性能的提升效果并不显著。
标签
人工智能原创S1OpenAI大模型李飞飞DeepSeek