(纽约7日讯)DeepSeek强敌来了!被誉为“AI教母”的知名华裔美籍科学家李飞飞领导的团队,以低于50美元(约222令吉)的云端运算成本,成功训练出名为“s1”的人工智慧推理模型。此模型在数学和编码能力测验中的表现,据称媲美 OpenAI o1和DeepSeek R1等尖端推理模型。

《科创板日报》、《新浪科技》报导,李飞飞团队的s1模型并非从头训练,而是建立在阿里巴巴的Qwen2.5 和 Google DeepMind的Gemini 2.0 Flash Thinking的基础之上。

他们搜集了1000个精心挑选的问题及其解答,并透过记录 Gemini 2.0 Flash的思考过程,建立训练资料集,利用这些资料,微调了Qwen2.5-32B-Instruct模型,创造出s1。

中国某知名大模型公司CEO表示,李飞飞团队的成就实际上是利用从Google模型中撷取的 1000个样本来微调通义千问模型。这种微调的成本固然低廉,但其优异表现仍有赖于既有模型的基础。

仅花26分钟训练出新模型

上海交通大学人工智能学院副教授谢伟迪指出,s1以通义千问模型为基础,因此即使使用有限的样本资料,也能产生新的推理模型。然而,如果更换其他基础模型,新模型的效能并不会提升。因此,真正在背后发挥效能的关键是Qwen模型,而非s1。

阿里云证实,李飞飞团队透过利用阿里开源的Qwen2.5-32B-Instruct模型进行监督微调,在16个英伟达H100 GPU上仅花费26分钟就训练出s1-32B模型,其数学和编码能力与OpenAI o1和DeepSeek R1 等尖端推理模型不相上下。

要看最快最熱資訊,請來Follow我們 《東方日報》WhatsApp Channel.

热门新闻

阅读全文

“没钱论”被批无知傲慢 美名嘴回呛安华:你们几乎快吃不上饭了

阅读全文

30岁华女靠AI发迹拥52亿 力压泰莱史成全球最年轻白手兴家亿万富豪

阅读全文

林德宜:特朗普的“让美国再次伟大”正在崩塌

阅读全文

日网疯传东京426发生地震 预言家:毁灭级大灾难

阅读全文

旅泰游客可在前3天内申报入境【东方头条】2025-4-25

阅读全文

泰警飞机演习坠海

阅读全文

关税炸弹恐重创韩企! 5电子产品价格喊涨 

财经

(香港7日讯)美国总统特朗普上任后开打关税战,针对中国进口商品的10%关税已生效,墨西哥、加拿大进口产品征收25%的关税...

阅读全文

苹果供应链或洗牌?大马科技股龙头应声上涨

财经

(吉隆坡7日讯)综指今日开低走高,最终以1590.91点结束本周交易,全天涨幅为5.74点或0.36%。按周比较,综指在...

阅读全文

资本开销提高一倍!Perodua今年要做好三件事

财经

(吉隆坡7日讯)第二国产车(Perodua)今年将拨出16亿令吉作为资本支出,以提升产能、推动新车款开发、并升级现有工厂...

阅读全文

70%电脑相关工作恐被AI取代 这3类冲击最大

财经

(伦敦7日讯)英国一项新研究表明,人工智能(AI)可能改变或取代高达70%的电脑相关工作,这将促使政府须加强对这项快速发...

阅读全文

1月杪外汇储备增至1164亿美元

财经

(吉隆坡7日讯)国家银行公布,截至2025年1月31日,大马外汇储备金达到1164亿美元(约5161亿令吉),较1月15...

阅读全文

中国资产继续狂欢 213亿资金“借道”ETF涌入A股!

财经

  (上海7日讯)中国资产周五(7日)继续狂欢,A股港股延续近日升势,主要股指全线上升!近期中国科技方向不断迎来利好催化...

阅读全文

力拒存款遭盗提 Ambank新储蓄户头添保障

财经

(吉隆坡7日讯)大马银行(AMBANK,1015,主板金融股)宣布,推出AmVault储蓄户头,打击网络诈骗。大马银行通...

阅读全文

各行各业都扩张 12月IPI增长4.6%

财经

(吉隆坡7日讯)统计局公布,去年12月工业生产指数(IPI)按年增长4.6%,由各行各业扩张所推动。统计局首席统计员拿督...

阅读全文

鸿海并日产? 须跨过两障碍

财经

(东京7日讯)日产汽车(Nissan)与本田(Honda)合并协商恐破局,鸿海被外媒点名有意出手收购日产,双方建立新的合...

阅读全文

经济不振及关税威胁 英国央行降息1码

财经

(伦敦7日讯)英国经济欲振乏力,英国央行(BOE)6日一如预期恢复货币宽松宣布降息1码,有官员甚至提议扩大降幅,英央同时...