(纽约7日讯)DeepSeek强敌来了!被誉为“AI教母”的知名华裔美籍科学家李飞飞领导的团队,以低于50美元(约222令吉)的云端运算成本,成功训练出名为“s1”的人工智慧推理模型。此模型在数学和编码能力测验中的表现,据称媲美 OpenAI o1和DeepSeek R1等尖端推理模型。

《科创板日报》、《新浪科技》报导,李飞飞团队的s1模型并非从头训练,而是建立在阿里巴巴的Qwen2.5 和 Google DeepMind的Gemini 2.0 Flash Thinking的基础之上。

他们搜集了1000个精心挑选的问题及其解答,并透过记录 Gemini 2.0 Flash的思考过程,建立训练资料集,利用这些资料,微调了Qwen2.5-32B-Instruct模型,创造出s1。

中国某知名大模型公司CEO表示,李飞飞团队的成就实际上是利用从Google模型中撷取的 1000个样本来微调通义千问模型。这种微调的成本固然低廉,但其优异表现仍有赖于既有模型的基础。

仅花26分钟训练出新模型

上海交通大学人工智能学院副教授谢伟迪指出,s1以通义千问模型为基础,因此即使使用有限的样本资料,也能产生新的推理模型。然而,如果更换其他基础模型,新模型的效能并不会提升。因此,真正在背后发挥效能的关键是Qwen模型,而非s1。

阿里云证实,李飞飞团队透过利用阿里开源的Qwen2.5-32B-Instruct模型进行监督微调,在16个英伟达H100 GPU上仅花费26分钟就训练出s1-32B模型,其数学和编码能力与OpenAI o1和DeepSeek R1 等尖端推理模型不相上下。

要看最快最熱資訊,請來Follow我們 《東方日報》WhatsApp Channel.

热门新闻

阅读全文

10年前最后一次花钱 女子辞职过“0元生活”

阅读全文
民众在事发后为老妇(小图)施救,惟当时已死亡,而紫衣男子为肇事者。

老妇过路遭撞亡 家属泪控肇事少年没道歉无悔意

阅读全文

【天然气输管起火】 退休公仆惨遭火劫 9房屋被烧毁损失150万令吉

阅读全文

关税伤到自家人!第四大车厂开第一枪 美国900员工一夕失业

阅读全文

旧古仔路树倒压车

阅读全文

灾黎何去何从 要尽快解决

阅读全文

关税炸弹恐重创韩企! 5电子产品价格喊涨 

财经

(香港7日讯)美国总统特朗普上任后开打关税战,针对中国进口商品的10%关税已生效,墨西哥、加拿大进口产品征收25%的关税...

阅读全文

苹果供应链或洗牌?大马科技股龙头应声上涨

财经

(吉隆坡7日讯)综指今日开低走高,最终以1590.91点结束本周交易,全天涨幅为5.74点或0.36%。按周比较,综指在...

阅读全文

资本开销提高一倍!Perodua今年要做好三件事

财经

(吉隆坡7日讯)第二国产车(Perodua)今年将拨出16亿令吉作为资本支出,以提升产能、推动新车款开发、并升级现有工厂...

阅读全文

70%电脑相关工作恐被AI取代 这3类冲击最大

财经

(伦敦7日讯)英国一项新研究表明,人工智能(AI)可能改变或取代高达70%的电脑相关工作,这将促使政府须加强对这项快速发...

阅读全文

1月杪外汇储备增至1164亿美元

财经

(吉隆坡7日讯)国家银行公布,截至2025年1月31日,大马外汇储备金达到1164亿美元(约5161亿令吉),较1月15...

阅读全文

中国资产继续狂欢 213亿资金“借道”ETF涌入A股!

财经

  (上海7日讯)中国资产周五(7日)继续狂欢,A股港股延续近日升势,主要股指全线上升!近期中国科技方向不断迎来利好催化...

阅读全文

力拒存款遭盗提 Ambank新储蓄户头添保障

财经

(吉隆坡7日讯)大马银行(AMBANK,1015,主板金融股)宣布,推出AmVault储蓄户头,打击网络诈骗。大马银行通...

阅读全文

各行各业都扩张 12月IPI增长4.6%

财经

(吉隆坡7日讯)统计局公布,去年12月工业生产指数(IPI)按年增长4.6%,由各行各业扩张所推动。统计局首席统计员拿督...

阅读全文

鸿海并日产? 须跨过两障碍

财经

(东京7日讯)日产汽车(Nissan)与本田(Honda)合并协商恐破局,鸿海被外媒点名有意出手收购日产,双方建立新的合...

阅读全文

经济不振及关税威胁 英国央行降息1码

财经

(伦敦7日讯)英国经济欲振乏力,英国央行(BOE)6日一如预期恢复货币宽松宣布降息1码,有官员甚至提议扩大降幅,英央同时...