(三藩市1日讯)中国新创公司DeepSeek(深度求索)的人工智能(AI)模型成本约560万美元(约2496万令吉),引发业界热议并且造成股市震荡。
台湾中央社报导,研究机构SemiAnalysis周五发布报告指出,该公司至今在硬体绘图处理器(GPU)上的支出,远超过5亿美元(约22亿2900万美元)。
SemiAnalysis指出,中国对冲基金幻方量化(High-Flyer)在2023年5月成立DeepSeek,以推动人工智能技术研发,在此之前,幻方量化于2021年,也就是任何出口管制生效前,投资购买了1万颗英伟达(Nvidia)A100绘图处理器。
报告指出,该公司在绘图处理器的投资上花费超过5亿美元。
报告称,英伟达根据法规要求,生产了多款H100的降级版,如H800、H20。目前仅有H20可销售给中国。
英伟达在过去9个月已生产超过100万颗专供中国市场的H20绘图处理器。
报告分析显示,DeepSeek的伺服器总资本支出约为16亿美元(约71亿3200万令吉)。
报告提到,DeepSeek从中国本土招募人才,目前约有150名员工,正急速扩张。
关于DeepSeek的价格和效能,这一周因出现模型训练成本约560万美元的说法,引起讨论。报告强调预训练成本仅是总成本一小部分,不代表完整支出。
DeepSeek论文中提到的560万美元成本指的是预训练运行(pre-training run)时的绘图处理器成本,是模型总成本的一部分,未计入的重要支出还包括研发、硬体总拥有成本等关键因素。
报告也提到,DeepSeek能获得大量算力资源,与出口管制存在时间滞后有关。
美国智库兰德公司(RAND)研究员海姆近期分析,硬体的出口管制存在时间滞后,目前尚未完全发挥影响力。真正的考验将出现在数据中心需要升级或扩展时,这对美国企业较为容易,但对受到出口管制的中国企业而言将是挑战。
要看最快最熱資訊,請來Follow我們 《東方日報》WhatsApp Channel.
