Deepseek|Deepseek登中美下載榜榜首 為何引發全球AI行業震盪?

 

  • 國產大模型DeepSeek R1發佈
  • 性能媲美OpenAI,成本低
  • 採用開放源代碼,具價格優勢

國產大模型公司深度求索開發的AI應用程式DeepSeek,上周一(20日)正式發佈大模型DeepSeek R1後,因其在數學、編程和推理等關鍵領域與OpenAI的最強模型性能相若,並同時於中國和美國地區的蘋果應用商店App Store免費APP下載排行榜中成為榜首,超越OpenAI的ChatGPT,引發市場對全球AI行業有極大迴響,多隻芯片行業龍頭甚至因此在美股盤前急挫。

芯片限制反令訓練成本大幅下降

由於美國對出口芯片到中國有限制,因此市場消息指,DeepSeek使用的英偉達(美:NVDA,Nvidia) H800芯片,在訓練大模型過程中僅耗費不到600萬美元,遠低於其他頂級模型的訓練成本。外媒指,H800的算力要弱於英偉達H100等芯片。

伯恩斯坦(Bernstein)科技分析師指,DeepSeek 的AI 模型價格比OpenAI 有很大的產品價格差距。當中DeepSeek Reasoner R1 模型處理每百萬個輸入字元(tokens)的成本為0.55美元,而OpenAI同類型模型則需15美元。大幅度的價格差異令美國科技高層質疑針對上述出口限制是否仍具有效性。

而且,更重要的是,DeepSeek採用開放源代碼的模式,任何開發者都可免費獲取其技術,進一步壓縮了整個市場的定價空間。相比之下,OpenAI 採用封閉策略,並對其專有模型收取高額費用,失去市場優勢。才會令相關應用程式推出短短數日,已經同時於中國和美國地區的蘋果應用商店App Store免費APP下載排行榜中成為榜首。

微軟CEO指有必要看待中國AI發展

與其他一些頂尖大模型不同,DeepSeek-R1沒有使用傳統的監督微調(Supervised Fine-Tuning,SFT)方法,而是專注於強化學習(Reinforcement learning,RL)加上專業數據優化的創新型AI訓練模式,意味該模型跳過了使用人工標準數據訓練的「模仿」環節。

微軟首席執行官Satya Nadella直言看到DeepSeek的新模型後,認為能夠成功地打造出一個能進行推論運算的開放原始碼模型,令人印象極為深刻。而且運算效率非常高。直言必須非常認真地看待中國在人工智能範疇的發展。

#DeepSeek #ai

原文出處:https://inews.hket.com/article/3893913/Deepseek|Deepseek登中美下載榜榜首%E3%80%80為何引發全球AI行業震盪??mtc=20064

Comments

Popular posts from this blog

大摩看好美團可抓緊2萬億人幣零售市場機會 予明年SOTP目標價300元

中山市科技金融創新促進會《做好科技金融大文章賦能發展新質生產力》主題論壇暨2024 年年會

順豐6936一手中籤率20%、抽20手穩獲1手 暗盤高開後回軟