究竟DeepSeek是何方神聖？

DeepSeek 的研究人員在上個月的一篇論文中寫道，DeepSeek-V3 是使用輝達（Nvidia）的 H800 晶片進行訓練，而所花的費用不到 600 萬美元（約950 萬澳元）。 Source: SIPA USA / Omar Marques / SOPA Images/Omar Marques / SOPA Images/Sipa USA

SBS廣東話節目

View Podcast Series

下載 SBS Audio 應用程式

其他收聽方法

近日成為科技界熱話的中國初創企業DeepSeek的人工智能模型，日前成為黑客攻擊的目標。

而該公司聲稱，其使用的科技與 OpenAI及 Meta 等科技巨頭的最先進模型不相上下，而該公司指出，他們的人工智能助理軟件，亦成為美國蘋果公司的手機應用程式商店中評分最高的一個免費應用程式，甚至超越現時許多人所採用的ChatGPT。

不過，該公司在星期一（1月27日）表示，其網站由於受到大規模的惡意網絡攻擊而中斷，並且要一度暫時限制新用戶註冊。不過，昨天（1月28日），該公司表示，已經解決其應用程式介面及用戶無法登入網站的問題。而今次網站中斷，亦是該公司在過去90日以來最長的一次發生網絡中斷的情況，同時，亦正正是在該應用程式人氣飆升的期間。

DeepSeek在上星期推出了一款免費的聊天助理軟件，據講，其使用的數據比其他競爭對手為少，而成本比其他公司亦更為便宜，因此亦令外界相信可能對人工智能所需要的投資水平比以往為低，而這個情況，亦一度令美國多間科技公司的股價暴跌。

DeepSeek早於2023年11月經已推出其首個人工智能助理軟件版本，到今年（2025）1月10日，更加推出了所謂「DeepSeek-V3 」模型，負責開發該軟件模型的人士指出，該軟件「在自由/開源軟件中名列前茅，亦可與全球最先進的封閉來源軟件相媲美」。所謂自由或開源體軟件 (FOSS) 與閉源模式的軟的分別是使用閉源模式件的原始碼是不會向公眾公開。

究竟 DeepSeek是何方神聖？

DeepSeek 是一間位於中國杭州的初創公司，根據中國商企登記記錄，其主要控股股東是對沖基金幻方量化（High-Flyer）的聯合創辦人梁文鋒。

2023年3月，梁氏基金在其官方微信公眾號上宣布會「重新出發」，集中資源打造一個「全新獨立研究團隊」，探索人工智能（Artificial General Intelligence）的本質，而在同年稍後，該公司亦創立了DeepSeek。

究竟幻方量化對 DeepSeek 投資了多少目前仍然是未知之數，但根據中國商企登記記錄，幻方量化與 DeepSeek的辦公室均是位於同一棟大廈，同時，幻方量化亦擁有用於訓練人工智能模型的晶片集群相關的專利。

根據幻方量化的人工智能部門於 2022 年 7 月在其官方微信上表示，該公司擁有並營運 10,000 個 A100晶片的集群。

不過，亦有人質疑 DeepSeek 的成功故事。

為機器學習模型提供訓練資料的公司Scale AI 的行政總裁Alexandr Wang早前接受CNBC 採訪時表示，估計DeepSeek 擁有50,000 個市場上性能最強的輝達H100 晶片，而他聲稱這些晶片數量是不會被披露，因為這是違反美國對中國在晶片上的出口管制措施。而DeepSeek對有關言論亦未作出回應。

日前，伯恩斯坦研究公司 (Bernstein Research) 的分析師在一份研究報告中強調，DeepSeek 的 V3 模型的總訓練成本目前仍未清楚，但應該是遠高於該公司所聲稱的成本。而分析師亦表示，同樣廣受好評的R1模型軟件的訓練成本亦尚未揭露。不過，美國總統特朗普則表示，DeepSeek的出現導致美國的科技股暴跌，是對美國的公司敲起了一個警號。相信未來在人工智能軟件的開發上，都有一番龍爭虎鬥。詳情請收聽鄺美玲和梁焱剛的報道。

瀏覽更多最新時事資訊，請登上

、

、

或訂閱

。

SBS 中文堅守

《SBS 行為守則》及《SBS 編採指引》

，以繁體中文及簡體中文提供公平、公正、準確的新聞報道及時事資訊。SBS 廣東話及 SBS 普通話電台節目均已為大眾服務超過 40 年。歡迎在每天早上 9 至 11 時透過