印度的資訊技術部長於週四高度評價中國 AI 實驗室「DeepSeek」的進展,並表示該國將把其大型語言模型部署在本地伺服器上,這是印中科技交流的一個罕見突破。
「你們已經見識到 DeepSeek 的成就—550 萬美元的投資以及非常非常強大的模型,」印度資訊技術部長 Ashwini Vaishnaw 在上週四針對新德里在人工智慧投資上的批評時如此表示。相比之下,其他多數國家的投資遠超印度。
自 2020 年以來,印度已因國家安全隱憂而禁止了超過 300 個與中國相關的應用程式和服務,包括 TikTok 與微信。批准將 DeepSeek 的模型部署於印度,似乎是以該平台必須在印度本地儲存並處理所有用戶資料為條件,這符合印度嚴格的資料本地化要求。
「關於 DeepSeek 的資料隱私問題,可以通過在印度伺服器上託管開放原始碼模型來解決,」Ashwini Vaishnaw 在一場業界會議上表示。
DeepSeek 的模型預計將部署在印度新建的 AI 運算設施上。該設施配備了 18,693 個 GPU,幾乎是最初目標的兩倍—其中約 13,000 個為 NVIDIA H100 GPU,約 1,500 個是 NVIDIA H200 GPU 。大約 10,000 個 GPU 已隨時準備就緒。據部長透露,設施預計將於「未來幾天內」啟用。
該設施還將以大幅折扣價格向印度企業提供運算服務。 Ashwini Vaishnaw 表示,標準的 AI 運算服務將比市價低 42%,高精度運算服務則將有 47% 的折扣。
部長的言論是在 DeepSeek 的同名應用程式,因義大利的資料保護機構調查用戶資料處理問題而被蘋果和谷歌應用商店下架後隔天發表的。該監管機構正要求該中國公司提供有關如何處理義大利用戶資料的細節。
除了託管外國的 AI 模型外,印度也致力於發展本國的 AI 模型及相關技術。「主要晶片設計商願意與印度合作開發本土 GPU,」Ashwini Vaishnaw 表示。
Ashwini Vaishnaw 預估,印度在未來 2 到 3 年內將會吸引超過 300 億美元的超大規模資料中心投資。根據彭博社上週的報導,該國最大的企業之一,Reliance,正在計劃在賈姆訥格爾市 (Jamnagar) 建設一個可能成為全球最大資料中心的設施,該中心容量將達到 3 gigawatt 。
「我們估計,至少有 6 個主要開發團隊能夠在 6 到 8 個月內(樂觀估計為 4 到 6 個月)完成 AI 模型的開發。共用運算設施是建造強大 AI 生態系統的最重要組成部分。」Ashwini Vaishnaw 表示。
這個運算設施同時將支持印度的廣泛 AI 倡議。 Ashwini Vaishnaw 透露,有 18 個以 AI 為驅動的應用程式專注於農業、氣候變遷及學習障礙,已被選定作為初步資金支助的項目。
為了監管這些 AI 倡議的發展,印度將設立一個採取「核心-分支模式」的監管機構,允許多個機構合作制定安全框架。他補充道:「我們的模型將保持開放且以應用為導向」
Source: TechCrunch
