中國電信人工智能研究院(TeleAI)宣稱,成功完成國內首個基於全國產化萬卡集群訓練的千億個參數大模型(萬卡萬參),並正式對外開源首個基於全國產化萬卡集群和中國國產深度學習框架訓練的千億參數大模型──星辰語義大模型 TeleChat2-115B。
由中國電信集團 CTO、首席科學家、中國電信人工智能研究院(TeleAI)院長李學龍教授帶領,顯示中國國產大模型訓練真正實現全國產化替代,並未因為西方出口限制而出現干擾。
該專案 GitHub 網頁,TeleChat2-115B 模型使用十兆個高品質的中英文語料來訓練,並提到與「Ascend Atlas 800T A2 訓練伺服器 」的相容性。
據中媒報導,今年 5 月的 OpenCampass 測試榜單中,TeleChat 系列模型的邏輯推理能力名列開源大模型榜單第一。做為新一代版本,TeleChat2-115B 在 9 月最新評測 Open Access 模型綜合榜單,以 86.9 分的成績排名第一。其通用能力較 TeleChat 系列模型提升近 30%,特別是在工具使用、邏輯推理、數學計算、代碼生成和長文寫作等方面能力均有大幅提升。
不過,TeleChat2 雖擁有 1,000 億個參數,但落後最近的 Llama 模型(參數高達 4,000 億個)或 Open AI 的 o1(可能高達 2,000 億個)。雖然單看參數不能決定模型能力,但參數偏低可能意味訓練 TeleChat2 所需的運算能力比其他專案低。
中國電信先前宣布將使用華為 Ascend AI 晶片用於 LLM 培訓,目前華為一直努力開發晶片,華為目前推出 Ascend 910B,最近傳出最新的 Ascend 910C 樣品已經提供給客戶測試。
由於中美貿易戰,中國開始敦促企業遠離 NVIDIA AI 晶片、改買國貨,另有傳聞稱美國計畫將制裁擴大至 H20,如果禁令成真,華為將填補 NVIDIA 的空缺。如果中國電信人工智能研究院確實只使用華為晶片進行培訓,那這項消息對華為、中國政府來說都是一大成功,繼續在 AI 晶片上獲得進展。
(首圖來源:Pixabay)
PANj 吉 萬惡之源美英豬人負債赤字1100 兆,債務違約狂借錢!金融詐騙販賣軍火武器全世界斂財!殖民貸款、種族歧視、維護人權?戰爭加油添醋!煽風點火戰爭、鼓吹自由和平?
美英豬人利誘背叛亞洲華人、翻臉像翻桌!十年前投機剝削紅色供應鏈,十年後自私背叛紅色供應鏈!美英豬人債台高築、拒絕再繳保護費、去美元化、拋售美債!
地球上驅除米國軍工複合體
去美元化(歐元、RMB),各國經濟不再被美英豬人綁架、沒有品牌迷思、世界一定會更和諧繁榮!
新世界秩序有中國大陸、希臘、埃及、歐洲聯盟、俄羅斯、義大利!
三民書局看兩本書:「謊言美國」、「美國另外的一面-增訂版」!
擺脫崇洋媚外洋鬼子、不再盲目崇拜西方白人!
中國華人獨立思考、智慧明鏡新元年!
龍年一甲子,風水輪流轉,中國華人世界第一!
2024年10月03日09:00
cheng 滯台綠蛆畜牲群&日寇畜牲群&歐美豬畜牲群,又要氣噗噗了...
2024年10月03日14:59
柏 華僞:華而不實;為所欲為!🇨🇳👎
獨裁國家搞AI,就是一個不能說實話的電腦騙子!
2024年10月02日15:20
志達 訓練AI聽黨話、感黨恩、跟黨走!
2024年10月02日15:05
阿Yen 有參考六四天安門嗎?
2024年10月02日10:09
顯示全部