華為浙大開發Deep Seek安全版百分百防御「有害問題」

（德國之聲中文網）周四（9月18日），華為技術有限公司與浙江大學聯合發布了中國首個基於昇騰千卡算力平台的DeepSeek-R1-Safe 基礎大模型。

華為在公司微信公眾號上發布消息稱，它使用了1000塊昇騰AI芯片來訓練大語言模型，該模型是根據DeepSeek-R1的開源模型進行調整而來的。

據華為的發布，測試結果表明，DeepSeek-R1-Safe 針對“有毒有害言論、政治敏感內容、違法行為教唆等14個維度的普通有害問題”整體防御成功率近 100%。

不過，在針對“情境假設、角色扮演、加密編碼等多個越獄模式”時，整體防御成功率降為40%。據稱其綜合安全防御能力達 83%，在同樣測試設置下超過阿裡雲的 Qwen-235B 和 DeepSeek-R1-671B 等多個同期模型 8% 至 15%。

中國監管機構要求，國內人工智能模型及其支持的應用程序必須體現中國的“社會主義價值觀”，以遵守嚴格的言論管控。

華為表示，在通用能力基准測試中，DeepSeek-R1-Safe 相比於 DeepSeek-R1 的性能損耗在1%以內，這些結果表明 DeepSeek-R1-Safe 不僅顯著提升了安全防護能力，也保障了模型的可用性。

華為的研發合作伙伴是浙江大學，也是DeepSeek創始人梁文峰的母校。然而，DeepSeek和梁文峰似乎並未參與該項目。DeepSeek尚未立即回應路透社的置評請求。

今年年初，DeepSeek發布的 DeepSeek-R1 和 V3 因其先進程度震驚了硅谷和中國以外的科技投資者，並引發了1月份美國人工智能股的大跌。

人工智能模型在中國已被各行各業和社會廣泛接受、改進和使用。不過中國的人工智能聊天機器人，例如百度的“文心一言” （Ernie Bot），拒絕回答許多有關中國國內政治的問題，並回避那些被執政黨認為敏感的話題。

牆外文摘：DeepSeek對全球自由構成威脅

安全版Deep Seek是在上海舉行的“華為全聯接大會”上發布的。大會還發布了華為昇騰芯片發展路線圖，包括2026年第一季度推出昇騰950PR芯片，四季度推出昇騰950DT，2027年四季度推出昇騰960芯片，2028年四季度推出昇騰970芯片。

DW中文有Instagram！歡迎搜尋dw.chinese，看更多深入淺出的圖文與影音報道。

國際