科技

台灣版ChatGPT來了!聯發科攜中研院開放最大繁中語言模型資料庫

太報
更新於 2023年02月23日08:26 • 發布於 2023年02月23日08:01 • 陳俐妏

人工智慧(AI)聊天機器人ChatGPT 短短4個月全球爆紅,累計達1億用戶。台灣AI 生成內容國家隊也就位! 聯發科攜手中央研究院詞庫小組和國家教育研究院,今日開放全球第一款繁體中文語言模型到開源網站提供測試。繁體中文大型語言模型(large language model),比目前開源可用的最大繁體中文模型大1000倍。

台灣版ChatGPT 來了!聯發科攜中研院開放最大繁中語言模型資料庫。資料照

廣告(請繼續閱讀本文)

本次公開釋出以開源語言模型BLOOM開發的繁體中文大型語言模型(large language model),比目前開源可用的最大繁體中文模型大1000倍,所使用的訓練資料也多1000倍。該模型已公開讓外界下載,可應用於問答系統、文字編修、廣告文案生成、華語教學、客服系統等。

聯發創新基地負責人許大山說,大型語言模型是近年人工智慧技術亮點,更是未來技術進步不可或缺的基石。聯發科這次結合中研院及國教院,成為台灣極少數能訓練大型語言模型的團隊,以透明、開放和包容方式,善用技術、人才及資源,既發展自主訓練大型人工智慧模型的能力,也讓繁體中文的大型語言模型研究及應用更普及。

目前開放原始碼釋出的大型語言模型,多數仍以英文為主要優化的對象,繁體中文的語言模型相對不足。鑑於開放原始碼繁體中文大型語言模型的重要性與迫切性,去年5月聯發創新基地、中央研究院和國家教育研究院展開合作計畫,使用大型語言模型BLOOM的繁體中文模型再訓練與優化。

廣告(請繼續閱讀本文)

目前開放系列中第一個有量級跳躍意義的繁體中文語言模型,聯發科創新基地也暫備一個手機網頁的介面,供語言模型研究者試用。此模型系列的評量指標,以及參數量更大(176B)的模型,將陸續開放下載。

更多太報報導

查看原始文章
留言 8
  • 吉龍舞春🐉
    就怕說是「台灣版」卻跟Google翻譯一樣滿滿中國用語😰
    2023年02月23日20:41
  • kay
    gpt各國自己開發, 入資料庫建檔源各異, 未來ai學各國ai融合更高階ai, 如此反覆融合成超級ai互學, 人類就即將滅亡, 來,準備對抗ai元年開始。
    2023年02月23日14:38
  • DJ✏️
    中研院,借調院
    2023年02月23日21:55
  • Vincent 郭
    能寫中文程式碼嗎?
    2023年02月23日23:40
  • 到時會是唐鳳真人回應
    2023年02月23日23:45
顯示全部