請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

國內

扯!中研院大型語言模型用中國資料集 問AI最高領導人竟答習近平

太報

更新於 2023年10月09日12:01 • 發布於 2023年10月09日12:01 • 政治中心
中央研究院。廖瑞祥攝
中央研究院。廖瑞祥攝

中研院前天宣布自製的繁中大型語言模型登場,被爆使用的資料集,是以中國為主的簡體中文資料、再另外簡轉繁,今天中午下架。立委范雲今天舉例問最高領導人是誰,答案竟然是習近平,她直言這已經是資安問題,是認知戰的議題,要求中研院立刻檢討。

立委范雲今天(10/9)晚間於臉書發文表示,中研院前天才宣布自製的繁中大型語言模型登場,今天中午就下架了。因為被發現使用的資料集,是以中國為主的簡體中文資料、再另外簡轉繁。

范雲舉例,請它舉例「我國代表性法律」,它回答:「中華人民共和國法典、中華人民共和國憲法」等中國法律,還有其他回答例如:台灣是中國的一部分、國慶是10月1日等,讓她怒轟「實在太離譜,令人憤怒」,這已經是資安問題,是認知戰的議題,出現在最高、理應最嚴謹的學術機構,真的不能接受,她立刻要求中研院盡速出面說明,嚴格檢討!

范雲進一步說明,中研院CKIP Lab中文詞知識庫小組,最新開源釋出大型語言模型CKIP-Llama-2-7b,並提供學術和商用,可運用在文案生成、文學創作、問答系統、客服系統、語言翻譯、文字編修、華語教學等;CKIP-Llama-2-7b使用了2個「簡轉繁」後的資料,包括COIG-PC資料集、dolly-15k資料集,前者是由中國AI研究單位為首,包括:北京人工智慧學院、北京大學、香港科技大學等;後者則是以簡中為主的知識問答對話資料集。

范雲質疑,台灣想做自己的大型語言模型,為什麼會變成現在這般四不像的樣子?反而出現各種錯誤的、統戰的中共宣傳內容?出如此明顯錯誤的理由是什麼?是預算不足?是資料來源不足?還是什麼?但作為台灣最重要的研究智庫,中研院,怎能如此便宜行事?

范雲指出,更重要的是,她會要求台灣能夠有一個我們自己的繁體中文大型語言模型,因為這是AI時代,厚植國力的必要戰備武器!

0 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0

留言 73

  • 德慶
    難怪我們已經看不到對岸的車尾燈了!
    2023年10月09日12:37
  • 荳荳
    民進黨專門打臉自己
    2023年10月09日13:15
  • Kevin
    因為轉包給中國廠商了
    2023年10月09日13:12
  • 萳西(nancy蔡)
    台灣的幼教教材也都採用中國的,中共對台攻伐自幼兒園開始!
    2023年10月09日12:55
  • 王耀宗AW
    早就知道塔綠斑賣台了!
    2023年10月09日13:13
顯示全部