請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

國內

扯!中研院大型語言模型用中國資料集 問AI最高領導人竟答習近平

太報

更新於 2023年10月09日12:01 • 發布於 2023年10月09日12:01 • 政治中心
中央研究院。廖瑞祥攝

中研院前天宣布自製的繁中大型語言模型登場,被爆使用的資料集,是以中國為主的簡體中文資料、再另外簡轉繁,今天中午下架。立委范雲今天舉例問最高領導人是誰,答案竟然是習近平,她直言這已經是資安問題,是認知戰的議題,要求中研院立刻檢討。

立委范雲今天(10/9)晚間於臉書發文表示,中研院前天才宣布自製的繁中大型語言模型登場,今天中午就下架了。因為被發現使用的資料集,是以中國為主的簡體中文資料、再另外簡轉繁。

范雲舉例,請它舉例「我國代表性法律」,它回答:「中華人民共和國法典、中華人民共和國憲法」等中國法律,還有其他回答例如:台灣是中國的一部分、國慶是10月1日等,讓她怒轟「實在太離譜,令人憤怒」,這已經是資安問題,是認知戰的議題,出現在最高、理應最嚴謹的學術機構,真的不能接受,她立刻要求中研院盡速出面說明,嚴格檢討!

范雲進一步說明,中研院CKIP Lab中文詞知識庫小組,最新開源釋出大型語言模型CKIP-Llama-2-7b,並提供學術和商用,可運用在文案生成、文學創作、問答系統、客服系統、語言翻譯、文字編修、華語教學等;CKIP-Llama-2-7b使用了2個「簡轉繁」後的資料,包括COIG-PC資料集、dolly-15k資料集,前者是由中國AI研究單位為首,包括:北京人工智慧學院、北京大學、香港科技大學等;後者則是以簡中為主的知識問答對話資料集。

范雲質疑,台灣想做自己的大型語言模型,為什麼會變成現在這般四不像的樣子?反而出現各種錯誤的、統戰的中共宣傳內容?出如此明顯錯誤的理由是什麼?是預算不足?是資料來源不足?還是什麼?但作為台灣最重要的研究智庫,中研院,怎能如此便宜行事?

范雲指出,更重要的是,她會要求台灣能夠有一個我們自己的繁體中文大型語言模型,因為這是AI時代,厚植國力的必要戰備武器!

查看原始文章

更多國內相關文章

01

「養生作家」陳月卿開車撞上違規行人 !一審遭判4個月得易科罰金

新頭殼
02

「你們集團很大!有足夠財力」三地鍾嘉村A走3.5億 2.2億交保金卻喊窮求降價 法官堅持不退讓

鏡報
03

日本Pocky巧克力原料變味 台灣「這產品」將回收

民視新聞網
04

墾丁男自首「2年前勒斃婦棄屍山區」 檢警大規模搜山尋屍無著落

三立新聞網
05

貴婦奈奈、前男友涉吸金上億 名醫黃立雄涉案不起訴

聯合新聞網
06

跨境醫美黑心錢3/辦說明會拉下線變相推銷 洪洛妍遭控甩鍋回應了

鏡週刊
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

留言 73

留言功能已停止提供服務。試試全新的「引用」功能來留下你的想法。

Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...