《Hit AI & Blockchain》Kneron產品行銷暨應用協理史亞倫:AI算力必然走向去中心化,邊緣運算成為未來主流
「從IBM大主機到個人電腦、從功能型手機到智慧型手機,每一次算力革命都是從集中走向分散,AI也不例外,而且速度比以前都還要快。」Kneron產品行銷暨應用協理史亞倫,在第九屆《Hit AI & Blockchain》人工智慧暨區塊鏈產業高峰會中表示。
史亞倫以歷史框架切入,梳理算力演變的脈絡。他指出,最早的算力高度集中於IBM大主機,隨後個人電腦興起,算力開始分散到每個人手上;手機時代初期同樣依賴基地台與電信商,直到智慧型手機出現,廠商開始強調「行動運算」,算力再度走向去中心化。就連比特幣與區塊鏈的崛起,也是對傳統央行高度集中管控體制的一種去中心化回應。
AI集中在雲端無法滿足企業需求,去中心化浪潮將至
這套框架套用到AI領域,史亞倫認為更加明顯,且進程更快。他回顧,AI發展初期,各實驗室各自摸索,本就是去中心化的狀態,AlphaGo問世、大型語言模型興起後,算力又迅速向少數科技巨頭集中,全球用戶每天仰賴ChatGPT、Grok等雲端服務。
史亞倫觀察到這個集中化的階段正快速翻轉,他指出,從GPT出來到現在不過一兩年,我們已經開始推各個國家的主權AI建設、各地的資料中心,甚至未來到企業級的邊緣伺服器去跑自己的大型語言模型,這是一個非常快的從集中到分散的過程,比比特幣的進程都還要快。
他強調,無論是個人在家架設的AI代理人(Agent),還是企業自建的本地推論伺服器,去中心化都是不可逆的趨勢。
從晶片到伺服器,耐能全面布局邊緣端
史亞倫說明,耐能從最早研發晶片層級的神經處理器(NPU),讓智慧家庭裝置、IP攝影機、門鎖、門鈴等小型設備具備AI能力,到現在推出企業級的邊緣推論伺服器,一貫的核心理念是「把算力普及化、降低門檻」。
在成本考量上,史亞倫也點出問題,隨著AI代理人數量增加,長期仰賴雲端服務的Token費用將日積月累成為沉重負擔,而本地端運算正是解方,靈活對應不同規模的需求。
在個人端,耐能以自家KL730晶片所設計的開發板「KNEO Pi」,搭配安裝OpenClaw,不僅能能以低成本、低功耗達成24小時運行AI代理服務,還能透過Telegram與其互動,並藉由KNEO Pi具備的40 pin GPIO接腳,實現與實體裝置的互動,包括連接燈光開關、窗簾、遙控器與攝影機,實現對實體世界的控制。
史亞倫強調本地端運算的安全優勢,如果整個流程都跑在地端的伺服器上,你不用擔心AI代理人幫你做了超出權限的事情,因為最後做判斷的那個大腦也在你的區域網路裡面,這種受控環境,對注重資料隱私的企業與個人用戶而言,是雲端服務難以取代的優勢。
醫療、金融、教育,垂直場景深耕
在垂直產業應用方面,耐能在地端的大語言模型領域深耕已有數年,透過公司推出的KNEO 330 / KNEO 350邊緣AI伺服器,累積了醫療服務業、金融業及學校教育等高度專業、高度客製化需求的實際成果。
史亞倫說明,不同規模的機構對算力的需求差異顯著,例如診所與大型醫院需要處理的資料量截然不同,耐能因此針對不同場景提供對應的硬體與軟體服務組合。