AI應用近年來在台灣逐步落地,許多產業也開始思考如何導入AI,進而降低生產成本、增加整體營收。專門提供數據處理與諮詢服務的若水強調,企業對AI的思維轉型,不應只著重於演算法,更要加強檢驗並優化數據的處理。
若水執行長陳潔如表示,大公司的AI團隊規劃,對AI的整體發展造成很大的問題。許多老闆認為,錢應該花在演算法上而不是在數據處理上。這使得高端AI工程師得花上很大的時間成本處理基本的數據。
「我曾聽過工程師分享,一天工作八小時,他們可能花上五個小時在處理基本數據,只剩三小時來寫演算法。」 若水國際執行長陳潔如
陳潔如強調,AI產業才剛開始發展,所以它很需要長出產業分工鏈。企業高層的思維,應該透過不同階段AI工作的專業分工,與擁有專業AI數據標註團隊的公司合作,進而有效分配高級工程師的工作內容,把錢花在刀口上。
AI模型總是跑出「垃圾數據」?最初的數據規則定義是關鍵
要啟動AI應用,首先必須搜集大量數據進行分析。但數據種類繁雜,有優劣之分,把未經處理的資料丟進AI,很容易就會「garbage in, garbage out」,最終也只是徒勞。因此,尋求專業的AI數據處理,為數據進行精準的規則設定,成了一大重點。
所謂的精準數據處理又包含哪些層面?若水事業發展協理簡季婕表示, 在一開始就問對問題,並準確定義數據,是創造成功AI模型的關鍵。
簡季婕說,進行應用時,她會先思考要如何設定篩選標準,才能在最後得到優質、有用的資料。她以若水與日本廠商共同分析橋樑安全度的專案為例,她說,這間廠商希望明確標記出橋樑生鏽的部分,但他們的AI卻把與鐵鏽相似的苔蘚、髒污以及陰影處都一併標記起來,降低數據的準確性。
藉由數據處理的專業分工,若水協助他們找到更準確的數據篩檢方式,定義出鐵鏽的形狀及顏色等特徵,進而得到更精準的成果。「 好的處理方式會加值AI數據的養成, 」簡季婕強調。
搜集的難易度、多元使用情境,數據處理比想像中更繁雜
對許多企業來說,將數據導入AI模型運算時有許多挑戰。其中,如何定義有效數據、並在出狀況時知道要去調整數據或是運算模型,都有一定難度。
簡季婕說,要使用數據訓練AI模型,事前必須經過全面性思考。數據搜集的難易度以及數據使用的多元情境,都需納入考量。以大量運用AI的自駕車產業來說,天氣好的時候路況較單純,標註周遭環境與物件是相對容易的事。然而在雨天,物件就可能變得模糊,AI需要特別進行訓練。
「 AI模型的培養是一個循序漸進的過程, 」簡季婕說。數據就如同AI的土壤,土壤的成分、性質、濕度、含氧量,都需經過精確的設定、調配,才能開花結果。精準的數據標註就如同這個概念,這也是若水所強調的,AI產業鏈分工的重要性所在。
留言 0