讓高階工程師更省力，若水幫企業練AI數據基本功

AI應用近年來在台灣逐步落地，許多產業也開始思考如何導入AI，進而降低生產成本、增加整體營收。專門提供數據處理與諮詢服務的若水強調，企業對AI的思維轉型，不應只著重於演算法，更要加強檢驗並優化數據的處理。

若水執行長陳潔如表示，大公司的AI團隊規劃，對AI的整體發展造成很大的問題。許多老闆認為，錢應該花在演算法上而不是在數據處理上。這使得高端AI工程師得花上很大的時間成本處理基本的數據。

「我曾聽過工程師分享，一天工作八小時，他們可能花上五個小時在處理基本數據，只剩三小時來寫演算法。」若水國際執行長陳潔如

陳潔如強調，AI產業才剛開始發展，所以它很需要長出產業分工鏈。企業高層的思維，應該透過不同階段AI工作的專業分工，與擁有專業AI數據標註團隊的公司合作，進而有效分配高級工程師的工作內容，把錢花在刀口上。

AI模型總是跑出「垃圾數據」？最初的數據規則定義是關鍵

要啟動AI應用，首先必須搜集大量數據進行分析。但數據種類繁雜，有優劣之分，把未經處理的資料丟進AI，很容易就會「garbage in, garbage out」，最終也只是徒勞。因此，尋求專業的AI數據處理，為數據進行精準的規則設定，成了一大重點。

所謂的精準數據處理又包含哪些層面？若水事業發展協理簡季婕表示， 在一開始就問對問題，並準確定義數據，是創造成功AI模型的關鍵。

簡季婕說，進行應用時，她會先思考要如何設定篩選標準，才能在最後得到優質、有用的資料。她以若水與日本廠商共同分析橋樑安全度的專案為例，她說，這間廠商希望明確標記出橋樑生鏽的部分，但他們的AI卻把與鐵鏽相似的苔蘚、髒污以及陰影處都一併標記起來，降低數據的準確性。

藉由數據處理的專業分工，若水協助他們找到更準確的數據篩檢方式，定義出鐵鏽的形狀及顏色等特徵，進而得到更精準的成果。「 好的處理方式會加值AI數據的養成， 」簡季婕強調。

對許多企業來說，將數據導入AI模型運算時有許多挑戰。其中，如何定義有效數據、並在出狀況時知道要去調整數據或是運算模型，都有一定難度。

簡季婕說，要使用數據訓練AI模型，事前必須經過全面性思考。數據搜集的難易度以及數據使用的多元情境，都需納入考量。以大量運用AI的自駕車產業來說，天氣好的時候路況較單純，標註周遭環境與物件是相對容易的事。然而在雨天，物件就可能變得模糊，AI需要特別進行訓練。

「 AI模型的培養是一個循序漸進的過程， 」簡季婕說。數據就如同AI的土壤，土壤的成分、性質、濕度、含氧量，都需經過精確的設定、調配，才能開花結果。精準的數據標註就如同這個概念，這也是若水所強調的，AI產業鏈分工的重要性所在。