最近期OpenAI推出了新一代旗艦AI模型「GPT-4o」,被譽為是目前與人類交流的「最佳AI助理」。「o」代表「omni」,意指能夠處理多種形式的輸入和輸出,無論是文字輸入、語音問題,甚至使用鏡頭進行對話,都能即時回應。
由於「GPT-4o」易於掌握,能幫助上班族更有效地完成案頭工作,又能擔任「家庭教師」,甚至能進行即時口述翻譯,因此迅速吸引了大量用家使用。那邊廂則有報導指出,雖然Apple Intelligence功能預計要到2025年才會全面推出,但Siri的最新功能可允許用戶直接輸入文字,而毋須進入輔助功能設定,即變得更具對話性,就算使用者在講話時出現口誤,Siri也能理解其意思。
事實上,各類人工智能應用的科技公司早已開始開發這類模組。例如,筆者團隊正在開發的「AI中央數據資訊庫」,乃是針對商用市場,其結構思維與「GPT-4o」如出一轍,可以說是「商用Siri」。這些AI模組融入商用軟件後,將帶來驚人的變革。
舉例說,企業內部的後台軟件界面複雜,預設了不同選項,如整合銷售報表時,用戶需按程序點擊分店、日期、時段、產品類型、銷售量等選項,後台才能生成相應報表。然而使用這種AI模組後,後台不再需要特定界面及預設按鈕,用戶只需在對話框中輸入或口述指令:「請提供上月份某分店的總銷售報表」,後台即可自動生成相應報表。
AI模組具有強大的理解能力,因此還能加入「訂閱」功能。例如,用戶可以在對話框中輸入或口述「請於每月1日,提交過去30日某分店的總銷售報表」或「請每小時更新某分店的總銷售額」,後台亦能到時到候自動生成報表及回應。此外,加入相關編程後,更可以在對話框中要求AI提出預測分析,如「請預測下月某店的總銷售額」;系統會根據過往數據進行分析,預估下月的銷售總額,並製作圖表供用戶參考。
未來,用戶毋須再點擊選項或按既定步驟切換視窗,只需在對話框中說出需要查詢或取得的資料即可。如同OpenAI CEO Sam Altman所言,使用GPT-4o這類AI模組後,他不用再停止手上的工作切換視窗或點擊選項,他只需詢問即可得到即時回應。這類AI模組將被更廣泛應用,通過更自然的對話和超強的理解能力,顛覆人們對科技軟件的使用習慣。
作者簡介:
陳智銓(Arthur),思路富邦集團(SagaDigits)創辦人暨集團成員 隨賞科技(Compathnion)行政總裁