請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

一句話自動產生SQL語法,瞄準數據處理的Numbers Station獲近4億元募資

創業小聚

更新於 2023年04月07日10:48 • 發布於 2023年04月07日00:32 • 黃弈軒

根據外包數據清理平台CrowdFlower的調查指出,資料科學家有60%的工作時間花在「清理數據」,而非真正的數據分析。就算所有企業都了解「數據驅動」(Data-Driven)的重要性,資料處理仍是無可必免的苦工。

新創Numbers Station把近來火熱的「生成式AI」運用在資料處理的環節上:使用者只要輸入一句話,即可自動產生SQL語法,在龐大的數據庫中撈取數據。如某產品的月銷量、本季營業額前三的產品,還能夠直接建立AI模型,連不懂程式語言的工作者也能使用,在今(2023)年3月獲得1,250萬美元的A輪募資。

Numbers Station專門解決數據分析的上一層工作:數據清理。

Numbers Station期望讓資料科學家專注在「最重要的事」

Numbers Station是由史丹佛大學博士Chris Aberger、Ines Chami、Sen Wu,以及副教授Chris Ré共同創辦。

「我們看到大多數AI人才專注於行銷內容、圖片生成功能,鮮少專注於處理龐雜的數據格式、資料前清理,但這仍然是一個巨大的企業問題和企業需求。」Numbers Station執行長Chris Aberger說道。

執行數據分析之前,如果沒有清理乾淨的數據,就難以產出具有正確見解的洞察,也就是常見的「垃圾進、垃圾出」(Garbage in, garbage out),如果大多原始數據(Raw Data)錯誤、重複或缺失,在尚未清理之前便建立AI模型,會降低AI模型的準確率。不過因數據龐大、來源多樣,使得數據清洗工作一直相當困難。

Chris Aberger指出,數據分析、清理能力需要一定程度的門檻,因此數據往往只能由公司一部分的人掌握,不論是初階數據的存取或是AI模型,都仰賴這小部分的人,「我們想讓資料科學家花更多的時間提供洞察,花更少的時間在這些平凡的數據清理上。」

Numbers Station讓公司人人都能寫SQL、建立AI模型

2021年Numbers Station正式成立,專門給企業提供生成式AI服務,為資料科學家省去重複又耗時的數據清理、重複數據刪除、正規化(Normalization)等工作,但目前僅提供SQL語言使用。

Numbers Station的目標簡單來說,就是讓數據清洗不再困難,也不再限於具有專業知識的人。具體來說分成3個部分:第一是提高效率,讓資料科學家專注於更重要的工作,例如解釋數據、制定決策;二是提高數據品質,透過AI自動糾正並識別數據問題;三是數據存取權民主化,讓公司所有人皆能執行數據撈取、建立AI模型工作。

為了達到上述目標,Numbers Station的產品提供3大服務來加速數據的清洗、存取與使用:

  • 自動生成SQL語言
    SQL語言大多應用在資料庫查詢,如客戶訂單、銷售趨勢等,藉由Numbers Station,使用者便不用學習SQL語言,只要輸入口語化的指令,例如「在A資料表中尋找價格大於1,000的商品」,即可得到一串SQL公式,直接撈取需要的數據。

  • 自動建立AI模型
    Numbers Station也能自動建立AI模型,以客戶評論來說,使用者只要輸入一句話,如「這些顧客最喜歡這支產品的哪一個地方?以一個單字摘要,例如價格、尺寸合適度、風格等」,Numbers Station就會自動為資料及貼上標籤,接著使用者只需要檢驗標籤是否正確,回饋並修正,即可建立一套AI模型。

Numbers Station可以讓程式小白直接建立AI模型。
  • 自動整併資料庫
    由於公司的多個資料集可能散佈在不同平台,Numbers Station能直接將SAP、Salesforce、Snowflake等資料直接合併在一起。
Numbers Station自動整併資料集功能。

以Numbers Station過去的一間企業客戶來說,該企業擁有兩個客戶關係管理系統(CRM),各自管理線上與實體門市的顧客,兩邊數據呈現孤立狀態。為了得知顧客在線上、實體的消費情形,企業希望將兩邊數據整併在一起,讓行銷及業務團隊追蹤全面的消費者購物旅程。

但困難的是,企業中不同實體門市的數據雜亂,出現許多缺失值、格式錯誤的狀況,導致數據整併工程需要耗費許多精力,最後使用Numbers Station後,兩邊數據匹配率98%,工作速度提升10倍,為數據分析團隊大幅節省時間成本。

對於生成式AI熱潮,Numbers Station執行長:「加入自身專業」才是成功關鍵

今(2023)年3月,Numbers Station獲得1,250萬美元A輪募資,由Madrona領投,並包含Norwest Venture Partners、Factory等其他投資人。

Madrona投資人Tim Porter和Jon Turow說,投資Numbers Station的原因之一是團隊成員背景具有技術實力,可以為更多企業導入AI,降低技術使用門檻,像是Chris Aberger過去就在美國人工智慧軟硬體獨角獸SambaNova Systems領導機器學習團隊。

資料視覺化企業Tableau的前執行長Mark Nelson也發表看法:「Numbers Station正在解決數據行業幾十年來存在的挑戰。他們的平台和底層AI技術正在為現代數據工作帶來根本性的轉變。」

現行許多公司使用ChatGPT原先的Open AI模型打造產品,Chris Aberger也提出相應看法。在他看來,由於ChatGPT僅抓取網路上的資訊,無法涵括所有知識、專業,僅能達到及格水準,因此需要再微調才能做到將近滿分,做出產品差異化,「真正重要的是,你在這些模型上的哪些地方應用AI專業知識,使它們在特定組織的任務中表現良好。」

參考資料:TechCrunchbusinesswireThe Analytics Engineering Roundup

提供您第一手最豐富的創業資訊!
邀請您加入「《創業小聚》LINE官方帳號

延伸閱讀

從歷史上的「網絡效應」看ChatGPT:當AI成為標配,新創怎麼建立護城河?
前OpenAI工程總監創辦AI新創Adept,要讓所有軟體都能被AI操控
AI會取代人類,還是人類會成為AI的一部分?從「平台經濟」看人機互動的未來
Seek AI:讓行銷人不懂資料庫也可以1秒生成銷售數字、產品趨勢、營業額

查看原始文章

更多科技相關文章

01

傳Meta啟動全球裁員 AI組織調整引員工反彈

路透社
02

WSJ:Google和黑石集團將共同成立新AI雲端公司

路透社
03

走出牢獄深谷東山再起,「風格女王」瑪莎史都華成立AI居家新創Hint拿下3億種子輪

創業小聚
04

普丁即將到訪中國 俄盧布兌人民幣升值至3年多新高

路透社
05

2026年全球新創生態系報告出爐:台灣首進前20、但「隱形冠軍」困境還沒解

創業小聚
06

黃仁勳:中國終將對美AI晶片開放市場

路透社
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...