HPE收購AI流程平台新創Pachyderm 協助訓練AI模型
Hewlett Packard Enterprise 宣佈收購AI流程管理平台新創公司Pachyderm,以協助強化自己的AI方案。HPE計畫本月底完成收購,預計將Pachyderm整合到自己的軟體平台中。
企業的AI專案團隊在架構好神經網路後,需要大量資料集來訓練AI模型。但是這些資料集往往有許多重覆、錯漏或格式錯誤之處,需要篩選、格式化才能送入模型,以提升AI模型訓練的速度及品質。
這資料集的準備過程是由名為資料管線(data pipeline)的自動化流程軟體完成,Pachyderm提供的就是這種方案,使AI管線更容易建構的新創公司。它的平台可以跑在主要公有雲或企業本地部署的私有雲上。
Pachyderm讓開發人員撰寫腳本程式以自動化某個資料準備的任務,像是移除重覆的資料。開發人員之後可以整合這些scripts為一個資料管線,它會利用Kubernetes容器協作引擎執行這些管線,使其能根據AI專案需求自動新增或減少硬體資源。
Pachderm表示其平台每個專案能處理數TB以上的結構性資料,涵括試算表或伺服器紀錄檔或其他類型檔案。
Pachderm也能在管線處理資料時建立變更紀錄,讓工程師根據紀錄檢視並找出管線中可能的技術問題。此外還能重現之前AI專案的結果,以檢核模型的精確性。
HPE指出,隨著AI專案愈來愈大,用到的資料集日愈複雜,資料科學家需要有可複製的AI解決方案以有效利用機器學習成果、最佳化基礎架構成本,並確保不論他們在AI專案的哪個階段,資料都有足夠的穩定及安全性。
HPE計畫將Pachderm產品整合到其AI模型訓練的軟體平台「機器學習開發系統」(Machine Learning Development System)中,該平台來自HPE先前收購的另一家新創Determined AI。