日立有限公司旗下子公司Hitachi Vantara宣布推出新一代數據整合及分析軟體平台Pentaho 8.2,此新版本將與日立領先業界的日立內容平台(Hitachi Content Platform)整合,提供更新且跳脫框架的服務,Pentaho 8.2與Hitachi Vantara的產品組合可進行更佳的整合,讓客戶透過使用HCP所產生的非結構化數據來處理關鍵的產業專案,同時可用全新的方式管理混合雲環境,並擴展對分析生態系統(analytic ecosystem)的支援。
Pentaho 8.2 讓非結構化數據亦能進行分析
根據哈佛商業評論報告(Harvard Business Review)顯示,只有不到一半的企業結構化數據會被用於企業決策中,而非結構化的數據所被使用的機率更是少於1%,透過Pentaho與HCP的全新整合,用戶現在可以建構包含結構化與非結構化的數據管道(data pipelines)—如文字、影片、音訊、圖片、社群媒體、點擊流(clickstreams)及日誌檔等,允許數據分析師及資料科學家能獲得更好的見解,以創造更多商業價值。
Pentaho 8.2 在各領域都開闢了新的使用案例,像是銀行業的金融服務機構可透過相關連的交易數據及電子郵件的來往以滿足合規性需求;醫療保健業上醫學研究人員可以透過將患者數據和病史與非結構化MRI掃描相結合來進行新藥物的研發;零售商可以透過店內監控畫面與銷售據點的數據相結合,來分析每個顧客的購物偏好和店內各品牌商品的銷售流量;而公共安全上執法機關可結合影片片段與犯罪紀錄更快取得證據,並在遵守法規的情況下改善決策的流程。
更簡單的混合雲數據管理
市面上有許多像是NoSQL資料庫,或是像Microsoft Azure、Amazon及Google的公有雲方案,以及本地部署(on-premises)的物件儲存資料湖泊(data lakes),而企業也正在仔細觀察數據管理以及如何符合法規的最佳方案。
當與日立內容平台一同使用時,Pentaho 8.2 可提供更新及更佳的管理數據方案。舉例來說,用戶現在可以將數據載入HCP來當作資料湖泊的功能,並使用Pentaho來準備、淨化以及標準化數據。接著再藉由Pentaho為數據進行邏輯性的分類,判斷何種數據適合何種雲端方案。透過減少不必要的數據傳至雲端空間,企業可透過Pentaho 8.2 更有效地進行管理成本。
延伸的分析生態系統支援
Pentaho 8.2 延伸了對成長中第三方產品及技術生態系統的支援,以幫助企業組織最佳化其數據管道以及各類分析專案,如AMQP支援,Pentaho客戶可透過這受歡迎的訊息協定(messaging protocol),協助企業讀取與發布邊緣裝置的串流數據至雲端,來處理新興的物聯網應用案例;改善Google雲端平台的安全性支援客戶管理式加密金鑰(CMEK),在讀取Google雲端平台儲存與Google BigQuery時可控制自身的數據加密金鑰,來為Pentaho用戶提供額外的防護。
Python Step上Pentaho 8.2用戶可以操作化(operationalize)機器學習以及使用由Python語言建構的深度學習模型,亦可進行對scikit-learn或TensorFlow等知名資料庫的應用程式介面呼叫(API calls);OpenJDK 支援,Pentaho用戶現在可從現在有商業條款的OpenJDK轉換到開放原始碼的OpenJDK免費版本。