搭建企業級大資料分析平台也可以很簡單！

對於大資料分析平台的建設，往往不是某個產品就能夠滿足，而是需要多種不同的產品一起搭建。例如，搭建大資料平台需要大規模資料儲存平台，需要資料處理和挖掘工具，分析結果需要通過展現工具體現大資料分析的價值。所以，沒有乙個完善的bigdata生態系統，大資料分析平台是搭建不起來的。

ibm作為大資料分析領域的領導者，有著其他廠商或開源無法比擬的完整bigdata生態系統。下面然讓我們來看看這個生態系統包括哪些產品。

ibm biginsights 是實現ibm大資料戰略的重要旗艦產品，它包含了開源部分－即iop，和增值部分。biginsights增值部分則包括了bigsql－業界最先進、最成熟的sql on hadoop引擎，text analytics－基於拖拽的文字分析工具，big sheet －類似電子**的資料處理工具，bigr －適合在分布式平台執行的r改進版本等高階功能。

ibm streams

ibm streams 是乙個高階流計算平台，幫助使用者開發的應用程式快速攝取、分析和關聯來自數千個實時源的資訊。它可處理非常高的資料吞吐率，最高可達每秒數百萬個事件或訊息。streams 旨在從乙個幾分鐘到幾小時的視窗中的移動資訊（資料流）中揭示有意義的模式。該平台能夠獲取低延遲洞察，並為注重時效的應用程式（比如欺詐檢測或網路管理）獲取更好的成果，從而提供業務價值。

我們常說的spss包含spss modeler 和spss analytic server。spss modeler是一款資料探勘分析的行業軟體，其採用資料流的方式來展示資料探勘的操作過程，並結合crisp-dm 工業標準打造了乙個支援眾多資料探勘操作的應用平台。spss analytic server是大資料分析的解決方案，它提供了乙個易於實現的框架，從而能夠在分布式檔案系統上來執行大資料分析。它將ibm spss 現有的商業分析技術與大資料技術相結合，使得使用者能夠使用複雜的分析演算法以高可伸縮的方式來解決基於大資料的分析問題。

big replicate整合了wandisco fusion技術，為hadoop集群實現資料複製和高可用方案。bigreplicate為跨任意距離的hadoop集群提供了單一虛擬命名空間，從而打破資訊孤島，實現hadoop集群之間的自由、靈活資料複製。

big integrate是ibm infosphere information server（datastage）的hadoop版本，為大資料平台提供企業級etl方案。

bigquality採用data quality 引擎，為hadoop環境提供資料分析、清洗和資料質量監控的功能。

big match使用ibm infosphere mdm的相同演算法，幫助使用者解決hadoop環境中跨非結構化和結構化資料的客戶身份匹配的挑戰。

結束語

ibm 提供了企業級hadoop方案－biginsights，而且提供了完善的生態系統，為使用者建設大資料平台提供完整的產品支援。

搭建企業級大資料分析平台也可以很簡單！

大資料分析服務登陸企業級雲端市場

大資料平台搭建基於Hadoop的資料分析平台

從選型到實現企業級雲端大資料平台最佳實踐

搭建企業級大資料分析平台也可以很簡單！

大資料分析服務登陸企業級雲端市場

大資料平台搭建 基於Hadoop的資料分析平台

從選型到實現 企業級雲端大資料平台最佳實踐

相關推薦

大資料平台搭建基於Hadoop的資料分析平台

從選型到實現企業級雲端大資料平台最佳實踐