資料倉儲中幾種最流行產品比較

2021-04-15 12:47:26 字數 2362 閱讀 4594

資料庫(db

後台資料庫目前比較流行的包括teradata(ncr)、iq(sybase)、oracle、db2等,而就本人的理解,oracle和db2在oltp中占有絕對的優勢,但在注重海浬資料高效查詢的olap中,遠遠不及teradata和iq,故本文僅對teradata和iq進行比較與討論。

1.查詢效率

經過嚴格的測試,總體上來講是iq比較快,因為iq所有的賣點就是「無處不索引」;但teradata有乙個主索引的概念,當按照主索引進行查詢時,效率會比iq高,但若不是按照主索引進行查詢講比較慢,沒有iq的效率高。

2.相容性

相容性方面就沒法說了,teradata只認自己公司的產品,從軟體到硬體,其他都使用不成,比如說備份用的磁帶都必須是專用,而iq可以使用在目前所有流行產品上(如ibm、sun等等),不存在相容性的問題。

3.**

對於資料倉儲這種專案來講,投資一般都比較大的,基本上都在千萬級別,最小的也要好幾百萬,故而一般的公司都投資不起,就目前來看,在我國也就電信行業、銀行、能源、鐵路、民航等少數幾家比較有實力的公司才能投資起,但隨著這些公司投資的日漸成熟,都不會像以前哪樣隨便砸錢了,所以**因素是乙個很重要的方面。從投資上來看,當然是iq便宜的多,teradata的**就相當貴了,比方就是乙個備份磁帶由於是專用而非常貴,其乙個節點的**就相當高,隨便也要好幾百萬。

4.擴充套件性

擴充套件性當然是teradata比較好,而且效率隨著硬體的擴充套件將得到提高;但iq也不是說擴充套件性不好,只是說它的擴充套件沒有teradata那麼方便快捷;但teradata乙個節點只能帶4tgb的磁陣,當沒有空間時只好擴節點而不是簡單的增加磁陣。

5.資料庫管理臺

不知sybase公司是怎麼回事,其對資料庫管理臺的開發相當差,沒法和teradata比了,當然就更沒法和oracle比了。

6.磁陣空間利用

iq的壓縮比是所有資料庫中最好的乙個,好幾百兆的資料被壓縮進入資料庫後就只是占用一點而已;而teradata是對空間最浪費的乙個,這個可能與ncr公司銷售策略有關吧,當空間使用完了,你只好買節點,哪可是大把的錢。

總之,就我使用此兩個資料庫的感受是iq要在多個方面超越teradata,如果給兩種資料庫打分的話,iq應該在80分,而teradata最多就60分。

etl工具

etl工具最好的應該是informatica powercenter和ibm data stage兩種,從目前本人使用的情況,其他廠商的產品距離這兩種產品差距實在是不小。

1.簡易性

從使用的簡易性方面看,這兩種產品都很不錯,如果實在要他們中選擇乙個更加優秀的,哪我就推舉powercenter。

2.效率

兩個產品的效率都比較高,經測試發現data stage在處理db2和informix時要更快,可能是自己公司的產品吧。

3.**

一般來講,etl工具的**都非常高,但是informatica powercenter的**更加高的離譜,是按照連線資料庫的**來購買,如連線oracle資料庫是多少錢,db2是多少錢。

4.服務

兩個產品的技術支援都不算太好,相對而言data stage要稍微好些,但powercenter使用的認相對要多點,可以在網上找到許多高人的指點。

綜上,這兩種產品都非常優秀,其他公司的產品在他們面前就好像幼兒園的小朋友,故選擇他們中任何一種都是正確的。

前端展現工具

前端展現工具現在非常多,有國外的也有國產的產品,從目前市場的占有率及使用情況來分析,本文就討論bo及cognos兩種產品。

1.語義層

對於語義層定義來講,這是bo最擅長的地方,其他公司的產品很少有它那麼全面的定義內容,據相關報告,說語義層定義是bo的專利,其他公司都是購買它的專利而已。

2.報表製作

報表製作過程中bo最容易處理,像cognos若報表有問題需要修改,哪是相當麻煩的,而且處理一遍很慢(大資料量)。

3.美觀

這方面cognos的表現要遠遠大於bo,bo的介面是相當死板,而且二次開發也不是那麼容易。

4.效率

由於cognos採用了不同的儲存機制,當進行大資料量報表查詢時,要比bo的表現好些。

5.**

兩種產品的**都不菲,但bo更貴一點而已。

綜上,bo及cognos都表現的非常優秀,但本人認為bo更好一點而已,雖然介面不美觀。

結論

若要進行資料倉儲的建設,在考慮投資、價效比、支援等方面考慮,本人的建議是,採用如下配置好像既能保護好投資,也能夠很好使專案得到順利實施,即iq+powercenter+bo。尤其是要慎重使用ncr的產品,最直接的原因就是無法和其他公司的產品相容,一旦使用將無法擺脫它的束縛,而且價效比也不高。

各大公司資料倉儲產品比較

oracle資料倉儲解決方案主要包括oracle express和oracle discoverer兩個部分。oracle express由四個工具組成 oracle express server是乙個molap 多維olap 伺服器,它利用多維模型,儲存和管理多維資料庫或多維快取記憶體,同時也能夠...

資料中颱與資料倉儲比較

從三個點來說 1 提供服務的物件 2 業務域 3 層次的劃分 1 提供服務的物件 a 資料倉儲的服務物件基本上是人。明細資料,聚合指標,轉化率模型,他們的目前使用者都是人 b 資料中颱的服務物件變成 人 機器。使用者標籤 機器學習模型,資料探勘模型,他們的目標是系統。比如說廣告系統,推薦系統,風控系...

目前最流行的幾種資料庫比較

current situation 商品化的資料庫管理系統以關係型資料庫為主導,技術比較成熟 物件導向的資料庫雖然先進,資料庫易於開發 維護,但尚未有成熟的產品。國際國內的主導關係型資料庫管理系統有oracle sybase informix和ingres。這些產品都支援多平台,如unix vms ...