pxf適用於聯邦資料的查詢,支援多種資料來源,如hadoop、hive、關聯式資料庫。支援多個異構資料來源,並只查詢資料來源中少量資料集,而避免對資料集執行etl操作。
1.pxf server 部署在segment host主機上。
2.segment通過rest介面和pxf server進行互動。
3.pxf server和外部資料通過特定connector進行互動。at
h:/u
sr/l
ocal
/go/
bin:
path:/usr/local/go/bin:
path:/
usr/
loca
l/go
/bin
:gopath/bin
5)greenplum資料庫
假設greenplum資料庫已經在/home/gpadmin/gpdb_install目錄中安裝好
#source /home/gpadmin/gpdb_install/greenplum_path.sh
6)編譯(用root使用者編譯可以避免許可權的問題)
greenplum使用PXF訪問外部資料
greenplum平台擴充套件框架 pxf 通過內建聯結器提供對外部資料的訪問,這些聯結器可以將外部資料來源對映到greenplum資料庫表,通過外部表的形式查詢外部資料來源。pxf可支援訪問的外部資料來源有hdfs,hive和hbase。其中可以對hdfs資料進行讀和寫操作。下面介紹pxf訪問hi...
單機安裝Greenplum的小結
總的流程參照同事的文章總算安裝上了,哈哈。也有其他同事的幫助,在此表示感謝。安裝過程中出現了一些錯誤,小結一下 安裝環境 centos 6.5 1 ssh connect to host localhost port 22 connection refused ssh服務沒有啟動,service s...
oracle和greenplum的比較
oracle rac oracle資料庫的查詢速度要比gp資料庫的查詢速度慢4倍左右 gp用1分鐘查詢出結果,oracle需要4分鐘,甚至更長,甚至無法返回查詢結果。greenplum的並行效率還是不錯滴!對於抱怨oracle速度慢的同學們,不妨研究研究gp hadoop。場景不同,gpdb是ola...