Presto簡介(附格式轉換)

2021-09-12 17:38:38 字數 1243 閱讀 6534

------歡迎來到presto的世界 biu biu biu ~------

presto 鎮樓

wiki位址來一波:presto

本人使用presto,感覺飛一般的感覺。

presto 是乙個工具,被用來通過分布式查詢來有效的查詢大量的資料。presto 是乙個可選的工具,可以用來查詢 hdfs,通過使用 mapreduce 的作業的流水線,例如 hive,pig,但是又不限於查詢 hdfs 資料,它還能查詢其他的不同資料來源的資料,包括關聯式資料庫以及其他的資料來源,比如 cassandra;

presto 被設計為處理資料倉儲和分析:分析資料,聚合大量的資料並產生報表,這些場景通常被定義為 olap。

主要是各種格式轉換,本人表(table)中所有資料均是string格式,所有的格式均需要轉換:

舉個栗子,如下

select

'num_07d' as zhibiao,

zb,num,

num_all,

cast(num as double) / cast(num_all as double) as ration

from

(select

index_a as zb,

count(id) as num

from

table

where

dp = 'active'

and cast(split(create_time, ' ') [1] as date) <= cast(sysdate(-2) as date)

and cast(split(create_time, ' ') [1] as date) >(cast(sysdate(-2) as date) - interval '7' day)

group by

index_a)a,

(select

count(id) as num_all

from

table

where

dp = 'active'

and cast(split(create_time, ' ') [1] as date) <= cast(sysdate(-2) as date)

and cast(split(create_time, ' ') [1] as date) >(cast(sysdate(-2) as date) - interval '7' day)

)b

大資料分析引擎之presto簡介

簡介 presto是乙個大資料分析引擎,不屬於hadoop體系,他是基於記憶體的。他的集群模式是主從式的。他可以與任何的大資料儲存引擎做整合,整合的時候使用它的connectors整合 從這裡我們可以他可以和kafka mysql 記憶體 hive來做整合 安裝 1.解壓 tar zxvf pres...

分割槽格式簡介

分割槽格式如下 詳細請看 gpt的全稱是globally unique identifier partition table,意即guid分割槽表,它的推出是和uefi bios相輔相成的,鑑於mbr的磁碟容量和分割槽數量已經不能滿足硬體發展的需求,gpt首要的任務就是突破了2.2t分割槽的限制,最...

MPO格式簡介

mpo multi picture object 一種計算機上的3d影象格式。在過去幾年中,由於立體影象的使用越來越多,科學界已經花費了很多努力來開發用於立體影象壓縮的演算法。數位相機如富士finepix real 3d系列拍攝的立體影象 包含兩個jpg併排的一面,這是由數位相機上的兩個鏡頭拍攝的 ...