總結
flink中的狀態分為兩大類:
(1)managered state : 被flink所管理維護的狀態,可以直接使用。(常用)
①運算元狀態。(operator state)
②鍵控狀態。(keyed state)
(2)raw state:不被flink所管理,可以自己指定。比較複雜,控制底層邏輯可以使用。
狀態與運算元所繫結。運算元不會跨任務訪問其他運算元的狀態。
示例:pandas 是基於numpy 的一種工具,該工具是為了解決資料分析任務而建立的。
**如下(示例):
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.
filterwarnings
('ignore'
)import ssl
ssl._create_default_https_context = ssl._create_unverified_context
**如下(示例):
data = pd.
read_csv
('')print
(data.
head()
)
該處使用的url網路請求的資料。 Flink 狀態管理
有些任務的結果不僅僅依賴於當前的輸入,也依賴於之前的輸入結果資訊,因此對中間結果狀態等的儲存就很有必要。在flink中,我們可以這樣理解state 某task operator在某時刻的乙個中間結果。flink提供了豐富的狀態訪問介面和高效的容錯機制,當前flink中有兩個基本的state keye...
Flink的狀態管理與狀態後端
flink是乙個基於狀態計算的流計算服務。flink將所有的狀態分為兩大類 keyed state 與 operator state 所謂的keyed state指的是flink底層會給每乙個key繫結若干個型別的狀態值,特指操作 keyedstream中所涉及的狀態。所謂operator stat...
Flink狀態管理儲存
state一般指乙個具體的task operator的狀態。而checkpoint則表示了乙個flink job,在乙個特定時刻的乙份全域性狀態快照,即包含了所有task operator的狀態。儲存機制 statebackend 狀態後端 預設情況下,state 會儲存在 taskmanager ...