在理解如何將資料重新取樣為小時速率而不是現在的4小時資料塊時,仍被困在一項任務上。這是我們要求做的。在
差異entries和exits欄位儲存每週不重置為零的原始計數。我們想知道4小時內有多少出入口。要計算這個值,我們需要計算具有相同(unit,c/a,scp)鍵的相鄰行之間的差異。建立儲存這些數字的num_entries和num_exits列。在
移位法很有用。
在進行轉換時使用groupby會更容易,因為它會尊重子單元之間的邊界。level引數將幫助定義子單元。
大多數計數器都是遞增的,但也有一些是倒計時的。你應該如何處理這些案件?把這個修好以獲得額外的學分。在
這是**,我有它被要求重取樣的部分df = pd.read_csv("turnstile_161126.txt")
timestamp =pd.to_datetime(df['date'] + ' ' + df['time'])
df.insert(3, 'timestamp', timestamp)
df.columns = df.columns.str.strip()
df = df.set_index(['unit','c/a','scp','timestamp'])
df['num_entries'] = df.entries - df.entries.shift(1)
df['num_exits'] = df.exits - df.exits.shift(1)
station linename division date time desc entries exits num_entries num_exits
unit c/a scp timestamp
r051 a002 02-00-00 2016-11-19 03:00:00 59 st nqr456w bmt 11/19/2016 03:00:00 regular 5924658 2007780 nan nan
2016-11-19 07:00:00 59 st nqr456w bmt 11/19/2016 07:00:00 regular 5924672 2007802 14.0 22.0
2016-11-19 11:00:00 59 st nqr456w bmt 11/19/2016 11:00:00 regular 5924738 2007908 66.0 106.0
2016-11-19 15:00:00 59 st nqr456w bmt 11/19/2016 15:00:00 regular 5924979 2007980 241.0 72.0
2016-11-19 19:00:00 59 st nqr456w bmt 11/19/2016 19:00:00 regular 5925389 2008056 410.0 76.0
2016-11-19 23:00:00 59 st nqr456w bmt 11/19/2016 23:00:00 regular 5925614 2008081 225.0 25.0
2016-11-20 03:00:00 59 st nqr456w bmt 11/20/2016 03:00:00 regular 5925684 2008096 70.0 15.0
2016-11-20 07:00:00 59 st nqr456w bmt 11/20/2016 07:00:00 regular 5925688 2008113 4.0 17.0
2016-11-20 11:00:00 59 st nqr456w bmt 11/20/2016 11:00:00 regular 5925755 2008191 67.0 78.0
2016-11-20 15:00:00 59 st nqr456w bmt 11/20/2016 15:00:00 regular 5925937 2008260 182.0 69.0
2016-11-20 19:00:00 59 st nqr456w bmt 11/20/2016 19:00:00 regular 5926232 2008332 295.0 72.0
2016-11-20 23:00:00 59 st nqr456w bmt 11/20/2016 23:00:00 regular 5926394 2008367 162.0 35.0
2016-11-21 03:00:00 59 st nqr456w bmt 11/21/2016 03:00:00 regular 5926425 2008378 31.0 11.0
2016-11-21 07:00:00 59 st nqr456w bmt 11/21/2016 07:00:00 regular 5926440 2008420 15.0 42.0
2016-11-21 11:00:00 59 st nqr456w bmt 11/21/2016 11:00:00 regular 5926622 2008741 182.0 321.0
2016-11-21 15:00:00 59 st nqr456w bmt 11/21/2016 15:00:00 regular 5926872 2008851 250.0 110.0
2016-11-21 19:00:00 59 st nqr456w bmt 11/21/2016 19:00:00 regular 5927775 2008927 903.0 76.0
2020 09 05降取樣和公升取樣的理解
降取樣 在做降取樣處理時,是先濾波,還是先降取樣,二者有區別嗎?在訊號的處理過程中,對於同樣地一段訊號,先降取樣再濾波和先濾波,再降取樣,有區別嗎?首先丟擲結論 先濾波,後抽取。原理很簡單,上面已經有知友回答了,一句話就能概括,如果抽取時不先做濾波,就會導致訊號混疊。這時,我們會多問一句 1.如果不...
語義分割 上取樣 插值 resize的學習筆記
2 反卷積 基於引數學習的渲染插值方法 3 interpolate tranform 現在最好用的插值方法是雙三次插值,在pil中可以指定pil.image.bicubic引數來使用雙三次插值 bilinear是一種使用十分廣泛的插值演算法 1.2.1 bilinear的pil實現 resize p...
Python資料分析 時間序列 重取樣
目錄將時間序列從乙個頻率轉換為另乙個頻率的過程,且會有資料的結合。降取樣 高頻資料 低頻資料,例如 以月為頻率的資料轉為以年為頻率的資料 公升取樣 低頻資料 高頻資料,例如 以年為頻率的資料轉為以月為頻率的資料 重取樣 resample 建立乙個以天為頻率的timeseries,重取樣為按2天為頻率...