series和dataframe上手都很容易,但是深入理解一下還是有必要的——磨刀不誤砍柴工嘛
import pandas as pd
df = pd.read_clipboard(
)
開啟國家統計局網頁,複製乙個**,然後讀取貼上板,easy
df
指標地區
資料時間
數值所屬欄目
相關報表
0居民消費**指數(上月=100)
全國2023年10月
100.9
月度資料
相關報表
1居民消費**指數(上月=100)
全國2023年10月
nan月度資料
相關報表
2居民消費**指數(1978=100)
全國2023年
650.9
年度資料
相關報表
3居民消費**指數(1978=100)
全國2023年
637.5
年度資料
相關報表
4居民消費**指數(上年同月=100)
全國2023年10月
103.8
月度資料
相關報表
5居民消費**指數(上年同月=100)
全國2023年10月
nan月度資料
相關報表
6居民消費**指數(上年同期=100)
全國2023年10月
102.6
月度資料
相關報表
7居民消費**指數(上年同期=100)
全國2023年10月
nan月度資料
相關報表
8居民消費**指數(上年=100)
全國2023年
102.1
年度資料
相關報表
9居民消費**指數(上年=100)
全國2023年
101.6
年度資料
相關報表
10城市居民消費**指數(上年同月=100)
全國2023年10月
103.5
月度資料
相關報表
11城市居民消費**指數(上年同月=100)
全國2023年10月
nan月度資料
相關報表
空值對資料分析是沒有意義的,我們先去掉
df1 = df.dropna(axis=
0)
df1
指標地區
資料時間
數值所屬欄目
相關報表
0居民消費**指數(上月=100)
全國2023年10月
100.9
月度資料
相關報表
2居民消費**指數(1978=100)
全國2023年
650.9
年度資料
相關報表
3居民消費**指數(1978=100)
全國2023年
637.5
年度資料
相關報表
4居民消費**指數(上年同月=100)
全國2023年10月
103.8
月度資料
相關報表
6居民消費**指數(上年同期=100)
全國2023年10月
102.6
月度資料
相關報表
8居民消費**指數(上年=100)
全國2023年
102.1
年度資料
相關報表
9居民消費**指數(上年=100)
全國2023年
101.6
年度資料
相關報表
10城市居民消費**指數(上年同月=100)
全國2023年10月
103.5
月度資料
相關報表
指定axis引數是常見操作,0代表效果產生於行,1代表效果產生於列
seri1 = df1[
'指標'
]
seri2 = df1[
'資料時間'
]seri3 = df1[
'數值'
]
seri1
0 居民消費**指數(上月=100)
2 居民消費**指數(1978=100)
3 居民消費**指數(1978=100)
4 居民消費**指數(上年同月=100)
6 居民消費**指數(上年同期=100)
8 居民消費**指數(上年=100)
9 居民消費**指數(上年=100)
10 城市居民消費**指數(上年同月=100)
name: 指標, dtype: object
nw_df = pd.dataframe(
[seri1,seri2,seri3]
)
nw_df
02
3468
910指標居民消費**指數(上月=100)
居民消費**指數(1978=100)
居民消費**指數(1978=100)
居民消費**指數(上年同月=100)
居民消費**指數(上年同期=100)
居民消費**指數(上年=100)
居民消費**指數(上年=100)
城市居民消費**指數(上年同月=100)
資料時間
2023年10月
2023年
2023年
2023年10月
2023年10月
2023年
2023年
2023年10月
數值100.9
650.9
637.5
103.8
102.6
102.1
101.6
103.5
nw_df.t
指標資料時間數值0
居民消費**指數(上月=100)
2023年10月
100.9
2居民消費**指數(1978=100)
2023年
650.9
3居民消費**指數(1978=100)
2023年
637.5
4居民消費**指數(上年同月=100)
2023年10月
103.8
6居民消費**指數(上年同期=100)
2023年10月
102.6
8居民消費**指數(上年=100)
2023年
102.1
9居民消費**指數(上年=100)
2023年
101.6
10城市居民消費**指數(上年同月=100)
2023年10月
103.5
dic =
df2 = pd.dataframe(dic)
df2
張三李四王五0
6056781
合格不及格
良好
df2.t
01
張三60
合格李四
56不及格
王五78良好
從上我們看到series和dict可以互相轉換,但是兩者資訊量不是完全對稱的
nw_df = pd.dataframe([[
'張',
'王',
'李'],[
34,56,
67],[
'不及格'
,'不及格'
,'及格']]
)
nw_df
01
20張王
李13456672
不及格不及格
及格
df4 = pd.dataframe([,
,,])
df4
姓名成績評級0
錢謙益34
不及格1
李瓊67及格2
譚耀祖97
優秀
深入理解C語言 深入理解指標
關於指標,其是c語言的重點,c語言學的好壞,其實就是指標學的好壞。其實指標並不複雜,學習指標,要正確的理解指標。指標也是一種變數,占有記憶體空間,用來儲存記憶體位址 指標就是告訴編譯器,開闢4個位元組的儲存空間 32位系統 無論是幾級指標都是一樣的 p操作記憶體 在指標宣告時,號表示所宣告的變數為指...
mysql 索引深入理解 深入理解MySql的索引
為什麼索引能提高查詢速度 先從 mysql的基本儲存結構說起 mysql的基本儲存結構是頁 記錄都存在頁裡邊 各個資料頁可以組成乙個雙向鍊錶每個資料頁中的記錄又可以組成乙個單向鍊錶 每個資料頁都會為儲存在它裡邊兒的記錄生成乙個頁目錄,在通過主鍵查詢某條記錄的時候可以在頁目錄中使用二分法快速定位到對應...
深入理解C語言 深入理解指標
關於指標,其是c語言的重點,c語言學的好壞,其實就是指標學的好壞。其實指標並不複雜,學習指標,要正確的理解指標。指標也是一種變數,占有記憶體空間,用來儲存記憶體位址 指標就是告訴編譯器,開闢4個位元組的儲存空間 32位系統 無論是幾級指標都是一樣的 p操作記憶體 在指標宣告時,號表示所宣告的變數為指...