Python dataframe的對應列求差值

2021-08-22 13:32:31 字數 2058 閱讀 4917

需求:求兩txt檔案對應city『數量』列的差值(airbnb_city1.txt - airbnb_city.txt)

資料展示:

import pandas as pd

# 如果沒有列名 使用header=none names=['colums']指定

data_city = pd.read_csv('../datasets/airbnb_city.txt', header=0)

data_city1 = pd.read_csv('../datasets/airbnb_city1.txt', header=0)

print(data_city.head(10))

print(data_city1.head(10))

結果:

城市     數量

0 成都市 10673

1 杭州市 8310

2 廣州市 8287

3 廈門市 7491

4 西安市 6027

5 深圳市 5876

6 朝陽區 5669

7 蘇州市 5400

8 青島市 5004

9 浦東新區 4642

城市 數量

0 上海市 16668

1 北京市 13443

2 成都市 10690

3 杭州市 8316

4 廣州市 8281

5 廈門市 7502

6 重慶市 6670

7 香港特別行政區 6348

8 西安市 6025

9 深圳市 5872

**:

data_merge = pd.merge(data_city1, data_city, on='城市', how='outer')

data_merge.fillna(0, inplace=true)

data_merge['差值'] = data_merge['數量_x'] - data_merge['數量_y']

data_merge[['數量_x', '數量_y', '差值']] = data_merge[['數量_x', '數量_y', '差值']].astype('int')

data_merge = data_merge.sort_values(by='差值', ascending=false)

data_merge.to_csv('../datasets/city.txt', index=false)

print(data_merge)

結果:

城市   數量_x   數量_y     差值

0 上海市 16668 0 16668

1 北京市 13443 0 13443

6 重慶市 6670 0 6670

7 香港特別行政區 6348 0 6348

23 天津市 1459 0 1459

48 澳門特別行政區 519 0 519

2 成都市 10690 10673 17

...352 靜安區 0 1838 -1838

351 東城區 0 2058 -2058

350 徐匯區 0 2393 -2393

349 黃浦區 0 2451 -2451

348 油尖旺區 0 2912 -2912

347 渝中區 0 3329 -3329

346 浦東新區 0 4642 -4642

345 朝陽區 0 5669 -5669

python DataFrame合併方法

python 合併dataframe方法 dataframe.merge left,right,how inner on none,left on none,right on none,left index false,right index false,sort false,suffixes x ...

python dataframe數值替換

需求 將csv檔案中的值為 8888的因子值替換為當日全市場因子的中值 原始資料 解析 實現 import pandas as pd def filter2median invalid number with open r c users administrator documents wechat...

Python Dataframe 兩列相除

import pandas as pd df pd.read csv 離線資料.csv 新建乙個dataframe df data pd.dataframe columns 總數 人數 平均值 df data 總數 人數 df df data 平均值 df data.lambda x x 總數 x ...