pandans學習筆記1

2021-10-09 20:50:01 字數 1924 閱讀 7903

學習pandas筆記

數模期間用到了這個,就先記錄一下用法之類的

# pandas 是匯入的資料主要是乙個dataframe格式的資料,處理資料的時候也是對他進行處理

# dataframe的索引由 index(行)和columns(列)組成,行與列都可以賦予乙個名字(可為中文)

import pandas as pd

import numpy as np

pd.read_excel(

"excel_file"

)# 匯入excel檔案

with pd.excelfile(

"excel_file"

)as xls:

df1 = pd.read_excel(xls,

"sheet1"

)# 匯入某乙個excel檔案的某乙個**

df1.to_excel('')

# 匯出excel

df2 = pd.dataframe(

)# 建立乙個新的空dataframe

df = pd.dataframe(np.random.randn(4,

3), columns=

list

('bde'

), index=

['utah'

,'ohio'

,'texas'

,'oregon'])

# df的引用,賦值

df1.loc[

"index"

,"columns"]=

"something"

# index和columns厘公尺至少有乙個為str格式

df1.iloc[1,

2]="something"

# iloc的索引必須為數字

df1[

"columns"]=

"a_series"

# df['columns']是乙個series型別

df1[

'columns'

].isin(

['waste'])

# 選取某一列裡面值為『waste』的那些行

# example: df1 = df1[~(df1['發票狀態'].isin(['作廢發票']))]

# 去除df裡面,發票狀態一列為作廢發票的幾行 ~ 表示取反

df['values'

]= df.

(lambda x: x.

max(

)-x.

min())

# 提取所有列中的最大值和最小值並相減

df1[

"開票月份"

]= df1[

"開票日期"].

(lambda x: x.strftime(

'%y-%m'))

# 對於邏輯簡單的,也可以直接使用 df1["開票月份"] = df1["開票日期"].strftime('%y-%m')

# groupby 函式:可以參考這篇文章:

# 這是乙個分類函式,依據輸入的引數進行分類.在將**合併出現各種問題的時候,可以試下使用這個,可以參考國賽的 資料處理_資料融合.py 檔案

# 關於行列索引

# 1.初始化的時候可以設定

df.reset_index(

)# 2.將現有的列索引取消,並作為普通的一列

df.set_index(

)# 3.將某一列設為列索引

df.index # 獲取列索引

df2 = df2.sort_values(by=

'月份'

)# # 排序 按月份這一列進行排序

df['columns'

].tolist(

)# 轉為list

list

(set

(df[

'columns'])

)

學習筆記1

struct test test int x void fun class test1 test1 int x void fun int main void test1 a 行1 a.fun 行2 test1 b 行3 b.fun 行4 test c 行5 c.fun 行6 test d 行7 d....

學習筆記1

1 字串原地逆序 使用臨時變數 void reverse string s 5 求平均值 避免溢位 int f int x,int y 6 楊氏矩陣 bool young int a m n int x return false 7 十進位制轉十六進製制 string decimaltohexade...

學習筆記1

第二單元 linux的基本操作 1.改變使用者的密碼 passwd命令 注 a.只有root使用者可以修改其他使用者的密碼。普通使用者只能修改自己的密碼,且密碼必須設定地較為複雜,否則修改不成功 b.若執行passwd命令時後面不加使用者名稱,表示的是修改當前使用者的密碼。2.系統使用者的分類 注 ...