學習pandas筆記
數模期間用到了這個,就先記錄一下用法之類的
# pandas 是匯入的資料主要是乙個dataframe格式的資料,處理資料的時候也是對他進行處理
# dataframe的索引由 index(行)和columns(列)組成,行與列都可以賦予乙個名字(可為中文)
import pandas as pd
import numpy as np
pd.read_excel(
"excel_file"
)# 匯入excel檔案
with pd.excelfile(
"excel_file"
)as xls:
df1 = pd.read_excel(xls,
"sheet1"
)# 匯入某乙個excel檔案的某乙個**
df1.to_excel('')
# 匯出excel
df2 = pd.dataframe(
)# 建立乙個新的空dataframe
df = pd.dataframe(np.random.randn(4,
3), columns=
list
('bde'
), index=
['utah'
,'ohio'
,'texas'
,'oregon'])
# df的引用,賦值
df1.loc[
"index"
,"columns"]=
"something"
# index和columns厘公尺至少有乙個為str格式
df1.iloc[1,
2]="something"
# iloc的索引必須為數字
df1[
"columns"]=
"a_series"
# df['columns']是乙個series型別
df1[
'columns'
].isin(
['waste'])
# 選取某一列裡面值為『waste』的那些行
# example: df1 = df1[~(df1['發票狀態'].isin(['作廢發票']))]
# 去除df裡面,發票狀態一列為作廢發票的幾行 ~ 表示取反
df['values'
]= df.
(lambda x: x.
max(
)-x.
min())
# 提取所有列中的最大值和最小值並相減
df1[
"開票月份"
]= df1[
"開票日期"].
(lambda x: x.strftime(
'%y-%m'))
# 對於邏輯簡單的,也可以直接使用 df1["開票月份"] = df1["開票日期"].strftime('%y-%m')
# groupby 函式:可以參考這篇文章:
# 這是乙個分類函式,依據輸入的引數進行分類.在將**合併出現各種問題的時候,可以試下使用這個,可以參考國賽的 資料處理_資料融合.py 檔案
# 關於行列索引
# 1.初始化的時候可以設定
df.reset_index(
)# 2.將現有的列索引取消,並作為普通的一列
df.set_index(
)# 3.將某一列設為列索引
df.index # 獲取列索引
df2 = df2.sort_values(by=
'月份'
)# # 排序 按月份這一列進行排序
df['columns'
].tolist(
)# 轉為list
list
(set
(df[
'columns'])
)
學習筆記1
struct test test int x void fun class test1 test1 int x void fun int main void test1 a 行1 a.fun 行2 test1 b 行3 b.fun 行4 test c 行5 c.fun 行6 test d 行7 d....
學習筆記1
1 字串原地逆序 使用臨時變數 void reverse string s 5 求平均值 避免溢位 int f int x,int y 6 楊氏矩陣 bool young int a m n int x return false 7 十進位制轉十六進製制 string decimaltohexade...
學習筆記1
第二單元 linux的基本操作 1.改變使用者的密碼 passwd命令 注 a.只有root使用者可以修改其他使用者的密碼。普通使用者只能修改自己的密碼,且密碼必須設定地較為複雜,否則修改不成功 b.若執行passwd命令時後面不加使用者名稱,表示的是修改當前使用者的密碼。2.系統使用者的分類 注 ...