3 **耗時
pandas 時間格式
df[
'time'
]= pd.datetime(df[
'time'])
# 方法1
df['time'
]= df[
'time'
].astype(
'datetime64[ns]'
)# 方法2
import datetime
# 今天的日期,獲取當日年月日
today = datetime.datetime.now(
)# 日期格式到天
a1 = today .strftime(
"%y-%m-%d"
)# 2018-10-10
# 日期加減天數,加一天為1,減一天是-1
num =
1a2 =
(a+datetime.timedelta(days=num)
).strftime(
"%y-%m-%d"
)# 2018-09-12
輸入結果如下:
2020-11
-3015:
55:23.929317
2020-11
-302020-12
-01
(1)獲取當前月的日期,指定為當月的1號。獲取月,指定日。
day = datetime.datetime.now(
).replace(day=
1)
(2)獲取年,年月, 季度,月,周,日
df_s[
'year']=
[i.year for i in df_s[
'開始時間']]
df_s[
'year_month']=
[datetime.datetime.strftime(i,
'%y-%m'
)for i in pd.to_datetime(df_s[
"開始時間"])
]df_s[
'quarter']=
[i.quarter for i in pd.to_datetime(df_s[
"開始時間"])
]df_s[
'month']=
[i.month for i in df_s[
'開始時間']]
df_s[
'week']=
[i.weekday(
)for i in df_s[
'開始時間']]
df_s[
'day']=
[i.day for i in df_s[
'開始時間'
]]
(3)獲得當月第幾周
import datetime
defget_week_of_month
(year, month, day)
:""" 獲取指定的某天是某個月中的第幾周 周一作為一周的開始 """
end =
int(datetime.datetime(year, month, day)
.strftime(
"%w"))
begin =
int(datetime.datetime(year, month,1)
.strftime(
"%w"))
return end - begin +
1print
(get_week_of_month(
2019,9
,4))
# 消耗多少秒
starttime = datetime.datetime.now(
) endtime = datetime.datetime.now(
)print
((endtime - starttime)
.seconds)
持續更新, 資料預處理總結1
使資料服從標準正態分佈,均值為0,方差為1。做資料探勘,pandas和numpy庫肯定是要引入的,這裡就省略了。from sklearn.preprocessing import standardscaler import warnings warnings.filterwarnings ignor...
資料預處理方法總結
資料是什麼?資料就是一組物件及其屬性的集合,其中屬性定義為物件的特徵或性質。真實資料在應用前基本都有經過預處理,以便在機器學習演算法中使用。本次資料預處理方法的總結是基於推薦系統設計進行展開的,其中包括相似度的度量方法 抽樣以及降維技術這三個尤為重要的問題。d x y k 1 n xk yk 2 x...
資料預處理方法總結
資料是機器學習的原料,機器學習是通過對資料的訓練才得到某種特性的。因此正確的預處理資料對模型結果的輸出尤為重要。一 資料可能存在的問題 資料一開始可能有資料重複,資料缺失,資料存在異常值等情況。二 資料預處理的步驟 資料處理主要包括資料的清洗,資料的轉化.資料描述,特徵選擇和特徵抽取這幾個步驟。1 ...