防止忘記,在此做個記錄
目錄:1.讀取csv讀取csv
篩選排序
寫入csv(解決中文亂碼引數:encoding='utf_8_sig')
import pandas as pd
file = pd.read_csv(r'd:\projects\pycharmprojects\final_wangwei\final_news_all.csv', usecols=['entity_id', 'post_title','publish_year','publish_month'])
2.根據列值篩選
news=file[((file['publish_year']==2018) & (file['publish_month']>4))|((file['publish_year']==2019) & (file['publish_month']<5))]
3.根據某列值排序(公升序)
news=news.sort_values('publish_month',ascending=true)
4.對於pandas.core.frame.dataframe提取某列,並轉換為list
news['entity_id'].values.tolist()
5.根據某列統計
news['publish_month'].value_counts()
6.讀取txt,concat
df_empty = pd.dataframe(columns=['doc'])
data1=pd.read_csv('linshi/5079161.txt',names=["doc"])
df=pd.concat([df_empty,data1,data2,data3,data4]
,axis=0) #縱向
7.獲取當前時間
import time
print(time.strftime('%y-%m-%d %h:%m:%s',time.localtime(time.time())))
8.按行建立dataframe
sdp=pd.dataframe.from_items([('months',months),('shoucangs',shoucangs),('dianzans',dianzans),('pingluns',pingluns)])
ubuntu中常用的小東西
大多針對ubuntu,自己記載的比較實用的東西,不全但是有針對性!慢慢加,慢慢用.1 sudo apt get install 獲取並安裝 sudo apt get remove 刪除 sudo apt get autoremove 自動刪除無用包 sudo apt cache search pac...
做完小東西
想一想,時間過得挺快的,暑假的三分之一就這樣過去了。從工學一號館斷網開始我已經好些天沒更新部落格了。一是自己發懶,二是在做那個練手的小工具沒去想這個。今晚交完專案,塵埃落定,說說這些天的情況和想法。團隊不是天生的,是需要磨合的。我和健輝意見不同的時候挺多的,有時兩個人都挺固執的,就認為自己說的對,這...
oracle 小東西記錄
alter table table name modify id number 修改列型別 alter table table name add state number 新增列 sysdate 直接插入當前時間 to date 2013 06 26 23 59 59 yyyy mm dd hh24...