學習週期:6.3-6.8
學習時長:
6.4 -寫作業,請教同事
6.5 1h40m(08:50-09:30, 22:40-23:00) -chap10
6.6 -寫作業(學習特徵交叉、特徵離散化)
6.7 -0h pdpdpd
6.8 1h(08:50-09:30, 23:20-23:40) -chap10
6.10 5h(11:00-14:00,21:30-22:30) -chap10 re
6.11 2h(08:50-09:40,20:00-21:00) -chap10 re
6.12 2h40m (08:50-09:30, 15:30-17:00) -chap11
學習內容:
- 一句話心得:在做作業的過程中培養了自己的動手能力,吊炸天的是pandas竟然有資料透視表的功能,pd.pivot_table()。真實碉堡了!
- 《python基礎教程》看到chap11,後面的知識和資料處理無關,另需要補充資料處理相關的知識。這部分打算通過檢視同事的**和學習機器學習相關模型的**來積累和記錄。
如何在pycharm同時執行多個例項/session(指令碼)
pycharm預設在當前視窗中執行指令碼,如果當前視窗的指令碼還在執行過程中,則會生成新的視窗。因此可以通過人為設定 time.sleep(second) 指令來控制指令碼的輸出時間,進而生成新的session,然後在不同session的視窗下執行不同的指令碼。如下圖:
pandas有很多豐富的內建函式,但前提是需要把資料讀到記憶體中,適合處理小量取樣資料,大資料的資料預處理特徵需要通過sql,或編寫udf 進行分布式處理。資料集可存在本地的csv中。
常用的演算法包 sklearn、xgboost的函式原始**可以通過檢視相應的git專案來學習原始碼。
if __name__ == '__main__'
dir(copy)
copy.all在編寫模組的時候,像設定all這樣的技術是相當有用的。因為模組中可能會有一大堆其他程式不需要或不想要的變數、函式和類,all會「客氣地」將它們過濾出去。如果沒有設定all,用import*語句預設將會匯入模組中所有不以下劃線開頭的全域性名稱。
幫助:help(copy.copy)
文件:print copy.copy.doc源**:print copy.file
2.os:提供訪問多個作業系統服務的功能
lineno:當前累計行數
filelineno:當前檔案的行數
4.集合、堆和雙端佇列 什麼情況下會用?
5.time:獲得當前時間、操作時間和日期、從字串讀取時間以及格式化時間為字串。日期可以用實數,或包含9個整數的元組(年月日、時分秒、周、當年的第n天、夏令時)
6.random:產生隨機數、模擬任何產生隨機輸出的程式。偽隨機。
values = range(1,11)+'j q k'.split()
suits = 'diamonds clubs hearts spades'.split()
deck = ['%s of %s' %(v,s) for v in values for s in suits]
#洗牌random.shuffle(deck)
字符集(character set):』[a-z]』
選擇符和子模式(subpattern):』python|perl』 , 『p(ython|erl)』,
開頭匹配:』^ht+p』,結尾匹配:』$ht+p』
re的函式
pattern = re.compile(r'.*?([a-z]+)$', re.i)
m = pattern.match('hello world wide web')
# m=none
- 參考:runoob:
- 模板系統,string模組中的template類
- 其他標準庫
- csv:逗號分隔值,comma-separated values
- timeit、profile、trace:測試**使用
記得關閉檔案,f.close()
read()、readline()、readlines()返回list
通過fileinput實現懶惰行迭代
import fileinput
forline
in fileinput.input(filename):
process(line)
python基礎教程
乙個簡單的客戶機 import socket s socket.socket host socket.gethostname port 1234 s.bind host,port s.listen 5 while true c,addr s.accept print got connection f...
Python基礎教程
本教程不包括python的安裝,ide採用spyder pytho2.7 1.print pow 2,3 8 print 2 3 8這裡pow函式表示乘方,與 功能相同。2.abs 10 10abs函式用來求乙個數的絕對值。3.round 0.6 1.0 round 0.4 0.0round函式將浮...
Python 基礎教程
python由guido van rossum於1989年底發明,第乙個公開發行版發行於1991年。像perl語言一樣,python 源 同樣遵循 gpl gnu general public license 協議。本教程主要針對python 2.x版本的學習,如果你使用的是python 3.x版本...