在github上發現了乙個不錯的教程:
雖然是全英文的,找了下沒有翻譯的版本,但還是決定看這個。
寫個部落格記些筆記。
昨天晚上看了第一張引子,大概說了下為啥用python,jupyter,他們的好處和新特性,以及如何安裝,沒有啥特別的,中文講這內容的很多。
1.1
直接通過anaconda可以開啟jupyter
右上角new可以新建乙個notebook,教程中用了「通過ipython kernel」,這個詞糾結了下,但似乎沒啥影響
也可以新建乙個終端,但我在終端裡列印hello world 報錯:無法初始化裝置prn
暫沒解決,先不糾結
!dir 直接執行shell命令
magic commands 通過 %lsmagic 檢視
例如
%%writefile test.txt
hello world!
writing test.txt
# let's check what this file contains.
with open('test.txt', 'r') as f:
print(f.read())
hello world!
這樣可以建立乙個文字並寫入內容
加問號獲得幫助,比如:%run?
其他的一些工具介紹:
nbconvert
nbviewer
jupyterlab
nteract
hydrogen
juno
其中有的教程後面可能會涉及
1.2 這節以乙個例子為例講了幾個函式
先import
在從乙個url裡獲得csv的資料
describe()函式可以獲得一些常規統計值
然後畫兩條街的數量折線圖
按星期統計彙總每條街的數量 groupby
其中發現日期格式的index,沒有weekday_name這個屬性,只有weekday,有時間查下原因
然後畫彙總好的各個街的折線圖
最後乙個例子沒看明白,用@interact把第一張圖變得平和
1.3這節是通過幾個運算來說明numpy的運算速度優於python
例子沒耐心乙個個敲一遍了
最後原理也懶得看透,跟我學的內容關係不大,看英文畢竟累。
學習目的更直接簡單些,不要為了「完美」拖了程序。
python資料分析1
1.3檢視列 行 單元格 為啥要用python中的pandas庫進行資料分析,用excel不可以嗎?不可以,excel處理上萬條資料時通常會宕機或者出錯,python不會有這種問題。相信鯉魚學長,在學習乃至日後工作中,pandas庫將會風靡相當長一段時間。示例 pandas 是基於numpy 的一種...
python資料分析基礎1
filter 函式用於過濾序列,過濾掉不符合條件的元素,返回由符合條件元素組成的新列表 接收兩個引數,第乙個為函式,第二個為序列,序列的每個元素作為引數傳遞給函式進行判斷,返回true或false,將返回true的元素放到新列表中。def ou n if n 2 0 return true else...
小白學 Python 資料分析(1) 資料分析基礎
人工植入廣告 ps 小編最近兩天偷了點懶,好久沒有發原創了,最近是在 csdn 開通了乙個付費專欄,用來發布去年寫的沒有出版的書稿,感興趣的同學可以去看下 已經上傳了一部分,第一章設定為了試讀章節 主要是講 springcloud 微服務方面的一些內容,整體排版下來如果是印在實體書上應該會超過 40...