一、這次主要是pandas中的series部分的一些小知識點。
series:就是dateframe中的一行或者一列
dateframe:通過read.csv讀入形成的資料矩陣,由一系列的series結構組成
1.通過series結構對檔案進行讀取
2.讀取檔案進行索引
3.用series進行排序
#1.通過series結構對檔案進行讀取
fandango=pd.read_csv(r"d:\python.code(4)\2-pandas\fandango_score_comparison.csv")
series_film=fandango['film']
print(type(series_film))
print(series_film[0:5])#film列中,0到5行
series_rt=fandango["rottentomatoes"]
print(series_rt[0:5])# rottentomatoes列中,0到5行
#2.讀取檔案進行索引
from pandas import series
film_names=series_film .values
print(type(film_names))
print(film_names)
rt_scores=series_rt.values
print(rt_scores)
series_custom=series(rt_scores,index=film_names)#series將電影名(string)作為索引值
series_custom[['cinderella (2015)','top five (2014)']]
fiveten=series_custom[5:10]
print(fiveten)
#3.用series進行排序
original_index=series_custom.index.tolist()#索引轉化成列表
print(original_index)
sorted_index=sorted(original_index)#進行排序
sorted_by_index=series_custom.reindex(sorted_index)
print(sorted_by_index)
二、對於lambad 的講解:
lambad 表示式就是乙個函式,可以賦值給乙個變數,既然是表示式,可以參與運算。
lambda x: x * 2 這個匿名函式的形參是x,表示式x * 2的值就是這個函式的返回值。
>>>
lambda x: x ** 2
lambda> at 0x1007f7668>
>>> (lambda x: x ** 2)(2)
4>>> f = lambda x: x ** 2
>>> f(2)
4>>>
map(lambda x: x ** 2, range(1, 11))
結果是。
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]。
也可以這樣 f = lambda x: x ** 2
map(f, range(1, 11))
參考:
numpy中有關機器學習的一些知識點筆記1
這是第一部分關於numpy的一些基本操作 1.檔案的讀取以及help的用法 2.numpy中的核心操作結構array,檢視結構 3.要保證array裡面的元素是同一型別 4.檔案的讀取後的行列的讀取 5.列印多維矩陣的某一列或某一行 從0開始 6.判斷陣列裡面是否有這個值,對每乙個元素進行判斷 7....
林達華推薦有關機器學習的數學書籍
我想國內的大學生都會學過這門課程,但是,未必每一位老師都能貫徹它的精要。這門學科對於learning是必備的基礎,對它的透徹掌握是必不可少的。我在科大一年級的時候就學習了這門課,後來到了香港後,又重新把線性代數讀了一遍,所讀的是 introduction to linear algebra 3rd ...
有關機器學習的 12 個經驗教訓
這篇文章講述了機器學習研究人員和從業人員總結的 12 個關鍵經驗教訓,包括如何避免陷阱,重點問題以及常見問題的答案。機器學習可以通過一些例子,然後從中歸納出規律來解決重要問題。在手動程式設計 硬編碼 不使用的情況下,這種方法通常是非常有效的,而且非常經濟。隨著更多的資料可以使用,我們可以解決更多雄心...