python資料探勘01 python基礎

2021-08-10 14:48:21 字數 2213 閱讀 6008

1.lambda定義行內函式

f=lambda x: x+2

#定義函式f(x)= x+2

g=lambda x,y:x+y #定義函式g(x,y)=x+y

2.資料結構(1)列表和元組

列表方括號:a=[1,2,3] 元組圓括號b=(4,5,6) 。下標從0開始。

注意:列表可修改,元組不可修改。

cmp(a,b):比較元素

len(a):返回列表元素個數

max(a):返回最大值

min(a):最小值

sum(a):求和

sorted(a):公升序排序

列表方法:

a.count(1):統計列表出現1的次數

a.extend([1,2]):將列表[1,2]的內容加到列表a末尾

a.index(1):從列表中找出第乙個1的索引位置

a.insert(2,1):將1插入列表a的索引為2的位置

a.pop(1):移除列表中索引為1的元素

列表解析:

a=[1,2,3]

b=for i in

a:

可以簡化到

a=[1,2,3]

b=[i+2 for i in a]

(2)字典

d=

d['today'] #值為20

其他建立字典的方法:

dict([['today',20],['tomorrow',31]])

dict.fromkeys(['today',tomorrow],20)

(3)集合

**注意:1.集合中的元素不重複,而且是無序的

2.不能索引**

建立集合:

s= #2會自動去重,得到

s=set

集合運算:

a=t|s #t和s的並集

b=t&s #交集

c=t-s #差集

d=t^s #對稱差集(項在t或s中,但不會同時出現在二者中)

(4)函式式程式設計

lambda(), map() , reduce(), filter()

01.map():

a=[1,2,3]

b=map(lambda x:x+2,a)

b=list(b) #結果是[3,4,5]

02.reduce():map用於逐一遍歷,reduce用於遞迴計算。

相當於:

s=1

for i in range (1,n+1):

s=s*i

filter(): 過濾器,篩選出列表中符合條件的元素。

b=filter(lambda x:x>5

and x<8,range(10))

b=list(b) #結果為[6,7]

2.導入庫(1) import math

math.sin(1)

(2) 起別名

import math as m

m.sin(1)

(3)匯入部分函式

from math import exp as e

e(1)

sin(1) #出錯,因為沒被匯入

(4)直接導入庫中所以函式

from math import *

exp(1) #容易引起命名衝突

(5)匯入future特徵維持相容性

fromfutureimport print_funtion

fromfutureimport division

資料探勘筆記 01

資料探勘步驟 資料準備 資料探索 模型建立 模型評估 模型部署 資料探勘方法分類 關聯 回歸 分類 聚類 診斷 資料準備 資料收集 資料質量分析 資料預處理 資料探索 資料視覺化 資料降維 資料統計 衍生變數 關聯方法 apriori fp growth 回歸方法 一元回歸 多元回歸 逐步回歸 lo...

python資料探勘面試 位元組跳動資料探勘面試總結

1.資料探勘任務 使用者常住城市 2.資料倉儲任務 演出主藝人名標籤挖掘 3.mapreduce原理 4.mapreduce特別慢的原因 4.1 計算機效能 cpu 記憶體 磁碟健康 網路 4.2 i o操作優化 資料傾斜 map reduce數設定不合理 reduce等待過久 小檔案過多 大量的不...

python資料分析與挖掘實戰 資料探勘基礎

從大量資料 包括文字 中挖掘出隱含的 未知的 對決策有潛在價值的關係 模式和趨勢,並用這些知識和規則建立用於決策支援的模型,提高 性決策支援的方法 工具和過程,就是資料探勘 它是利用各種分析工具在大量資料中尋找其規律和發現模型與資料之間關係的過程,是統計學 資料庫技術和人工智慧技術的綜合。1.定義挖...