Python資料分析 6

2021-10-04 03:30:37 字數 2486 閱讀 4043

3. 資料處理、清洗

f =

open

('商鋪資料.csv'

if'條'

in s:

return

int(s.split(

' ')[0

])else

:return

'缺失資料'

def

fprice

(s):

if'¥'

in s:

return

float

(s.split(

'¥')[-

1])else

:return

'缺失資料'

def

fcommentl

(s):

if' '

in s:

quality =

float

(s.split(

' ')[

0][2

:]) environment =

float

(s.split(

' ')[

1][2

:]) service =

float

(s.split(

' ')[

2][2

:-1]

)return

[quality,environment,service]

else

:return

'缺失資料'

以前三十行資料為列

datalist =

# 建立空列表

f.seek(0)

n =0

# 建立計數變數

for i in f.readlines()[

1:30]

: data = i.split(

',')

#print(data)

classify = data[0]

# 提取分類

name = data[1]

# 提取店鋪名稱

comment_count = fcomment(data[2]

) star = data[3]

# 提取星級

price = fprice(data[4]

)# 提取人均

address = data[5]

# 提取位址

quality = fcommentl(data[6]

)[0]

# 提取質量評分

env = fcommentl(data[6]

)[1]

# 提取環境評分

service = fcommentl(data[6]

)[2]

# 提取服務評分

if'缺失資料'

notin

[comment_count, price, quality]

:# 用於判斷是否有資料缺失

n +=

1 data_re =[[

'classify'

,classify],[

'name'

,name],[

'comment_count'

,comment_count],[

'star'

,star],[

'price'

,price],[

'address'

,address],[

'quality'

,quality],[

'environment'

,env],[

'service'

,service]

]dict

(data_re)

)#字典生成,並存入列表datalist

print

('成功載入%i條資料'

%n)else

:continue

print

(datalist)

print

('總共載入%i條資料'

%n)

python資料分析

以網路爬蟲為例,網路爬蟲是乙個自動提取網頁的程式,爬蟲是搜尋引擎的第一步,也是最容易的一部。網頁搜尋,建立索引,查詢排序 用c c 效率高,速度塊,適合通用搜尋引擎做往往爬取。但是它的缺點也特別明顯 開發慢,寫起來又臭又長的。而python無論在資料分析還是在指令碼自動化編寫尚都是簡單,易學的。良好...

python資料分析

陣列間的算術運算 npwhere pandas的使用 np.random.rand 3,4 產生乙個3行4列的矩陣 0 1之間的 in 32 data1 1,2,3,4.0 in 34 arr1 np.array data1 in 35 arr1 out 35 array 1.2.3.4.in 37...

python資料分析

1.資料分析的含義與目標 2.python與資料分析 3.python資料分析大家族 4.python環境搭建 一 numpy 功能 ndarray 多維操作 線性代數 官網 numpy是python語言的乙個擴充程式庫。支援高階大量的維度陣列與矩陣運算,此外也針對陣列運算提供大量的數學函式庫。nu...