3. 資料處理、清洗
f =
open
('商鋪資料.csv'
if'條'
in s:
return
int(s.split(
' ')[0
])else
:return
'缺失資料'
def
fprice
(s):
if'¥'
in s:
return
float
(s.split(
'¥')[-
1])else
:return
'缺失資料'
def
fcommentl
(s):
if' '
in s:
quality =
float
(s.split(
' ')[
0][2
:]) environment =
float
(s.split(
' ')[
1][2
:]) service =
float
(s.split(
' ')[
2][2
:-1]
)return
[quality,environment,service]
else
:return
'缺失資料'
以前三十行資料為列
datalist =
# 建立空列表
f.seek(0)
n =0
# 建立計數變數
for i in f.readlines()[
1:30]
: data = i.split(
',')
#print(data)
classify = data[0]
# 提取分類
name = data[1]
# 提取店鋪名稱
comment_count = fcomment(data[2]
) star = data[3]
# 提取星級
price = fprice(data[4]
)# 提取人均
address = data[5]
# 提取位址
quality = fcommentl(data[6]
)[0]
# 提取質量評分
env = fcommentl(data[6]
)[1]
# 提取環境評分
service = fcommentl(data[6]
)[2]
# 提取服務評分
if'缺失資料'
notin
[comment_count, price, quality]
:# 用於判斷是否有資料缺失
n +=
1 data_re =[[
'classify'
,classify],[
'name'
,name],[
'comment_count'
,comment_count],[
'star'
,star],[
'price'
,price],[
'address'
,address],[
'quality'
,quality],[
'environment'
,env],[
'service'
,service]
]dict
(data_re)
)#字典生成,並存入列表datalist
print
('成功載入%i條資料'
%n)else
:continue
print
(datalist)
print
('總共載入%i條資料'
%n)
python資料分析
以網路爬蟲為例,網路爬蟲是乙個自動提取網頁的程式,爬蟲是搜尋引擎的第一步,也是最容易的一部。網頁搜尋,建立索引,查詢排序 用c c 效率高,速度塊,適合通用搜尋引擎做往往爬取。但是它的缺點也特別明顯 開發慢,寫起來又臭又長的。而python無論在資料分析還是在指令碼自動化編寫尚都是簡單,易學的。良好...
python資料分析
陣列間的算術運算 npwhere pandas的使用 np.random.rand 3,4 產生乙個3行4列的矩陣 0 1之間的 in 32 data1 1,2,3,4.0 in 34 arr1 np.array data1 in 35 arr1 out 35 array 1.2.3.4.in 37...
python資料分析
1.資料分析的含義與目標 2.python與資料分析 3.python資料分析大家族 4.python環境搭建 一 numpy 功能 ndarray 多維操作 線性代數 官網 numpy是python語言的乙個擴充程式庫。支援高階大量的維度陣列與矩陣運算,此外也針對陣列運算提供大量的數學函式庫。nu...