修改記錄是常有的事情,比如資料中有的需要整體替換,有的需要特別修改.
整體替換
整列、整行的替換很簡單,例如執行語句:df[『a列』] = score,該語句中score是將被填進去的資料列(可以是列表或者series)
個別修改
有以下幾種情況
# -*- coding: utf-8 -*-
"""created on wed dec 25 14:42:27 2019
@author: ericray
description: 基於python的大資料分析之修改記錄
"""import pandas as pd
#from pandas import read_excel
df = pd.read_excel(r'e:\python\hello\files\i_nuc.xls'
,sheet_name=
'sheet3'
)print
(df.head(),
'\n'
)#單值替換: df.replace('b','a') a替換b
print
('單值替換:\n'
,df.replace(
'作弊',0
))#指定列單值替換 ,0替換體育列中的作弊,軍訓列中的缺考
print
("指定列單值替換:\n"
,df.replace(,0
))"""多值替換:
df.replace(['a','b'],['c','d']) c替換a,d替換b
或者寫成
df.replace()
df.replace(,)
"""print
("多值替換:\n"
,df.replace(
))
基於python資料分析
資料質量分析是資料探勘中資料準備過程的重要 環,是資料預處理的前提,也是資料探勘分析結論有效性和準確性的基礎,沒有可信的資料,資料探勘構建的模型將是空中樓閣。資料質量分析的主要任務是檢查原始資料中是否存在髒資料,髒資料一般是指不符合要求,以及不能直接進行相應分析的資料。在常見的資料探勘工作中,髒資料...
《基於Apache Kylin構建大資料分析平台》
kyligence聯合創始人兼ceo,apache kylin專案管理委員會主席 pmc chair 韓卿 武漢市雲昇科技發展 董事長,智慧型城市 大資料 物聯網和雲計算之應用 作者楊正洪 萬達網路科技集團大資料中心副總經理,spark高階資料分析 中文版譯者龔少成 資料架構師,it脫口秀 清風那個...
Python大資料分析之網路爬蟲
d匹配乙個數字,d匹配乙個非數字,w匹配乙個字母或數字,可以匹配任意乙個字元,表示任意字元,表示至少乙個字元 表示0個或1個字元,表示n個字元,用表示n m個字元。1 d 表示匹配3個數字 2 s 表示至少匹配乙個空格 s 表示匹配任何非空白字元 s s 可以包括換行符在內的任意字元 3 d表示匹配...