Python資料分析

2021-10-03 00:27:32 字數 1126 閱讀 6488

匯入資料

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

plt.rcparams[『font.sans-serif』]=[『simhei』]

plt.rcparams[『axes.unicode_minus』]=false

data = pd.read_excel(「data/attacks.xlsx」)

data.head(5)12

3456

7不管是分析什麼資料,首先都要將其資料匯入進來,才會有後續的問題分析。

檢視資料的基本資訊

data.info()

1該命令列可以檢視資料的基本資訊,比如一共有多少條記錄、多少個特徵、欄位名稱、字段型別、缺失行的數量等。

缺失值處理——刪除行或列

方法一data=data.drop(columns=[「islamic_date」,「temperature_f」])

data.head(5)12

說明:中括號裡面是列名,可以新增多個列名

這種是直接將整列刪除掉,可以刪除多列。

方法二data.drop(labels = [『islamic_date』,『temperature_f』], axis = 1, inplace=true)

1data.drop(labels = 『islamic_date』, axis = 1, inplace=true)

data=data.drop(labels = data.index[data[『temperature_f』].isnull()], axis = 0)

data.head(5)12

3說明:labels後是列名,如果刪除的是列的話,labels後可以新增多列一起刪除,但是如果刪除的是行的話,labels後只可以寫乙個列名,只針對一列來刪除多行。

axis等於1時是刪除列。axis等於0時是刪除行。

缺失值處理——用某值填充

data.loc[data.influencing_event_event.isnull(),「influencing_event_event」]=「0」

1該命令列是用零來填充influencing_event_event列中的缺失值。

python資料分析

以網路爬蟲為例,網路爬蟲是乙個自動提取網頁的程式,爬蟲是搜尋引擎的第一步,也是最容易的一部。網頁搜尋,建立索引,查詢排序 用c c 效率高,速度塊,適合通用搜尋引擎做往往爬取。但是它的缺點也特別明顯 開發慢,寫起來又臭又長的。而python無論在資料分析還是在指令碼自動化編寫尚都是簡單,易學的。良好...

python資料分析

陣列間的算術運算 npwhere pandas的使用 np.random.rand 3,4 產生乙個3行4列的矩陣 0 1之間的 in 32 data1 1,2,3,4.0 in 34 arr1 np.array data1 in 35 arr1 out 35 array 1.2.3.4.in 37...

python資料分析

1.資料分析的含義與目標 2.python與資料分析 3.python資料分析大家族 4.python環境搭建 一 numpy 功能 ndarray 多維操作 線性代數 官網 numpy是python語言的乙個擴充程式庫。支援高階大量的維度陣列與矩陣運算,此外也針對陣列運算提供大量的數學函式庫。nu...