資料分析介紹與環境安裝

2021-10-23 04:55:48 字數 2879 閱讀 1924

資料分析的基本概念

資料分析的流程

明確目的

準備資料

資料解析

分析資料

獲得結論

成果視覺化

資料分析和資料探勘的相似之處

資料分析與資料探勘的區別

jupyter介紹

jupyter notebooks特點

可互動式

.ipynb檔案分享

支援markdown

jupyter官網

jupyter安裝

jupyter使用

進入命令模式後的一些常用方法

進入命令模式或輸入字母h

在jupyter中乙個英文狀態下的問號代表著使用檢視物件的概要資訊

在jupyter中乙個英文狀態下的兩個問號代表著使用檢視源**

檔案操作的介紹

在實際操作中,通過採集本地資料進行資料分析,那麼就需要學會python去對本地進行讀取與寫入等操作

比如:txt檔案,json檔案,csv檔案,excel檔案等

python操作txt檔案open( file, mode='r', buffering=-1, encoding=none, errors=none, newline=none, closefd=true, opener=none, )

with

open

('students.txt'

,mode=

'r')

as f:

read = f.read(

) fier

python操作json檔案

json是一種使用廣泛的輕量級資料格式,python標準中的json模組中提供了json資料的處理功能

由於json與python中的字典格式非常像,所以python中的json模組也相當於用來使json與字典轉換。

但要注意的是,json中的資料必須使用雙引號。

python操作csv檔案

csv即comma separate values,有時也稱為字元分隔值,因為分隔字元也可以不是逗號,其檔案以純文字

儲存**(數字和文字)。經常用來作為不同程式之間的資料互動格式。

import csv

with

open

('demo.csv'

,'w'

, encoding=

'utf-8'

)as f:

csw_writer = csv.writer(f)

csw_writer.writerow(

["a"

,"b"

,"c"

])

python操作excel檔案官網:

安裝:pip install openyxl

在python中,有很多第三方模組用來操作excel,比如說:xlwt,xlrd,openpyxl等。

注意:openpyxl只支援2010版本以上的xlsx檔案

from openpyxl import load_workbook

wb = load_workbook(

"demo03.xlsx"

)# 開啟工作簿

ws = wb.active # 開啟工作表

# 單元格的值

tuple

(ws.rows)

for row in ws.rows:

# 迴圈出每一行

for cell in row:

# 迴圈每乙個單元格

print

(cell.value)

資料分析與挖掘基礎環境安裝與使用

整個資料探勘基礎階段會用到matplotlib numpy pandas ta lib jupyter等庫,為了統一版本號在環境中使用,將所有的庫及其版本放到了檔案requirements.txt當中,然後統一安裝 virtualenv p python3 ai 把虛擬環境安裝到指定資料夾下work...

00 資料分析思維介紹

資料分析 資料分析簡介 入門 資料分析解決框架 初級 資料分析過程 高階 同學你好,資料分析思維板塊是資料分析課程首先接觸到的知識,在整體課程中,隨著學習不同資料資料分析工具,我們將會學到3個部分,逐漸理解資料分析是如何在商業中得到應用以及資料分析的框架和操作過程是如何的。當你看到乙個包含資料的描述...

Python資料分析 基礎介紹

最首先,應該熟悉python基本語法 接下來,只會涉及到一點和資料分析相關的基礎內容。在python中數值只有兩個型別,不像其他語言會分的比較細,只有整數和浮點數,其他型別還有字串 布林值 true or false 空值 none 字串是用單雙引號定義的,單雙引號是等價的,但是注意,前後要一致 因...