共享單車資料分析專案中用到的pyhton語法:
1.python發展方向:
1.網路爬蟲 2.web開發 3.科學計算 4.雲計算
5.網路程式設計 6.自動化運維 7.遊戲開發 8.人工智慧
2.網路爬蟲步驟:
(1)獲取源** 基本庫:urlib庫 request庫
(2)目標資料採集 解析庫:bs4 正規表示式
(3)儲存
3.資料分析過程:
1>資料採集
2>資料處理:a.資料提取 b.資料轉換 c.資料清洗:包括檢驗缺失值和異常值
3>資料分析
4>資料視覺化
4.python模組:python引入某一模組用法
import numpy
from pylab import mpl(from語句可以從模組中匯入乙個指定的部分到當前命名空間)
5.pandas的三種資料結構 :
a.系列(series):一維 均勻 陣列
b.資料幀/框(dataframe):二維 異構 陣列
c.面板(panel):三維 異構 陣列
6.pandas列表:
a,建立列表 b.訪問列表 c.更改列表
刪除元素: pop() del列表名[下標 ]
修改元素: 列表名[下標]
7.內建函式split()
split():指定分隔符對字串進行切片,返回字串列表。預設對空格進行切分。
基本語法:string.split()
8.普通函式與匿名函式
普通函式定義規則:
任何傳入引數和自變數必須放在圓括號中間,圓括號之間可以用於定義引數。
函式內容以冒號起始,並且縮排。
return[expression]結束函式,選擇性的返回乙個值給呼叫方,不帶表示式的return相當於讀取null
匿名函式:
lambda只是乙個表示式,函式體比def簡單。
lambda的主體是乙個表示式,而不是乙個**塊,僅僅能在lambda表示式中封裝有限的資料。
定義格式:函式名=lambda 變數名: 表示式
9.資料讀取及檢視過程
a.資料讀取: pandas.read_csv(filepath,delimiter,dtype,sklprows)//相對路徑,絕對路徑。
b.資料檢視:
print(bikedata.shape) #檢視資料大小
print(bikedata.head()) #檢視資料前5行
print(bikedata.tail()) #檢視資料後5行
print(bikedata.dtypes) # 檢視資料型別
print(bikedata.describe() #檢視統計摘要資訊
10.python中的資料型別
a.數字型別(numbers)
python支援三種不同的數字型別:整型(int)、浮點型(float)、複數型(complex)。
b.字串(string)
包含在單引號或者雙引號內部。
c.列表(list)
用方括號括起來的不同資料項,不同資料項之間用逗號隔開。
d.元祖(tuple)
用小括號括起來的不同項,不同資料項之間用逗號隔開。
e.字典(dictionary)
字典包含了鍵值對,鍵與值之間用冒號(:)隔開,每乙個鍵值對之間用逗號(,)隔開;整個字典包含在花括號({})之間。
12.datetime模組主要用來處理日期。
datetime.datetime.now() 返回當前時間
datetime.datetime.strptime(string[,format]) str格式轉datetime格式,
其中,string表示時間字串,format表示格式化字串。
datatime.datetime.weekday() 將datatime格式的日期轉化為對應星期值。
datatime.datetime.month() 將datatime格式的日期轉化為對應月份值。
13.calendar模組的兩大屬性如下:
calendar.day_name #將星期的數字值修改為英文全稱
calendar.month_name #將月份的數字值修改為英文全稱
通過改變上述屬性,可以修改顯示星期、月份的文字
14.map()函式 :即對映函式,將根據提供的函式對指定序列做對映。
語法格式如下:map(function,iterable...)
其中function表示函式 ,iterable表示乙個或多個序列。
15.建立資料框dataframe
import pandas as pd
data=[1,2,3,4,5]
df=pd.dataframe(data)
print(df)
df1 = pd.dataframe(data, columns=[『columns』],index = [『one』,』two』,』three』,』four』,』five』])
print(df1)
16.pandas中的轉換函式melt()
melt()方法將各列轉換為列資料,實現重構資料框的目的。
基本語法:pandas.melt(frame,id_vars,values_vars,var_name=none,value_name=』value』)
frame:待處理的資料框
id_vars:不需要被轉換的列名
value_vars:需要轉換的列名,預設轉換所剩所有列
value_name和value_name是自定義variable和value的列名。
生產實習1
學習日誌 姓名 楊俊 日期 2018.6.20 今日學習任務 c語言基礎課程複習 今日任務完成情況 上課認真聽講,把之前遺忘的的c語言又都複習了一遍,按照老師要求上課敲寫 150行左右 今日開發中出現的問題彙總 移位運算子的指令運用不熟練,混合運算的過程中一開始沒有注意強制轉換 今日未解決的問題 無...
生產實習3
學習日記 姓名 王寧捷 日期 6.22 今日學習任務 c語言基礎與提高 1.一維陣列 2.二維陣列 3.字元陣列 4.函式 5.預處理 今日任務完成情況 include main int i int 1p 4 a,q a 0 for i 0 i 3 i for i 0 i 3 i printf d,...
生產實習第三天
姓名 趙楊 日期 2018年6月22日 今日學習任務 今天學習了陣列與指標以及函式預處理關鍵字等知識點,氣泡排序,變數的儲存型別。今日任務完成情況 課後習題完成 150 行的 今日開發中出現的問題彙總 對於指標方面的知識還是比較模糊不清楚的 今日未解決問題 無。今日開發收穫 鞏固了關於陣列與指標的知...