由於一些不可知的問題,安裝了ipython雖然成功,然而一些魔法語句的使用出現故障,例如%matplotlib inline語句,這使得ipython作用不顯著,因此本次作業仍然使用簡單的python命令列和ide完成。
本次課程內容主要是圍繞pandas庫的資料分析展開,並涉及到statsmodels庫以及seaborn庫。作業中需要依靠這兩個庫輔助完成線性回歸方程的計算以及高階繪圖。習題內容主要是分析乙個**檔案:
習題內容是計算**中某些資料的平均值、方差以及相關係數,然後計算線性回歸,以及散點圖的繪製。
作答如下:
import random
import numpy as np
import scipy as sp
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.api as sm
import statsmodels.formula.api as smf
sns.set_context("talk")
anascombe = pd.read_csv('', error_bad_lines=false)
print(anascombe.head())
mean_x = anascombe['x'].mean()
mean_y = anascombe['y'].mean()
variance_x = sum([(i-anascombe['x'].mean())**2 for i in anascombe['x']]) / len(anascombe['x'])
variance_y = sum([(i-anascombe['y'].mean())**2 for i in anascombe['y']]) / len(anascombe['y'])
cov_xy = sum([anascombe['x'][i] * anascombe['y'][i] for i in range(len(anascombe['x']))]) / len(anascombe['x']) - mean_x*mean_y
correlation_coefficient = cov_xy / (variance_x * variance_y) ** (1/2)
lin_model = smf.ols('y ~ x', anascombe).fit()
print(mean_x)
print(mean_y)
print(variance_x)
print(variance_y)
print(correlation_coefficient)
print(lin_model.summary())
sns.factorplot(data=anascombe, x = "x", y="y", col = "dataset")
plt.show()
結果如圖:
多乙份感動,多乙份行動
有乙個女生,因為跟家裡處得不好,所以很少回家,後來有一次回家,發現年老的母親走路一跛一跛的,不經意的看了母親的腳一眼,這才發現母親的腳指甲太長而長到肉裡面造成流血,流膿,這時,她認真的看者已經很久沒有正眼看過的母親,她才發現在她眼前的母親已經年老,老到已經沒有辦法彎下身來自己剪指甲,所以 才會讓雙腳...
換了乙份工作
第一次跳槽,用了一周時間跑到深圳找了份工作,手上也沒幾個錢了,就不打算繼續找下去了,先乾幹活吧,五一之後就要上班了,與自己原先的計畫還有點不同,工作時間提前了一點點.這下工作上的關注點可能會有點不同了,技術方面,從企業級的應用,可能更加偏向於網際網路的應用,資料庫則是從oracle為主變成mysql...
心靠近,就會有溫暖。乙份純淨,乙份心情
心靠近,就會有溫暖。乙份純淨,乙份心情 分開後,我的生活變得單調,不再去想愛情了,只有努力的工作,自己的心裡才會好受一點,但是時間久了我才發現,自己越來越飄渺,那種感覺除了寂寞還很無聊。令人尷尬的是,當你已經知道真相,他卻當著你的面撒謊。每乙個矜持淡定的現在,都有乙個很傻很天真的曾經。看到有人在做當...