import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn import linear_model
import xlrd
# 開啟檔案
workbook = xlrd.open_workbook(r'c:\users\uesrname\desktop\xlsxname.xlsx')
#可以根據sheet索引或者名稱獲取sheet內容,以下兩種方法都行
#sheet1 = workbook.sheet_by_index(0) # sheet索引從0開始
sheet1 = workbook.sheet_by_name('sheet1')
#獲取該sheet1總行數和列數
#print(sheet1.nrows,sheet1.ncols)
cols = list(sheet1.col_values(1)) # 獲取第二列內容
cols1 = cols[1:] #去除第一行內容,因為我不需要第一行資料,實際情況可用printf函式列印出cols來進行取捨
len1 = len(cols1) #得到該列處理資料的個數
#呼叫線性回歸函式
reg=linear_model.linearregrsession(fit_intercept=true,normalize=false)
#建立乙個二維列表
l1 =
for x in range(0,117,1):
y=x+1
#得到點的橫座標和縱座標,注意:資料個數需保持一致
x = l1 #必須要是二維列表與y對應
y = cols1
#擬合reg.fit(x,y)
k=reg.coef_#得到斜率
b=reg.intercept_#獲取截距
print(k,b) #列印出斜率和截距
#得到需作擬合線的x0,y0,其中np.arange的引數為(起始點,終止,步長)
x0=np.arange(0,117,1)
y0=k*x0+b
plt.scatter(x0,y) #描點函式
plt.plot(x0,y0) #劃線函式
plt.show() #顯示影象
經驗證能夠實現從excle中匯出資料,並對其進行線性回歸分析,如下所示:
可得其回歸方程為:y=32.41002413x+3171.3812260536392
讀出資料庫中資料
imports system.data imports system.data.sqlclient rem 有資料庫連線的時候就要寫這兩行 public class form1 private sub button2 click byval sender as system.object,byval...
Python 利用資料對比的布林值對資料進行篩選
以下,先通過圖來說明篩選的重要性 如果沒有對資料進行篩選 由於裡面有很多異常值,所以我們關心的取值區間就會被異常值遮蓋,我們需要的是小於2.5的資料,因此,我們通過篩選,得到的圖為 上述兩張圖所採用的資料是相同的,只不過對資料集通過布林值進行了篩選,如下 df sum df sum df sum 4...
Python解析Excle檔案中的資料
在公司裡面,人力資源部每到發工資的時候就會頭疼,如果公司內部有100多號員工,那麼發完工資後需要給員工傳送工資條的話,那麼就需要截圖如下圖,但是在公司的薪水保密協議不允許公開所有人的薪水,因此我們需要乙個乙個的發,現在我們給張三發一下薪資條 如果我們給1000人發的話,我們每個人都截圖兩次,面上的標...