import xlrd
import json
import re
#開啟excel檔案
excel = xlrd.open_workbook('c:\data.xlsx')
#獲取第二個sheet
sheet = excel.sheets()[3]
arr_r=[0,0,0,0,0,0]
arr_all = [[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0]]
j=0k=0
#red1 =
#redshow1 = 0
#blueshow1 = 0
red0=sheet.row_values(0)
#str = red0[0]
#arr = str.split(' ')
#red0[i].split(' ')[j]
#print(int(arr[0])==12)
for i in range (0,30):
red0 = sheet.row_values(i)
str = red0[0]
arr = str.split(' ');
for j in range(0,6):
k = int(arr[j]);
arr_all[i][j] = k
print(arr_all[i][j])
//使用sklearn包中的分析演算法對 arr_all[i][j] 包含紅球資訊 資料進行處理
#for i in range(0,6):
#j = int(arr[i]);
#arr_all[0][i] = j
#print(arr_all[0][i])
#arr_r[i]=
#for i in range(0,33):
# if(red0[i]==(i+1)):
# redshow1=redshow1+1
#print(redshow1)
#print(red0[33])
#for j in range(33,49):
#if(red0[j]==(j-33+1)):
# #blueshow1=blueshow1+1
#print(red0[j])
#print(blueshow1)
在cmd命令列中,輸入 python "檔案路徑+檔名";
**演算法核心:f(x球資料)
1.根據最近三十條資料,得出最近中獎的資料 矩陣a
2.根據最近三十條資料,得出每個數字出現次數間隔之和(每一列中,不等於當前列值的數字之和),用於統計冷門的狀態 矩陣b
3.根據最近三十條資料,得出每個數字出現次數之和(每一列中,等於當前列值的數字之和),用於統計熱門的狀態 矩陣c
4.根據矩陣a 進行線性回歸,得出目標的取值範圍。
5.將最熱門,最冷門的資料加入到最後的取值範圍。
6.md5演算法隨機取值
x球資料 : 紅球資料、藍球資料
Anaconda中sklearn包不全
起因 一開始在一台伺服器上單獨安裝了sklearn,用於訓練模型,生成pkl檔案。後來由於發現anaconda中整合了包含sklearn在內測好多安裝包,於是打算將程式移植到anaconda上,並且保留原先的模型pkl檔案。結果在除錯的時候發現了錯誤。主要是在載入pkl檔案的時候,出現錯誤。排查過程...
利用sklearn包中的k 近鄰演算法進行分類
剛開始學習機器學習不久,這也是我第一次寫部落格。就先寫個簡單的,利用sklearn包中的knn分類器進行分類,分類的資料集為皮馬印第安人糖尿病資料集 pima indians diabetes.data.csv 廢話不多說,直接上 寫的不完善的地方,望大家指正。coding utf 8 create...
sklearn中的gbdt原始碼分析
簡單看了一下sklearn中的gbdt原始碼 在這裡記錄一下,目前來說還不能把gbdt的所有理論都搞清楚 sklearn有兩個類似於gbdt的實現 gradientboostingclassifier gradientboostingregressor乙個用於分類,另乙個用於回歸 這兩個類其實區別只...