後續補充
'''採用自抽樣方式對資料進行選擇'''
# coding=utf-8
# 引入資料庫包
import pymysql
# 引入操作excel包
import xlrd
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib
import seaborn as sns
from matplotlib import rcparams
import numpy as np
from datetime import date, datetime
import os
rcparams['font.family']='simhei'
matplotlib.rcparams['axes.unicode_minus'] = false
# 匯入資料
root=r'g:\users\administrator\pycharmprojects\train.xls'
df=pd.dataframe(pd.read_excel(root))
# 刪除空值的行
df=df.dropna()
# 重置索引
df = df.reset_index(drop = true)
# 隨機生成0-1000之間的整數
a = np.random.randint(0, 1000)
res=pd.dataframe(df.iloc[[a]])
for i in range(1000):
b=np.random.randint(0,1000)
print(res)
df=res
print(df)
gcForest演算法原理及Python實現
1.背景介紹 從目前來看深度學習大多建立在多層的神經網路基礎上,也即一些引數化的多層可微的非線性模組,這樣就可以通過後向傳播去訓練,zhi hua zhou和ji feng在deep forest 中基於不可微的模組建立深度模組,這就是gcforest。傳統的深度學習有一定的弊端 超引數個數較多,訓...
python匿名函式lambda原理及例項解析
如下 coding utf 8 author www.iplaypy.com www.cppcns.com 普通python函式 def func a,b,c return a b c print func 1,2,3 返回值為6 lambda匿名函式 f lambda a,b,c a b c pr...
分層抽樣原理及Oracle實現
在實際的資料探勘應用中,我們往往會從各方收集很多的資料,這些資料每分每秒都在增加,但我們如果用所有的這些資料並無益處。一是資料量過大,處理起來難度會大非常多,要求你的基礎計算平台效能很好,甚至需要用到平行計算,有時是沒有必要的 二是資料都是基於人及人的行為所產生的影響的,而人是會發生變化的,所以久遠...