kaggle位址
首先載入資料集
import pandas as pd
import numpy as np
train = pd.read_csv('/users/frank/documents/workspace/kaggle/dataset/digit_recognizer/train.csv')
test = pd.read_csv('/users/frank/documents/workspace/kaggle/dataset/digit_recognizer/test.csv')
print train.head()
print test.head()
label pixel0 pixel1 pixel2 pixel3 pixel4 pixel5 pixel6 pixel7 \
0 1 0 0 0 0 0 0 0 0
1 0 0 0 0 0 0 0 0 0
2 1 0 0 0 0 0 0 0 0
3 4 0 0 0 0 0 0 0 0
4 0 0 0 0 0 0 0 0 0
pixel8 ... pixel774 pixel775 pixel776 pixel777 pixel778 \
0 0 ... 0 0 0 0 0
1 0 ... 0 0 0 0 0
2 0 ... 0 0 0 0 0
3 0 ... 0 0 0 0 0
4 0 ... 0 0 0 0 0
pixel779 pixel780 pixel781 pixel782 pixel783
0 0 0 0 0 0
1 0 0 0 0 0
2 0 0 0 0 0
3 0 0 0 0 0
4 0 0 0 0 0
[5 rows x 785 columns]
pixel0 pixel1 pixel2 pixel3 pixel4 pixel5 pixel6 pixel7 pixel8 \
0 0 0 0 0 0 0 0 0 0
1 0 0 0 0 0 0 0 0 0
2 0 0 0 0 0 0 0 0 0
3 0 0 0 0 0 0 0 0 0
4 0 0 0 0 0 0 0 0 0
pixel9 ... pixel774 pixel775 pixel776 pixel777 pixel778 \
0 0 ... 0 0 0 0 0
1 0 ... 0 0 0 0 0
2 0 ... 0 0 0 0 0
3 0 ... 0 0 0 0 0
4 0 ... 0 0 0 0 0
pixel779 pixel780 pixel781 pixel782 pixel783
0 0 0 0 0 0
1 0 0 0 0 0
2 0 0 0 0 0
3 0 0 0 0 0
4 0 0 0 0 0
[5 rows x 784 columns]
分離訓練資料和標籤:
train_data = train.values[:,1:]
label = train.ix[:,0]
test_data = test.values
使用pca來降維:pca文件
使用svm來訓練:svm文件
from sklearn.decomposition import pca
from sklearn.svm import svc
pca = pca(n_components=0.8, whiten=true)
# pca.fit(train_data)
train_data = pca.fit_transform(train_data)
# pca.fit(test_data)
test_data = pca.transform(test_data)
print('使用svm進行訓練...')
svc = svc(kernel='rbf',c=2)
svc.fit(train_data, label)
print('訓練結束.')
使用svm進行訓練...
訓練結束.
print('對測試集進行**...')
predict = svc.predict(test_data)
print('**結束.')
對測試集進行**...
**結束.
儲存結果:
pd.dataframe(
).to_csv('output.csv', index=false, header=true)
print 'done.'
done.
kaggle練習 手寫體識別
coding utf 8 created on sun apr 22 10 25 14 2018 author zhangsh import csv import numpy as np from sklearn.neighbors import kneighborsclassifier list ...
tensorflow 之手寫體識別
原因 由於tensorflow相對於caffe更加靈活,準備轉戰tensorflow,昨天看了下大概的基本函式,今天打算先跑跑簡單的例子 tensorflow的安裝太簡單了,一行 搞定,網上很多教程,不一一列出。想安裝固定tensorflow版本 pip install tensorflow gpu...
Matlab深度學習實踐之手寫體識別(含詳細注釋)
matlab這幾年在人工智慧這塊兒也越做越好了,最近為了熟悉matlab如何搭建神經網路,自己做了乙個手寫體識別實驗,記錄一下。實驗任務非常簡單,網路搭的也非常隨意,不合理的地方也懶得改,旨在走通matlab搭建神經網路的流程。首先,資料集為mnist資料集 我已經把資料按類別分好,分為train和...