神經網路優化中,自定義損失函式更靈活
例如酸奶銷售,生產多了損失成本,生產少了,損失利潤,假設生產成本cost為1元,利潤profit為9 元,實際生產數量為y,市場需求量為y_
則損失為分段函式,損失為 loss = ( y - y_ ) *cost ( 條件為:y > y- ),loss = ( y_ - y ) * profit (條件為: y_ > y )
python 裡可以通過這行**來完成這個計算 :
loss = tf.reduce_sum(tf.where(tf.greater(y,y_),(y-y_)*cost,(y_-y)*profit))
下面是全部**:
#coding:utf-8
import tensorflow as tf
import numpy as np
#損失函式
batch_size=8
seed = 23455
cost = 1
profit = 9
#基於seed產生隨機數
rng = np.random.randomstate(seed)
#隨機數返回32行2列的矩陣,作為輸入資料集
x = rng.rand(32,2)
#從x矩陣中取出一行,求和後判斷結果,小於1給y賦值1,不大於1給y賦值0
#y作為輸入資料集的標籤(正確結果)
y = [[(x0 + x1+rng.rand()/10.0-0.05)] for (x0,x1) in x]
print("x:\n",x)
print("y:\n",y)
#定義神經網路的輸入、引數和輸出,定義向前傳播過程
x=tf.placeholder(tf.float32,shape=(none,2))
y_=tf.placeholder(tf.float32,shape=(none,1))
w1 = tf.variable(tf.random_normal([2,1],stddev=1,seed=1))
y = tf.matmul(x,w1)
#定義損失函式及反向傳播方法
#loss = tf.reduce_mean(tf.square(y-y_))
loss = tf.reduce_sum(tf.where(tf.greater(y,y_),(y-y_)*cost,(y_-y)*profit))
train_step = tf.train.gradientdescentoptimizer(0.001).minimize(loss)
#train_step = tf.train.momentumoptimizer(0.001,0.9).minimize(loss)
#train_step = tf.train.adamoptimizer(0.001).minimize(loss)
#生成會話,訓練steps輪
with tf.session() as sess :
init_op = tf.global_variables_initializer()
sess.run(init_op)
#訓練模型
steps = 60000
for i in range(steps):
start = (i*batch_size)%32
end = start + batch_size
sess.run(train_step,feed_dict=)
if i % 500 ==0:
print("after %d steps the w1 is: "%i)
print(sess.run(w1),"\n")
print("the last result w1 is :")
print(sess.run(w1),"\n")
執行截圖
神經網路損失函式
2018,aug 3 顧名思義,從標題就能知道損失函式 loss function 一定就是來計算神經網路在訓練中的損失的。說完了定義那到了舉例時間了 主要拿softmax loss來分析 這裡的k也就是我們分類的類別。然後這個函式是怎麼用的呢,我們可以簡單的舉乙個分類的例子來看下。假設我們輸入一張...
神經網路 損失函式
開始之前我們先進入數字識別這樣乙個場景 以識別數字1為例,神經網路模型的輸出結果越接近 0,1,0,0,0,0,0,0,0,0 越好。神經網路解決多分類的問題,最常見的方法是設定n個輸出節點,其中n類別個數,那麼上述數字判斷就應該有n 10個輸出。那麼如何判斷乙個輸出向量和期望向量的接近程度呢?交叉...
神經網路 損失函式
先上結論 在使用sigmoid作為啟用函式的時候,cross entropy相比於quadratic cost function,具有收斂速度快,更容易獲得全域性最優的特點 使用softmax作為啟用函式,log likelihood作為損失函式,不存在收斂慢的缺點。對於損失函式的收斂特性,我們期望...