# -*- coding:utf-8 -*- # è®ç»ƒåŠæµ‹è¯•æ–‡ä»¶ # è®ç»ƒç½‘ç»œ import caffe import numpy as np import matplotlib.pyplot as plt import math def crop_network(prune_proto, caffemodel, prune_caffemodel): # æˆªå–å·²çŸ¥ç½‘ç»œçš„éƒ¨åˆ†å±‚ # caffemodelç½‘ç»œæƒé‡å€¼å¹¶ä¸è¦æ±‚å…¶ç»“æž„ä¸Žprotoç›¸å¯¹åº” # ç½‘ç»œåªä¼šå–train_protoä¸å®šä¹‰çš„ç»“æž„ä¸æƒé‡ä½œä¸ºç½‘ç»œçš„åˆå§‹æƒé‡å€¼ # å› æ¤ï¼Œå½“æˆ‘ä»¬éœ€è¦æˆªå–æŸäº›å·²è®ç»ƒç½‘ç»œçš„ç‰¹å®šå±‚ä½œä¸ºæ–°ç½‘ç»œçš„æŸäº›å±‚çš„æƒé‡åˆå§‹å€¼ï¼Œåªéœ€è¦åœ¨å…¶train_protoå®šä¹‰åŒåçš„å±‚ # ä¹‹åŽcaffeå°†åœ¨caffemodelä¸æ‰¾åˆ°ä¸Žtrain_protoå®šä¹‰çš„åŒåç»“æž„ï¼Œå¹¶å°†å…¶æƒé‡ä½œä¸ºåº”ç”¨æƒé‡åˆå§‹å€¼ã€‚ # prune_deploy: é€‰æ‹©ä¿ç•™çš„ç½‘ç»œç»“æž„å±‚:prototxt # caffemodel: å·²çŸ¥ç½‘ç»œçš„æƒé‡è¿žæŽ¥ # prune_caffemodelï¼šæˆªæ–ç½‘ç»œçš„æƒé‡è¿žæŽ¥æ–‡ä»¶ net = caffe.Net(prune_proto, caffemodel, caffe.TEST) net.save(prune_caffemodel) def train(solver_proto, caffemodel='', is_step=True, savefig=''): # è®ç»ƒæ¨¡åž‹å‡½æ•° # solver_proto: è®ç»ƒé…ç½®æ–‡ä»¶ # caffemodelï¼šé¢„è®¾æƒé‡å€¼æˆ–è€…å¿«ç…§ç‰ï¼Œå¹¶ä¸è¦æ±‚å…¶ç»“æž„ä¸Žç½‘ç»œç»“æž„ç›¸å¯¹åº”ï¼Œä½†åªä¼šå–ä¸Žè®ç»ƒç½‘ç»œç»“æž„ç›¸å¯¹åº”çš„æƒé‡å€¼ # is_step: Trueè¡¨ç¤ºæŒ‰æ¥è®ç»ƒï¼ŒFalseè¡¨ç¤ºç›´æŽ¥å®Œæˆè®ç»ƒ # savefig: è¡¨ç¤ºè¦ä¿å˜çš„å›¾åƒè®ç»ƒæ—¶æŸå¤±å˜åŒ–å›¾ # è®¾ç½®è®ç»ƒå™¨ï¼šéšæœºæ¢¯åº¦ä¸‹é™ç®—æ³• solver = caffe.SGDSolver(solver_proto) if caffemodel!='': solver.net.copy_from(caffemodel) if is_step==False: # ç›´æŽ¥å®Œæˆè®ç»ƒ solver.solve() else: # è¿ä»£æ¬¡æ•° max_iter = 10000 # æ¯éš”100æ¬¡æ”¶é›†ä¸€æ¬¡æ•°æ® display = 100 # æ¯æ¬¡æµ‹è¯•è¿›è¡Œ100æ¬¡è§£ç®—ï¼Œ10000/100 test_iter = 100 # æ¯500æ¬¡è®ç»ƒè¿›è¡Œä¸€æ¬¡æµ‹è¯•ï¼ˆ100æ¬¡è§£ç®—ï¼‰ï¼Œ60000/64 test_interval = 500 # åˆå§‹åŒ– train_loss = np.zeros(int(math.ceil(max_iter * 1.0 / display))) test_loss = np.zeros(int(math.ceil(max_iter * 1.0 / test_interval))) test_acc = np.zeros(int(math.ceil(max_iter * 1.0 / test_interval))) # iteration 0ï¼Œä¸è®¡å…¥ solver.step(1) # è¾…åŠ©å˜é‡ _train_loss = 0 _test_loss = 0 _accuracy = 0 # åˆ†æ¥è®ç»ƒ for it in range(max_iter): # è¿›è¡Œä¸€æ¬¡è§£ç®— solver.step(1) # æ¯è¿ä»£ä¸€æ¬¡ï¼Œè®ç»ƒbatch_sizeå¼ å›¾ç‰‡ _train_loss += solver.net.blobs['loss'].data # æœ€åŽä¸€å±‚çš„æŸå¤±å€¼ if it % display == 0: # è®¡ç®—å¹³å‡train loss train_loss[int(it / display)] = _train_loss / display _train_loss = 0 # æµ‹è¯• if it % test_interval == 0: for test_it in range(test_iter): # è¿›è¡Œä¸€æ¬¡æµ‹è¯• solver.test_nets[0].forward() # è®¡ç®—test loss _test_loss += solver.test_nets[0].blobs['loss'].data # è®¡ç®—test accuracy _accuracy += solver.test_nets[0].blobs['accuracy'].data # è®¡ç®—å¹³å‡test loss test_loss[it / test_interval] = _test_loss / test_iter # è®¡ç®—å¹³å‡test accuracy test_acc[it / test_interval] = _accuracy / test_iter _test_loss = 0 _accuracy = 0 # ç»˜åˆ¶train lossã€test losså’Œaccuracyæ›²çº¿ print '\nplot the train loss and test accuracy\n' _, ax1 = plt.subplots() ax2 = ax1.twinx() # train loss -> ç»¿è‰² ax1.plot(display * np.arange(len(train_loss)), train_loss, 'g') # test loss -> é»„è‰² ax1.plot(test_interval * np.arange(len(test_loss)), test_loss, 'y') # test accuracy -> çº¢è‰² ax2.plot(test_interval * np.arange(len(test_acc)), test_acc, 'r') ax1.set_xlabel('iteration') ax1.set_ylabel('loss') ax2.set_ylabel('accuracy') if savefig!='': plt.savefig(savefig) plt.show() #CPUæˆ–GPUæ¨¡åž‹è½¬æ¢ #caffe.set_mode_cpu() caffe.set_device(0) caffe.set_mode_gpu() caffe_root = '../../' # caffe_root = 'E:/Code/Github/windows_caffe/' model_root = caffe_root + 'models/mnist/' solver_proto = model_root + 'solver.prototxt' train(solver_proto, caffemodel='', is_step=True)