# -*- coding:utf-8 -*- # ç”Ÿæˆsolveræ–‡ä»¶ from caffe.proto import caffe_pb2 def solver_file(model_root, model_name): s = caffe_pb2.SolverParameter() # å£°æ˜Žsolverç»“æž„ s.train_net = model_root+'train.prototxt' # è®ç»ƒç½‘ç»œç»“æž„é…ç½®æ–‡ä»¶ s.test_net.append(model_root+'test.prototxt') # æµ‹è¯•æ—¶ç½‘ç»œç»“æž„é…ç½®æ–‡ä»¶ï¼Œæµ‹è¯•ç½‘ç»œå¯æœ‰å¤šä¸ª # æ¯è®ç»ƒè¿ä»£test_intervalæ¬¡è¿›è¡Œä¸€æ¬¡æµ‹è¯•ã€‚ s.test_interval = 500 # æ¯æ¬¡æµ‹è¯•æ—¶çš„æ‰¹é‡æ•°ï¼Œæµ‹è¯•é‡Œç½‘ç»œå¯æœ‰å¤šä¸ª s.test_iter.append(100) # æœ€å¤§è®ç»ƒè¿ä»£æ¬¡æ•° s.max_iter = 10000 # åŸºç¡€å¦ä¹ çŽ‡ s.base_lr = 0.01 # åŠ¨é‡ï¼Œè®°å¿†å› å s.momentum = 0.9 # æƒé‡è¡°å‡å€¼ï¼Œé—å¿˜å› å s.weight_decay = 5e-4 # å¦ä¹ çŽ‡å˜åŒ–ç–ç•¥ã€‚å¯é€‰å‚æ•°ï¼šfixedã€stepã€expã€invã€multistep # fixed: ä¿æŒbase_lrä¸å˜ï¼› # step: å¦ä¹ çŽ‡å˜åŒ–è§„å¾‹base_lr * gamma ^ (floor(iter / stepsize))ï¼Œå…¶ä¸iterè¡¨ç¤ºå½“å‰çš„è¿ä»£æ¬¡æ•°ï¼› # exp: å¦ä¹ çŽ‡å˜åŒ–è§„å¾‹base_lr * gamma ^ iterï¼› # inv: è¿˜éœ€è¦è®¾ç½®ä¸€ä¸ªpowerï¼Œå¦ä¹ çŽ‡å˜åŒ–è§„å¾‹base_lr * (1 + gamma * iter) ^ (- power)ï¼› # multistep: è¿˜éœ€è¦è®¾ç½®ä¸€ä¸ªstepvalueï¼Œè¿™ä¸ªå‚æ•°å’Œstepç›¸ä¼¼ï¼Œstepæ˜¯å‡åŒ€ç‰é—´éš”å˜åŒ–ï¼Œè€Œmultistepåˆ™æ˜¯æ ¹æ®stepvalueå€¼å˜åŒ–ï¼› # stepvalueå‚æ•°è¯´æ˜Žï¼š # poly: å¦ä¹ çŽ‡è¿›è¡Œå¤šé¡¹å¼è¯¯å·®ï¼Œè¿”å›žbase_lr (1 - iter/max_iter) ^ (power)ï¼› # sigmoid: å¦ä¹ çŽ‡è¿›è¡Œsigmodè¡°å‡ï¼Œè¿”å›žbase_lr ( 1/(1 + exp(-gamma * (iter - stepsize))))ã€‚ s.lr_policy = 'inv' s.gamma = 0.0001 s.power = 0.75 s.display = 100 # æ¯è¿ä»£displayæ¬¡æ˜¾ç¤ºç»“æžœ s.snapshot = 5000 # ä¿å˜ä¸´æ—¶æ¨¡åž‹çš„è¿ä»£æ•° s.snapshot_prefix = model_root+model_name+'shapshot' # æ¨¡åž‹å‰ç¼€ï¼Œå°±æ˜¯è®ç»ƒå¥½ç”Ÿæˆmodelçš„åå— s.type = 'SGD' # è®ç»ƒæ–¹æ³•ï¼ˆå„ç±»æ¢¯åº¦ä¸‹é™æ³•ï¼‰ï¼Œå¯é€‰å‚æ•°ï¼šSGDï¼ŒAdaDeltaï¼ŒAdaGradï¼ŒAdamï¼ŒNesterovï¼ŒRMSProp s.solver_mode = caffe_pb2.SolverParameter.GPU # è®ç»ƒåŠæµ‹è¯•æ¨¡åž‹ï¼ŒGPUæˆ–CPU solver_file=model_root+'solver.prototxt' # è¦ä¿å˜çš„solveræ–‡ä»¶å with open(solver_file, 'w') as f: f.write(str(s)) caffe_root = '../../' model_name = 'LeNet5_Mnist_' # caffe_root = 'E:/Code/Github/windows_caffe/' model_root = caffe_root + 'models/mnist/' solver_file(model_root, model_name)