# -*- coding:utf-8 -*- # é€šè¿‡Kmeansèšç±»çš„æ–¹æ³•æ¥é‡åŒ–æƒé‡ import numpy as np import matplotlib.pyplot as plt import scipy.cluster.vq as scv import pickle import os os.environ['GLOG_minloglevel'] = '2' import caffe import time # èŽ·å¾—å„å±‚çš„é‡åŒ–ç è¡¨ def kmeans_net(net, layers, num_c=16, initials=None): # net: ç½‘ç»œ # layers: éœ€è¦é‡åŒ–çš„å±‚ # num_c: å„å±‚çš„é‡åŒ–çº§åˆ« # initials: åˆå§‹èšç±»ä¸å¿ƒ codebook = {} # é‡åŒ–ç è¡¨ if type(num_c) == type(1): num_c = [num_c] * len(layers) else: assert len(num_c) == len(layers) # å¯¹å„å±‚è¿›è¡Œèšç±»åˆ†æž print "==============Perform K-means=============" for idx, layer in enumerate(layers): print "Eval layer:", layer W = net.params[layer][0].data.flatten() W = W[np.where(W != 0)] # ç›é€‰ä¸ä¸º0çš„æƒé‡ # é»˜è®¤æƒ…å†µä¸‹ï¼Œèšç±»ä¸å¿ƒä¸ºçº¿æ€§åˆ†å¸ƒä¸å¿ƒ if initials is None: # Default: uniform sample min_W = np.min(W) max_W = np.max(W) initial_uni = np.linspace(min_W, max_W, num_c[idx] - 1) codebook[layer], _ = scv.kmeans(W, initial_uni) elif type(initials) == type(np.array([])): codebook[layer], _ = scv.kmeans(W, initials) elif initials == 'random': codebook[layer], _ = scv.kmeans(W, num_c[idx] - 1) else: raise Exception # å°†0æƒé‡å€¼é™„ä¸Š codebook[layer] = np.append(0.0, codebook[layer]) print "codebook size:", len(codebook[layer]) return codebook # éšæœºé‡åŒ–æƒé‡å€¼ def stochasitc_quantize2(W, codebook): # maskæ’å…¥æ–°ç»´åº¦ï¼š(W.shape,1) mask = W[:, np.newaxis] - codebook mask_neg = mask mask_neg[mask_neg > 0.0] -= 99999.0 max_neg = np.max(mask_neg, axis=1) max_code = np.argmax(mask_neg, axis=1) mask_pos = mask mask_pos += 99999.0 min_code = np.argmin(mask_pos, axis=1) min_pos = np.min(mask_pos, axis=1) rd = np.random.uniform(low=0.0, high=1.0, size=(len(W))) thresh = min_pos.astype(np.float32) / (min_pos - max_neg) max_idx = thresh < rd min_idx = thresh >= rd codes = np.zeros(W.shape) codes[max_idx] += min_code[max_idx] codes[min_idx] += max_code[min_idx] return codes.astype(np.int) # å¾—åˆ°ç½‘ç»œçš„é‡åŒ–æƒé‡å€¼ def quantize_net(net, codebook): layers = codebook.keys() codes_W = {} print "================Perform quantization==============" for layer in layers: print "Quantize layer:", layer W = net.params[layer][0].data codes, _ = scv.vq(W.flatten(), codebook[layer]) # æ ¹æ®ç è¡¨å¾—åˆ°é‡åŒ–æƒé‡å€¼ # codes = stochasitc_quantize2(W.flatten(), codebook[layer]) # é‡‡ç”¨éšæœºé‡åŒ–çš„æ–¹å¼ codes = np.reshape(codes, W.shape) codes_W[layer] = np.array(codes, dtype=np.uint32) # å°†é‡åŒ–åŽçš„æƒé‡ä¿å˜åˆ°ç½‘ç»œä¸ W_q = np.reshape(codebook[layer][codes], W.shape) np.copyto(net.params[layer][0].data, W_q) return codes_W def quantize_net_with_dict(net, layers, codebook, use_stochastic=False, timing=False): start_time = time.time() codeDict = {} # è®°å½•å„ä¸ªé‡åŒ–ä¸å¿ƒæ‰€å¤„çš„ä½ç½® maskCode = {} # å„å±‚é‡åŒ–ç»“æžœ for layer in layers: print "Quantize layer:", layer W = net.params[layer][0].data if use_stochastic: codes = stochasitc_quantize2(W.flatten(), codebook[layer]) else: codes, _ = scv.vq(W.flatten(), codebook[layer]) W_q = np.reshape(codebook[layer][codes], W.shape) net.params[layer][0].data[...] = W_q maskCode[layer] = np.reshape(codes, W.shape) codeBookSize = len(codebook[layer]) a = maskCode[layer].flatten() b = xrange(len(a)) codeDict[layer] = {} for i in xrange(len(a)): codeDict[layer].setdefault(a[i], []).append(b[i]) if timing: print "Update codebook time:%f" % (time.time() - start_time) return codeDict, maskCode def static_vars(**kwargs): def decorate(func): for k in kwargs: setattr(func, k, kwargs[k]) return func return decorate @static_vars(step_cache={}, step_cache2={}, count=0) def update_codebook_net(net, codebook, codeDict, maskCode, args, update_layers=None, snapshot=None): start_time = time.time() extra_lr = args['lr'] # åŸºç¡€å¦ä¹ é€ŸçŽ‡ decay_rate = args['decay_rate'] # è¡°å‡é€ŸçŽ‡ momentum = args['momentum'] # é—å¿˜å› å update_method = args['update'] # æ›´æ–°æ–¹æ³• smooth_eps = 0 normalize_flag = args['normalize_flag'] # æ˜¯å¦è¿›è¡Œå½’ä¸€åŒ– if update_method == 'rmsprop': extra_lr /= 100 # å¯¹ç è¡¨ä¸Žé‡åŒ–ç»“æžœçš„åˆå§‹åŒ– if update_codebook_net.count == 0: step_cache2 = update_codebook_net.step_cache2 step_cache = update_codebook_net.step_cache if update_method == 'adadelta': for layer in update_layers: step_cache2[layer] = {} for code in xrange(1, len(codebook[layer])): step_cache2[layer][code] = 0.0 smooth_eps = 1e-8 for layer in update_layers: step_cache[layer] = {} for code in xrange(1, len(codebook[layer])): step_cache[layer][code] = 0.0 update_codebook_net.count = 1 else: # è¯»å…¥ä¸Šæ¬¡è¿ç®—çš„ç»“æžœ step_cache2 = update_codebook_net.step_cache2 step_cache = update_codebook_net.step_cache update_codebook_net.count += 1 # æ‰€æœ‰å±‚å total_layers = net.params.keys() if update_layers is None: # æ‰€æœ‰å±‚éƒ½éœ€è¦è¿›è¡Œæ›´æ–° update_layers = total_layers # æƒé‡ç è¡¨çš„æ›´æ–° for layer in total_layers: if layer in update_layers: diff = net.params[layer][0].diff.flatten() # è¯¯å·®æ¢¯åº¦ codeBookSize = len(codebook[layer]) dx = np.zeros((codeBookSize)) # ç¼–ç è¡¨çš„è¯¯å·®æ›´æ–° for code in xrange(1, codeBookSize): indexes = codeDict[layer][code] # codeDictä¿å˜å±žäºŽæŸç¼–ç çš„æƒé‡çš„åºå· #diff_ave = np.sum(diff[indexes]) / len(indexes) diff_ave = np.sum(diff[indexes]) # ç»Ÿè®¡è¯¥ç¼–ç æ‰€æœ‰çš„è¯¯å·®æ›´æ–°å’Œ # é’ˆå¯¹äºŽä¸åŒæ–¹æ³•è¿›è¡Œæ›´æ–° if update_method == 'sgd': dx[code] = -extra_lr * diff_ave elif update_method == 'momentum': if code in step_cache[layer]: dx[code] = momentum * step_cache[layer][code] - (1 - momentum) * extra_lr * diff_ave step_cache[layer][code] = dx elif update_method == 'rmsprop': if code in step_cache[layer]: step_cache[layer][code] = decay_rate * step_cache[layer][code] + (1.0 - decay_rate) * diff_ave ** 2 dx[code] = -(extra_lr * diff_ave) / np.sqrt(step_cache[layer][code] + 1e-6) elif update_method == 'adadelta': if code in step_cache[layer]: step_cache[layer][code] = step_cache[layer][code] * decay_rate + (1.0 - decay_rate) * diff_ave ** 2 dx[code] = -np.sqrt((step_cache2[layer][code] + smooth_eps) / (step_cache[layer][code] + smooth_eps)) * diff_ave step_cache2[layer][code] = step_cache2[layer][code] * decay_rate + (1.0 - decay_rate) * (dx[code] ** 2) # æ˜¯å¦éœ€è¦è¿›è¡Œå½’ä¸€åŒ–æ›´æ–°å‚æ•° if normalize_flag: codebook[layer] += extra_lr * np.sqrt(np.mean(codebook[layer] ** 2)) / np.sqrt(np.mean(dx ** 2)) * dx else: codebook[layer] += dx else: pass # maskCodeä¿å˜ç¼–ç ç»“æžœ W2 = codebook[layer][maskCode[layer]] net.params[layer][0].data[...] = W2 # é‡åŒ–åŽæƒé‡å€¼ print "Update codebook time:%f" % (time.time() - start_time) # ä¿å˜é‡åŒ–ç»“æžœ def store_all(net, codebook, dir_t, idx=0): net.save(dir_t + 'caffemodel%d' % idx) # é‡åŒ–ç½‘ç»œåŠç è¡¨ pickle.dump(codebook, open(dir_t + 'codebook%d' % idx, 'w')) # æ¢å¤æƒé‡å€¼ def recover_all(net, dir_t, idx=0): layers = net.params.keys() net.copy_from(dir_t + 'caffemodel%d' % idx) codebook = pickle.load(open(dir_t + 'codebook%d' % idx)) maskCode = {} codeDict = {} for layer in layers: W = net.params[layer][0].data # ç è¡¨ç»“æžœ codes, _ = scv.vq(W.flatten(), codebook[layer]) # ç¼–ç ç»“æžœé‡æ–°æŽ’åˆ— maskCode[layer] = np.reshape(codes, W.shape) codeBookSize = len(codebook[layer]) a = maskCode[layer].flatten() b = xrange(len(a)) codeDict[layer] = {} for i in xrange(len(a)): # codeDictä¿å˜æ¯ä¸ªç æœ‰å“ªäº›ä½ç½®ï¼Œè€ŒmaskCodeä¿å˜æ¯ä¸ªä½ç½®å±žäºŽå“ªä¸ªç codeDict[layer].setdefault(a[i], []).append(b[i]) return codebook, maskCode, codeDict def analyze_log(fileName): data = open(fileName, "r") y = [] for line in data: y.append(float(line.split()[0])) return y # è¯»å…¥æµ‹è¯•æ•°æ® def parse_caffe_log(log): lines = open(log).readlines() try: res = map(lambda x: float(x.split()[-1]), lines[-3:-1]) except Exception as e: print e res = [0.0, 0.0] return res # æ£€æµ‹é‡åŒ–åŽç½‘ç»œçš„ç²¾åº¦ def test_quantize_accu(test_net): test_iter = 100 test_loss = 0 accuracy = 0 for test_it in range(test_iter): # è¿›è¡Œä¸€æ¬¡æµ‹è¯• test_net.forward() # è®¡ç®—test loss test_loss += test_net.blobs['loss'].data # è®¡ç®—test accuracy accuracy += test_net.blobs['accuracy'].data return (test_loss / test_iter), (accuracy / test_iter) def save_quantize_net(codebook, maskcode, net_filename, total_layers): # ç¼–ç quantizeNet = {} for layer in total_layers: quantizeNet[layer+'_codebook'] = np.float32(codebook[layer]) quantizeNet[layer + '_maskcode'] = np.int8(maskcode[layer]) np.savez(net_filename,quantizeNet) # ä¿å˜ä¿®å‰ªé‡åŒ–çš„ç½‘ç»œå‚æ•° def save_pruned_quantize_net(codebook, maskcode, net_filename, total_layers): # W_flatten: æ‰å¹³åŒ–çš„æƒé‡çŸ©é˜µ # num_level: é‡åŒ–çº§åˆ« quantizeNet = {} for layer in total_layers: W_flatten = maskCode[layer].flatten() indx = 0 num_level = 8 csc_W = [] csc_indx = [] for n in range(len(W_flatten)): if W_flatten[n]!=0 or indx == 2**num_level: csc_W.append(W_flatten[n]) csc_indx.append(indx) indx = 0 else: indx += 1 if indx!=0: csc_W.append(0) csc_indx.append(indx-1) print max(csc_indx) quantizeNet[layer + '_codebook'] = np.float32(codebook[layer]) quantizeNet[layer + '_maskcode_W'] = np.array(csc_W, dtype=np.int8) print max(csc_indx) quantizeNet[layer + '_maskcode_indx'] = np.array(csc_indx, dtype=np.int8) np.savez(net_filename, quantizeNet) caffe.set_mode_gpu() caffe.set_device(0) caffe_root = '../../' model_dir = caffe_root + 'models/mnist/' deploy = model_dir + 'deploy.prototxt' solver_file = model_dir + 'solver.prototxt' # model_name = 'LeNet5_Mnist_shapshot_iter_10000' model_name = 'LeNet5_Mnist_shapshot_iter_10000_pruned' caffemodel = model_dir + model_name + '.caffemodel' dir_t = '/weight_quantize/' # è¿è¡Œæµ‹è¯•å‘½ä»¤ args = dict(lr=0.01, decay_rate = 0.0009, momentum = 0.9, update = 'adadelta', normalize_flag = False) start_time = time.time() solver = caffe.SGDSolver(solver_file) solver.net.copy_from(caffemodel) # éœ€è¦é‡åŒ–çš„æƒé‡ total_layers = ['conv1','conv2','ip1','ip2'] num_c = 2 ** 8 # é‡åŒ–çº§åˆ«ï¼Œç”±8ä½æ•´æ•°è¡¨ç¤º codebook = kmeans_net(solver.test_nets[0], total_layers, num_c) codeDict, maskCode = quantize_net_with_dict(solver.test_nets[0], total_layers, codebook) quantize_net_caffemodel = model_dir + model_name + '_quantize.caffemodel' solver.test_nets[0].save(quantize_net_caffemodel) quantize_net_npz = model_dir + model_name + '_quantize_net' save_pruned_quantize_net(codebook, maskCode, quantize_net_npz , total_layers) # è¿ä»£è®ç»ƒç¼–ç è¡¨ accuracys = [] co_iters = 40 ac_iters = 10 for i in xrange(2500): if (i % (co_iters + ac_iters) == 0 and i > 0): # é‡æ–°é‡åŒ– # å¯¼å…¥è®ç»ƒåŽçš„ codebook = kmeans_net(solver.net, total_layers, num_c) codeDict, maskCode = quantize_net_with_dict(solver.net, total_layers, codebook) solver.net.save(quantize_net_caffemodel) solver.test_nets[0].copy_from(quantize_net_caffemodel) _, accu = test_quantize_accu(solver.test_nets[0]) accuracys.append(accu) solver.step(1) if (i % (co_iters + ac_iters) < co_iters): # ç è¡¨æ›´æ–° update_codebook_net(solver.net, codebook, codeDict, maskCode, args=args, update_layers=total_layers) print "Iter:%d, Time cost:%f" % (i, time.time() - start_time) plt.plot(accuracys, 'r.-') plt.show()