# -*- coding:utf-8 -*- # ç”¨äºŽæ¨¡åž‹çš„å•å¼ å›¾åƒåˆ†ç±»æ“ä½œ import os os.environ['GLOG_minloglevel'] = '2' # å°†caffeçš„è¾“å‡ºlogä¿¡æ¯ä¸æ˜¾ç¤ºï¼Œå¿…é¡»æ”¾åˆ°import caffeå‰ import caffe # caffe æ¨¡å— from caffe.proto import caffe_pb2 from google.protobuf import text_format import numpy as np import cv2 import matplotlib.pyplot as plt import time # åˆ†ç±»å•å¼ å›¾åƒimg def detection(img, net, transformer, labels_file): im = caffe.io.load_image(img) net.blobs['data'].data[...] = transformer.preprocess('data', im) start = time.clock() # æ‰§è¡Œæµ‹è¯• net.forward() end = time.clock() print('detection time: %f s' % (end - start)) # æŸ¥çœ‹ç›®æ ‡æ£€æµ‹ç»“æžœ file = open(labels_file, 'r') labelmap = caffe_pb2.LabelMap() text_format.Merge(str(file.read()), labelmap) loc = net.blobs['detection_out'].data[0][0] confidence_threshold = 0.5 for l in range(len(loc)): if loc[l][2] >= confidence_threshold: xmin = int(loc[l][3] * im.shape[1]) ymin = int(loc[l][4] * im.shape[0]) xmax = int(loc[l][5] * im.shape[1]) ymax = int(loc[l][6] * im.shape[0]) img = np.zeros((512, 512, 3), np.uint8) # ç”Ÿæˆä¸€ä¸ªç©ºå½©è‰²å›¾åƒ cv2.rectangle(im, (xmin, ymin), (xmax, ymax), (55 / 255.0, 255 / 255.0, 155 / 255.0), 2) # ç¡®å®šåˆ†ç±»ç±»åˆ« class_name = labelmap.item[int(loc[l][1])].display_name # text_font = cv2.cv.InitFont(cv2.cv.CV_FONT_HERSHEY_SCRIPT_SIMPLEX, 1, 1, 0, 3, 8) cv2.putText(im, class_name, (xmin, ymax), cv2.cv.CV_FONT_HERSHEY_SIMPLEX, 1, (55, 255, 155), 2) # æ˜¾ç¤ºç»“æžœ plt.imshow(im, 'brg') plt.show() #CPUæˆ–GPUæ¨¡åž‹è½¬æ¢ caffe.set_mode_cpu() #caffe.set_device(0) #caffe.set_mode_gpu() caffe_root = '../../' # ç½‘ç»œå‚æ•°ï¼ˆæƒé‡ï¼‰æ–‡ä»¶ caffemodel = caffe_root + 'models/SSD_300x300/VGG_VOC0712_SSD_300x300_iter_60000.caffemodel' # ç½‘ç»œå®žæ–½ç»“æž„é…ç½®æ–‡ä»¶ deploy = caffe_root + 'models/SSD_300x300/deploy.prototxt' img_root = caffe_root + 'data/VOCdevkit/VOC2007/JPEGImages/' labels_file = caffe_root + 'data/VOC0712/labelmap_voc.prototxt' # ç½‘ç»œå®žæ–½åˆ†ç±» net = caffe.Net(deploy, # å®šä¹‰æ¨¡åž‹ç»“æž„ caffemodel, # åŒ…å«äº†æ¨¡åž‹çš„è®ç»ƒæƒå€¼ caffe.TEST) # ä½¿ç”¨æµ‹è¯•æ¨¡å¼(ä¸æ‰§è¡Œdropout) # åŠ è½½ImageNetå›¾åƒå‡å€¼ (éšç€Caffeä¸€èµ·å‘å¸ƒçš„) mu = np.load(caffe_root + 'python/caffe/imagenet/ilsvrc_2012_mean.npy') mu = mu.mean(1).mean(1) # å¯¹æ‰€æœ‰åƒç´ å€¼å–å¹³å‡ä»¥æ¤èŽ·å–BGRçš„å‡å€¼åƒç´ å€¼ # å›¾åƒé¢„å¤„ç† transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape}) transformer.set_transpose('data', (2,0,1)) transformer.set_mean('data', mu) transformer.set_raw_scale('data', 255) transformer.set_channel_swap('data', (2,1,0)) # å¤„ç†å›¾åƒ while 1: img_num = raw_input("Enter Img Number: ") if img_num == '': break img = img_root + '{:0>6}'.format(img_num) + '.jpg' detection(img,net,transformer,labels_file)