본문 바로가기

IT/Deeplearning

[Object Detection / YOLO DARKNET] object detection code review :: get_labels -[4]

[Object Detection / YOLO DARKNET] object detection code review :: read_data_cfg -[1]

[Object Detection / YOLO DARKNET] object detection code review :: read_data_cfg -[2]

[Object Detection / YOLO DARKNET] object detection code review :: option_find_str -[3]


저번 포스팅에서는 char *name_list = option_find_str(options, "names", "data/names.list") 에 대해서 코드 리뷰를 진행하였습니다.

이번 포스팅은 저번 포스팅으로 가져온 name_list를 인자로 쓰는 char **names = get_labels(name_list) 에 대한 코드 리뷰를 진행하도록 하겠습니다.


1. Concept Overview


get_labels는 아래 그림과 같이 *.names의 파일 확장자 가진 label 리스트를 읽어서 이를 lists 구조체로 만들고, 다시 array형태로 빼는 함수입니다.



2. test_detector :: examples/detector.c


현재 리뷰하고 있는 위치는 test_detector 함수에서 3번째 라인입니다.

포스팅할 때, 이번 포스팅에서는 우리가 분석하는 전체 그림 중에 어디쯤 와있다는 것을 다시 한번 확인하기 위해서

test_detector함수를 먼저 보고 들어가겠습니다.

void test_detector(char *datacfg, char *cfgfile, char *weightfile, char *filename, float thresh, float hier_thresh, char *outfile, int fullscreen)
{
    list *options = read_data_cfg(datacfg);
    char *name_list = option_find_str(options, "names", "data/names.list");
    char **names = get_labels(name_list);

    image **alphabet = load_alphabet();
    network *net = load_network(cfgfile, weightfile, 0);
    set_batch_network(net, 1);
    srand(2222222);
    double time;
    char buff[256];
    char *input = buff;
    int j;
    float nms=.3;
    while(1){
        if(filename){
            strncpy(input, filename, 256);
        } else {
            printf("Enter Image Path: ");
            fflush(stdout);
            input = fgets(input, 256, stdin);
            if(!input) return;
            strtok(input, "\n");
        }
        image im = load_image_color(input,0,0);
        image sized = letterbox_image(im, net->w, net->h);
        //image sized = resize_image(im, net->w, net->h);
        //image sized2 = resize_max(im, net->w);
        //image sized = crop_image(sized2, -((net->w - sized2.w)/2), -((net->h - sized2.h)/2), net->w, net->h);
        //resize_network(net, sized.w, sized.h);
        layer l = net->layers[net->n-1];

        box *boxes = calloc(l.w*l.h*l.n, sizeof(box));
        float **probs = calloc(l.w*l.h*l.n, sizeof(float *));
        for(j = 0; j < l.w*l.h*l.n; ++j) probs[j] = calloc(l.classes + 1, sizeof(float *));
        float **masks = 0;
        if (l.coords > 4){
            masks = calloc(l.w*l.h*l.n, sizeof(float*));
            for(j = 0; j < l.w*l.h*l.n; ++j) masks[j] = calloc(l.coords-4, sizeof(float *));
        }

        float *X = sized.data;
        time=what_time_is_it_now();
        network_predict(net, X);
        printf("%s: Predicted in %f seconds.\n", input, what_time_is_it_now()-time);
        get_region_boxes(l, im.w, im.h, net->w, net->h, thresh, probs, boxes, masks, 0, 0, hier_thresh, 1);
        //if (nms) do_nms_obj(boxes, probs, l.w*l.h*l.n, l.classes, nms);
        if (nms) do_nms_sort(boxes, probs, l.w*l.h*l.n, l.classes, nms);
        draw_detections(im, l.w*l.h*l.n, thresh, boxes, probs, masks, names, alphabet, l.classes);
        if(outfile){
            save_image(im, outfile);
        }
        else{
            save_image(im, "predictions");
#ifdef OPENCV
            cvNamedWindow("predictions", CV_WINDOW_NORMAL); 
            if(fullscreen){
                cvSetWindowProperty("predictions", CV_WND_PROP_FULLSCREEN, CV_WINDOW_FULLSCREEN);
            }
            show_image(im, "predictions");
            cvWaitKey(0);
            cvDestroyAllWindows();
#endif
        }

        free_image(im);
        free_image(sized);
        free(boxes);
        free_ptrs((void **)probs, l.w*l.h*l.n);
        if (filename) break;
    }
}


3. get_labels :: src/data.c

get_labels의 구성은 아래와 같습니다.


char **get_labels(char *filename)
{
    list *plist = get_paths(filename);
    char **labels = (char **)list_to_array(plist);
    free_list(plist);
    return labels;
}


1. list 구조체 포인터인 plist에 filename(즉, 이전 포스트에서 얻었언 names확장자 파일의 경로인 name_list입니다.)를 인자로하는 get_paths의 반환값을 대입합니다.

2. list 구조체를 array로 변환하여 char 이중 포인터 labels에 넣습니다.

3. plist를 동적 해제합니다.

4. labels를 반환하고 함수를 종료합니다.


4. get_paths :: src/data.c

get_paths의 구성은 아래와 같습니다.
list *get_paths(char *filename)
{
    char *path;
    FILE *file = fopen(filename, "r");
    if(!file) file_error(filename);
    list *lines = make_list();
    while((path=fgetl(file))){
        list_insert(lines, path);
    }
    fclose(file);
    return lines;
}


1. char 포인터인 path를 선언합니다.

2. 인자로 받은 filename을 읽기모드로 읽습니다.

3. file error를 검사합니다.

4. list구조체 포인터 lines를 만들고, list구조체를 만듭니다.

5. 순회를 돌면서 file을 읽어들입니다.

5-1. 읽은 라인을 list에 넣습니다.

6. file을 닫습니다.

7. list 구조체 lines을 반환하고 함수를 종료합니다.