AIML/딥러닝 최신 트렌드 알고리즘

    [딥러닝 논문리뷰 - PRMI Lab] - Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation - (CVPR, 2014)

    [딥러닝 논문리뷰 - PRMI Lab] - Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation - (CVPR, 2014)

    객체 인식을 위한 신경망 객체 인식(object detection) 은 이미지나 영상 내에 있는 객체를 식별하는 컴퓨터 비전 기술입니다. 즉, 객체 인식이란 이미지나 영상 내에 있는 여러 객체에 대해 각 객체가 무엇인지 분류하는 문제와 그 객체 위치가 어디인지 박스(bounding box)로 나타내는 위치 검출(localization) 문제를 다루는 분야입니다. 딥러닝을 이용한 객체 인식 알고리즘으로는 1단계 객체 인식(1-stage detector)와 2단계 객체 인식(2-stage detector)으로 나눌 수 있습니다. 1단계는 분류와 위치 검출을 동시에 하는 방법이고, 2단계는 순차적으로 하는 방법입니다. 이로인해 1단계 객체 인식은 빠르지만 정확도가 낮고, 2단계 객체 인식은 비교적 느리지만 정..

    [ 딥러닝 - 모델구현 ] - VGG11/16/19 Net

    [ 딥러닝 - 모델구현 ] - VGG11/16/19 Net

    이번에는 VGG Net을 실제로 PyTorch로 구현해 보고 성능까지 검증해보도록 하겠습니다. from google.colab import drive import os import sys drive.flush_and_unmount() drive.mount('/content/drive/') sys.path.append("/content/drive/MyDrive/DeepLearning") 먼저 위와같이 colab과 google 드라이브를 마운트 해줍니다. ''' 필요 라이브러리들을 불러온다. ''' import copy import numpy as np import torch import torch.nn as nn import torch.nn.functional as F import torch.optim a..

    [딥러닝 - 논문 리뷰 PRMI Lab] - Going Deeper with Convolutions (CVPR 2015) - GoogLeNet

    [딥러닝 - 논문 리뷰 PRMI Lab] - Going Deeper with Convolutions (CVPR 2015) - GoogLeNet

    이번에는 ILSVRC 2014에서 이전에 본 VGGNet을 제치고 1등을 차지한 GoogLeNet을 다루어 보려고 합니다. 그리고 이름이 좀 특이했는데, 이는 연구팀 대부분이 Google 직원이여서 아마 이름을 GoogLeNet이라고 하지 않았나 유추해봅니다. 이 모델은 1x1 Conv layer의 사용이나 depth를 늘려 모델의 성능을 개선시키는 등 VGGNet과 유사한 점이 꽤 많습니다. 하지만 GoogLeNet은 아주 독특한 구조를 가지고 있는데, 그 이름은 그 유명한 인셉션(Inception) 입니다. 이제부터 Google팀에서 왜 이 구조의 이름을 인셉션이라 지었는지, VGGNet과는 어떤 점에서 다른지 알아보겠습니다. 초록에서는 GoogLeNet의 특징에 대해 간략히 나타내고 있습니다. 이의..

    [ 딥러닝 논문리뷰 - PRMI Lab ] Very Deep Convolutional networks for large-scale image recognition (16-19 VGG net)

    [ 딥러닝 논문리뷰 - PRMI Lab ] Very Deep Convolutional networks for large-scale image recognition (16-19 VGG net)

    해당 논문을 읽기 전에 제가 조사한 몇가지에 대해 정리해보도록 하겠습니다. CNN에서 filter의 크기가 끼치는 영향 합성곱 신경망(Convolution Neural Networks, CNN)에서 필터의 크기는 네트워크가 이미지의 어떤 부분을 인식하는 데 얼마나 많은 정보를 사용하는지 결정합니다. 필터의 크기는 아래와 같은 영향을 끼칩니다. 수용 필드(Receptive Field): 필터의 크기는 각 출력 픽셀이 입력 이미지의 어떤 부분을 '보는' 범위, 즉 수용 필드를 결정합니다. 큰 필터(예: 5x5 또는7x7)는 더 넓은 수용 필드를 가지므로 이미지의 더 넓은 부분을 고려합니다. 이는 더 큰 패턴이나 객체를 인식하는 데 도움이 될 수 있습니다. 파라미터의 수: 필터의 크기가 클수록 학습해야 하는 ..