AIML
[ 딥러닝 - 모델구현 ] - VGG11/16/19 Net
이번에는 VGG Net을 실제로 PyTorch로 구현해 보고 성능까지 검증해보도록 하겠습니다. from google.colab import drive import os import sys drive.flush_and_unmount() drive.mount('/content/drive/') sys.path.append("/content/drive/MyDrive/DeepLearning") 먼저 위와같이 colab과 google 드라이브를 마운트 해줍니다. ''' 필요 라이브러리들을 불러온다. ''' import copy import numpy as np import torch import torch.nn as nn import torch.nn.functional as F import torch.optim a..
[딥러닝 - 논문 리뷰 PRMI Lab] - Going Deeper with Convolutions (CVPR 2015) - GoogLeNet
이번에는 ILSVRC 2014에서 이전에 본 VGGNet을 제치고 1등을 차지한 GoogLeNet을 다루어 보려고 합니다. 그리고 이름이 좀 특이했는데, 이는 연구팀 대부분이 Google 직원이여서 아마 이름을 GoogLeNet이라고 하지 않았나 유추해봅니다. 이 모델은 1x1 Conv layer의 사용이나 depth를 늘려 모델의 성능을 개선시키는 등 VGGNet과 유사한 점이 꽤 많습니다. 하지만 GoogLeNet은 아주 독특한 구조를 가지고 있는데, 그 이름은 그 유명한 인셉션(Inception) 입니다. 이제부터 Google팀에서 왜 이 구조의 이름을 인셉션이라 지었는지, VGGNet과는 어떤 점에서 다른지 알아보겠습니다. 초록에서는 GoogLeNet의 특징에 대해 간략히 나타내고 있습니다. 이의..
[ 딥러닝 논문리뷰 - PRMI Lab ] Very Deep Convolutional networks for large-scale image recognition (16-19 VGG net)
해당 논문을 읽기 전에 제가 조사한 몇가지에 대해 정리해보도록 하겠습니다. CNN에서 filter의 크기가 끼치는 영향 합성곱 신경망(Convolution Neural Networks, CNN)에서 필터의 크기는 네트워크가 이미지의 어떤 부분을 인식하는 데 얼마나 많은 정보를 사용하는지 결정합니다. 필터의 크기는 아래와 같은 영향을 끼칩니다. 수용 필드(Receptive Field): 필터의 크기는 각 출력 픽셀이 입력 이미지의 어떤 부분을 '보는' 범위, 즉 수용 필드를 결정합니다. 큰 필터(예: 5x5 또는7x7)는 더 넓은 수용 필드를 가지므로 이미지의 더 넓은 부분을 고려합니다. 이는 더 큰 패턴이나 객체를 인식하는 데 도움이 될 수 있습니다. 파라미터의 수: 필터의 크기가 클수록 학습해야 하는 ..
[딥러닝 - PyTorch] - TORCH.NN 이 무엇일까?
PyTorch는 우리가 신경망(neural network)를 생성하고 학습시키는 것을 도와주기 위해서 torch.nn, torch.optim, Dataset, DataLoader와 같은 잘 디자인된 모듈과 클래스를 제공합니다. 이들의 성능을 최대한 활용하고 여러분야의 문제에 맞게 커스터마이즈하기 위해서, 정확히 이들이 어떤 작업을 수행해야 하는지 이해할 필요가 있습니다. 우리는 먼저 이들 모델들로 부터 아무 피쳐도 사용하지 않고 MNIST 데이터 셋에 대해 기초적인 신경망을 학습시킬 것입니다. 우리는 처음에 가장 기초적인 PyTorch 텐서(tensor) 기능만을 사용할 것입니다. 그리고 우리는 점차적으로 torch.nn, torch.optim, Dataset, 또는 DataLoader로부터 한번에 하나..