컨볼루션 레이어에서 출력 크기 계산

2024-07-27

PyTorch는 딥러닝 모델 개발을 위한 인기 있는 프레임워크로, 컨볼루션 레이어를 포함한 다양한 딥러닝 레이어를 쉽게 구현할 수 있도록 제공합니다. PyTorch에서 컨볼루션 레이어의 출력 크기를 계산하는 방법은 다음과 같습니다.

기본 공식

컨볼루션 레이어의 출력 크기를 계산하는 기본 공식은 다음과 같습니다.

Output Size = (Input Size - Kernel Size + 2 * Padding) / Stride + 1

여기서:

Input Size: 입력 데이터의 크기
Kernel Size: 커널 크기
Padding: 패딩 크기
Stride: 스트라이드

예시

예를 들어, 다음과 같은 컨볼루션 레이어를 가정해 보겠습니다.

Input Size: 28 x 28
Padding: 1
Stride: 2

이 경우 출력 크기는 다음과 같이 계산됩니다.

Output Size = (28 - 3 + 2 * 1) / 2 + 1 = 14

따라서 출력 데이터의 크기는 14 x 14가 됩니다.

PyTorch 코드

PyTorch에서 컨볼루션 레이어를 구현하고 출력 크기를 계산하는 코드 예시는 다음과 같습니다.

import torch

# 컨볼루션 레이어 정의
conv = torch.nn.Conv2d(in_channels=1, out_channels=32, kernel_size=3, stride=2, padding=1)

# 입력 데이터
input = torch.randn(1, 1, 28, 28)

# 컨볼루션 연산 수행
output = conv(input)

# 출력 크기 출력
print(output.size())

이 코드는 1채널, 28 x 28 크기의 입력 데이터를 32채널, 14 x 14 크기의 출력 데이터로 변환하는 컨볼루션 레이어를 구현합니다.

추가 고려 사항

Dilation: 딜레이션(dilation)은 커널 사이에 빈 공간을 추가하는 옵션입니다. 딜레이션을 사용하면 출력 크기가 달라질 수 있습니다.
Global Average Pooling: 글로벌 어베리지 풀링(global average pooling)은 마지막 컨볼루션 레이어의 출력 데이터를 평균하여 1 x 1 크기의 출력 데이터로 변환하는 옵션입니다. 이 경우 출력 크기는 1 x 1이 됩니다.

참고 자료

예제 코드

import torch

# 컨볼루션 레이어 정의
conv = torch.nn.Conv2d(in_channels=1, out_channels=32, kernel_size=3, stride=2, padding=1)

# 입력 데이터
input = torch.randn(1, 1, 28, 28)

# 컨볼루션 연산 수행
output = conv(input)

# 출력 크기 출력
print(output.size())

설명

torch.nn.Conv2d 클래스를 사용하여 컨볼루션 레이어를 정의합니다.
in_channels 매개변수는 입력 데이터의 채널 수를 지정합니다.
kernel_size 매개변수는 커널 크기를 지정합니다.
stride 매개변수는 스트라이드를 지정합니다.
padding 매개변수는 패딩 크기를 지정합니다.
torch.randn 함수를 사용하여 1채널, 28 x 28 크기의 랜덤 입력 데이터를 생성합니다.
conv 레이어에 input 데이터를 입력하여 컨볼루션 연산을 수행합니다.
output 변수의 size 속성을 출력하여 출력 크기를 확인합니다.

결과

torch.Size([1, 32, 14, 14])

위 코드는 기본적인 예시이며, 실제 모델에서는 다양한 옵션을 추가하여 컨볼루션 레이어를 구현할 수 있습니다.
컨볼루션 레이어를 사용하기 전에 입력 데이터의 크기가 컨볼루션 연산에 적합한지 확인해야 합니다.
컨볼루션 레이어의 출력 크기를 계산하는 공식은 위에 설명된 공식 외에도 다양한 변형이 존재합니다.

컨볼루션 레이어 출력 크기 계산 대체 방법

PyTorch torch.nn.Conv2d 클래스의 output_size 속성

PyTorch torch.nn.Conv2d 클래스는 output_size 속성을 제공합니다. 이 속성은 컨볼루션 레이어의 출력 크기를 튜플 형태로 반환합니다. 다음 코드는 output_size 속성을 사용하여 출력 크기를 계산하는 예시입니다.

import torch

# 컨볼루션 레이어 정의
conv = torch.nn.Conv2d(in_channels=1, out_channels=32, kernel_size=3, stride=2, padding=1)

# 입력 데이터
input = torch.randn(1, 1, 28, 28)

# 출력 크기 계산
output_size = conv.output_size(input.size())

# 출력 크기 출력
print(output_size)

nn.functional.conv2d 함수

PyTorch nn.functional 모듈은 conv2d 함수를 제공합니다. 이 함수는 컨볼루션 연산을 수행하고 출력 데이터를 반환합니다. 다음 코드는 conv2d 함수를 사용하여 출력 크기를 계산하는 예시입니다.

import torch
from torch.nn import functional as F

# 컨볼루션 연산 수행
output = F.conv2d(input, conv.weight, stride=conv.stride, padding=conv.padding)

# 출력 크기 계산
output_size = output.size()

# 출력 크기 출력
print(output_size)

직접 계산

위에 설명된 공식을 사용하여 직접 출력 크기를 계산할 수 있습니다.

온라인 계산기

온라인에서 사용할 수 있는 컨볼루션 레이어 출력 크기 계산기도 있습니다. 다음 링크는 대표적인 온라인 계산기입니다.

딥러닝 프레임워크 제공 도구

TensorFlow, Keras 등 다른 딥러닝 프레임워크도 컨볼루션 레이어 출력 크기를 계산하는 도구를 제공합니다.

machine-learning deep-learning pytorch