transformer model

[1/1]

  1. PyTorch Transformer 모델에서 src_mask와 src_key_padding_mask 차이점
    PyTorch Transformer 모델에서 src_mask와 src_key_padding_mask는 모두 어텐션 메커니즘에서 사용되는 마스크이지만, 서로 다른 역할을 수행합니다.2. src_masksrc_mask는 특정 위치가 어텐션 과정에서 다른 위치와 연결되는 것을 방지하는 데 사용됩니다