이미지 캡셔닝1 [Image Captioning] 이미지 캡셔닝 튜토리얼 들어가기전에..1. 이미지 캡셔닝에 대한 원리는 알고 있다는 전재하에 서술함.2. 모델은 Encoder는 Resnet50, Decoder는 GRU를 사용함.3. Flickr8k 데이터셋 사용함. (Download: https://www.kaggle.com/datasets/adityajn105/flickr8k)4. 이미지 캡셔닝 과정은 크게 2가지 과정으로 구성된다. 1). 전처리 과정 - text (caption) 전처리 2). 모델 설계 및 학습. Step1. 전처리 과정 - 토큰화 (단어 토큰화 적용)1. 필요 모듈 importimport pandas as pdimport torchimport torch.nn as nnfrom torch import optimfrom torch... 2024. 5. 19. 이전 1 다음