일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- layer 추출
- 모델 freeze
- mqtt
- def train
- KOSMOS-2
- 논문 작성
- mPLUG-2
- 3C4P
- cnn
- DeepNet
- 모델 동결
- MLLM
- Foundation Transformers
- 주식
- 강화학습
- Video Understanding
- 모델 구조 변경
- 논문 작성 요령
- 가상환경
- 파라미터 수 확인
- def validation
- 특정 layer 추출
- 가중치 없이 모델 로드
- pretrained model layer
- 특정 layer 동결
- 논문리뷰
- Instruction dataset
- 주식 용어정리
- 파라미터 수
- Multimodal Large Language Model
- Today
- Total
목록인공지능 (35)
시작은 미약하였으나 , 그 끝은 창대하리라
► Pretrained되어 있는 모델을 load를 하면 Freeze(bias=False)되어 있는 것도 있고 Trainable한 파라미터(bias=True) 인 것도 있다. 어떤 문제를 해결할 것이냐에 따라 Freeze가 유용할수도 있고 아닐 수도 있다. 이번 글에서는 Freeze를 하는 방법에 대해 소개와 동시에 필요한 layer만 Trainable하게 설정하는 방법을 알아보겠다. → 특정 layer만을 Trainable 하게하는 방법은 다음과 같다. 1. 모든 layer에 대해 False로 설정 (=Freeze). 2. 그 후 원하는 layer들에 대해서만 True로 설정. 1. 모델로드→ DETR모델 활용중from transformers import DetrForObj..
목차모델 로드특정 Layer 만을 추출backbone 모델추출구체적인 특정 layer만 추출 1. 모델 로드from transformers import DetrForObjectDetectionmodel_DETR= DetrForObjectDetection.from_pretrained("facebook/detr-resnet-50", revision="no_timm")# Model 의 key 값 확인for i in model_DETR.state_dict().keys(): print(i) → model 의 key 값 출력 결과model.backbone.conv_encoder.model.embedder.embedder.convolution.weightmodel.backbone.conv_encoder.m..
1. 필요 모듈 설치 ➢ 중요한 모듈만 언급- torch (https://pytorch.org/get-started/previous-versions/) local 컴퓨터 버전에 맞게 알맞게 설치하기..# CUDA 11.7conda install pytorch==1.13.0 torchvision==0.14.0 torchaudio==0.13.0 pytorch-cuda=11.7 -c pytorch -c nvidia- transformerspip install transformers- pytorch-ligtningpip install pytorch-lightning 2. 데이터 셋 준비- 주의사항: DETR 의 데이터셋 format은 COCO format 으로 준비되어야 함. (다운 받은 데이터 셋의 ..
1. 가중치 없이 모델 로드 ► 우리는 허깅페이스에서 weight, bias가 최적화 되어있는 pretrained된 모델을 사용한다. 하지만 모델의 weight, bias를 제외하고 아키텍쳐만 필요할 때가 있다. Hugging Face에서는 친절하게도 이러한 기능을 제공을 해준다. - Huggingface에 원하는 모델을 검색후 config를 사용하면 된다. (아래예시는 DETR예시) (상단 코드 weight load 안함, 하단 코드 weight load 함) # load without weight and bias # Initializing a DETR facebook/detr-resnet-50 style configuration from transformers import DetrForObjectDe..
출처: David silver 교수님 자료. 내용 정리 : 교수님 수업 기반에 의한 정리 기타 팁 : 개념 그냥 이해안되도 암기부터 하고나면 이해되긴하더라... 머신러닝에 대해 큰 그림을 그려보면 아래[fig1]와 같을것이다. [fig2]에서 Agent, Environment 에 대해 설명을 해보겠다. Agent는 기본적으로 observation(t), reward(t) 를 받아 action(t)을 수행한다고 생각하면 된다. Environment는 agent의 행동에 대한 action(t)을 받을것이고 변한 다음 observation(t+1), 변한 다음 reward(t+1) 을 받게될것이다. History and State [fig3] History(H)란 말그대로 observation,action,r..
궁금증: mPLUG-2 논문을 보니 concat이라는 부분이 있었는데 깃허브 코드를 확인해보았을때는 concat의 부분이 보이지 않음. 찾아보디 Conv3d에서 인자값으로 group이 존재. 1. group 기능 : Grouped Convolution 은 입력 값의 채널들을 여러 개의 그룹으로 나누어 독립적으로 Convolution 연산을 수행하는 방식. ex) in_channels =4, group=2 이면 → 2개씩 묶어서 진행후 마지막 출력을 concat함. (그래야 쪼개진 입력차원에 대한 정보(차원크기)를 복원할 수 있으니, 예를들어 ) 기타 (딥러닝에 사용되는 다양한 Convolution 기법) : https://eehoeskrap.tistory.com/431#8.-grouped-convolut..
❏ Evaluation code ✓ train, validation 을 통한 early stopping을 수행하였으면 나온 모델을 통해 실제 예측을 수행해야하는 마지막 단계에 도달한다. 이를 위해 아래와 같이 코드를 적용하면 된다. ### Evaluation code ### ### ### # 예측값 저장하는 빈 리스트 all_predictions = [] # 모델을 평가모드로 설정. model.eval() for inputs in test_dataloader: with torch.no_grad(): inputs=inputs[0].float() x = inputs.to(device) outputs = model(x) max_values, max_indices = torch.max(outputs, 1) # ..
용도: visual studio 로 c언어를 작성해본적이 있다면 빨간점을 클릭하면 그 부분에 대해서 자세히 들어가며 디버깅을 할 수 있다. 사용 : Visual studio code 의 ipynb 확장자로 코드를 작성후 디버깅하고 싶은 부분에 import pdb;pdb.set_trace() 를 추가하면 새로운 창이 나온다. 그 줄을 기준으로 이전의 변수, 값 들은 다 할당을 받은 상태임. visual studio 의 디버깅 기능과 동일하다 보면 됨. 사용법 : 창이 나오면 n (next), q(quit), s(step) 등의 명령어를 통해 진행할 수 있다. n를 사용하면 다음줄로 넘어가고, s로 하면 그 단계에서 있는 내부 함수등으로 들어가고 q를 하면 종료 된다. 이것외에도 명령어가 있는데 공식 문서를..