Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- DeepNet
- def train
- 파라미터 수
- 모델 freeze
- vsocde 익스텐션
- 특정 layer 동결
- KOSMOS-2
- 가상환경
- 모델 동결
- layer 추출
- cnn
- 파라미터 수 확인
- 논문 작성
- MLLM
- Video Understanding
- mPLUG-2
- pretrained model layer
- 주식 용어정리
- 논문리뷰
- mqtt
- 특정 layer 추출
- 가중치 없이 모델 로드
- def validation
- 논문 작성 요령
- 강화학습
- 주식
- Multimodal Large Language Model
- Foundation Transformers
- Instruction dataset
- 모델 구조 변경
Archives
- Today
- Total
목록VIT (1)
시작은 미약하였으나 , 그 끝은 창대하리라
[ViT] 비전 트랜스포머 코드구현 및 실행.
논문: https://arxiv.org/abs/2010.11929 참고 깃허브: https://github.com/FrancescoSaverioZuppichini/ViT/tree/main 필자 깃허브( 코드 다운) : https://github.com/YongTaeIn/ViT ❏ 아래의 ppt와 같은 구조로 모델이 수행된다. ➢사실상 Transformer모델을 간파하고 있다면 초기의 input에서 patch로 변환하는것 이외에는 색다른 부분이 없다. ➢ Patching +CLS Token+ embedding # patch embedding # Add CLS Token # position embedding import torch import torch.nn.functional as F import matp..
인공지능/딥러닝 사이드 Project
2023. 8. 11. 14:02