Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- def validation
- def train
- Instruction dataset
- 주식 용어정리
- 특정 layer 동결
- KOSMOS-2
- 논문 작성 요령
- MLLM
- Video Understanding
- Foundation Transformers
- 파라미터 수
- 논문리뷰
- cnn
- DeepNet
- mPLUG-2
- 강화학습
- 모델 freeze
- 특정 layer 추출
- 파라미터 수 확인
- mqtt
- 가중치 없이 모델 로드
- Multimodal Large Language Model
- 가상환경
- vsocde 익스텐션
- 주식
- pretrained model layer
- 논문 작성
- layer 추출
- 모델 동결
- 모델 구조 변경
Archives
- Today
- Total
목록cartpole (1)
시작은 미약하였으나 , 그 끝은 창대하리라
[5] 강화학습 Q-Network
출처(기반으로 작성되었습니다): https://www.youtube.com/watch?v=w9GwqPx7LW8 1. 앞에서 배운 Q-Table 복습 2. Q-tabel 의 문제점 및 해결법 3. Q-Network = Q table을 Neural network 로 구현한것 network(Neural network) 는 입,출력이 조절가능한 네트워크임으로, 입력을 state만, 출력을 action으로 하여 설계할 것이다. 4. Q-Network 결론 5. Q-Network Training 과정 6. Q-Network 수학적 표기법 7. Q-Network Algorithm 8. Stochastic 수식을 사용하지 않는 이유. 잘 생각을 해보면 앞장에서 Q 업데이트시 Stochastic 수식에 대해서 배웠는데,..
인공지능/강화학습
2023. 2. 15. 00:48