전체 글136 데이스쿨 스터디 - 전력 사용량 예측 [3] (모델링) - 새로 알게 된점 및 중요사항: 1. 시계열 데이터를 성능검증할때 sktime의 temporal_train_test_split 사용. (시계열에서 이걸사용하는게 맞음. 순서 정보 유지해야 하니깐.) = train_test_split( shuffle=False) 랑 동일 함. (시계열에서는 False 해야함) 2. seed 를 여러개로 설정후 반복해서 모델을 일반화 하여 평가함. 3. test_size를 0.0~1.0 의 float 형태로 할 수 있지만. 구체적인 int값으로 하여 설정가능. int로 하면 test_size의(시계열 데이터에서 가장 최근데이터(마지막데이터)) 구체적인 값의 범위 설정가능 # 1번 확인을 위한 예시 코드 from sktime.forecasting.model_selection.. 2023. 10. 21. 데이스쿨 스터디 - 전력 사용량 예측 [2] (전처리) ➢ sns.pointplot : 중앙값으로 표현하는 plot ➢ 기타. 1. building_type 이라는 컬럼명에서 type 별로 분류하는 코드. other_buildings = train_merge[train_merge['building_type'] == 'Other_Buildings'] Public = train_merge[train_merge['building_type'] == 'Public'] University = train_merge[train_merge['building_type'] == 'University'] Data_Center = train_merge[train_merge['building_type'] == 'Data_Center'] Department_Store_and_Outle.. 2023. 10. 13. 데이스쿨 스터디 - 전력 사용량 예측 [1] 참여이유 : 심플하게 말해서 나에 대해 객관화를 하고 싶어 스터디에 들어갔고, 나보다 잘하는 사람들에게 배우고 싶어서 참여했다. 또한 알고 있는 개념들도 많이 있지만 예전에 보았을때와 지금 다시 보았을때 느낌은 다르기 때문에 느껴보고 싶었다. 주관 : https://dacon.io/competitions/official/236162/overview/description [데이스쿨 스터디 1기] 전력사용량 예측 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io def seed_everything(seed: int): import random, os import numpy as np import torch random.seed(seed) os.envi.. 2023. 10. 1. [논문리뷰 : 개념] VATT : Transformers for Multimodal Self-Supervised Learning From Raw Video, Audio and Text 2023. 9. 10. [ViT] 비전 트랜스포머 코드구현 및 실행. 논문: https://arxiv.org/abs/2010.11929 참고 깃허브: https://github.com/FrancescoSaverioZuppichini/ViT/tree/main 필자 깃허브( 코드 다운) : https://github.com/YongTaeIn/ViT ❏ 아래의 ppt와 같은 구조로 모델이 수행된다. ➢사실상 Transformer모델을 간파하고 있다면 초기의 input에서 patch로 변환하는것 이외에는 색다른 부분이 없다. ➢ Patching +CLS Token+ embedding # patch embedding # Add CLS Token # position embedding import torch import torch.nn.functional as F import matp.. 2023. 8. 11. [시계열 데이터] 해석 기법 시계열 데이터를 해석하는 방법에 알아보려 한다. 1. Heatmap # 1. 데이터에서 원하는 feature들만 추출 하여서, 딕셔너리 형태로 만들어줌. data_dict = { 'featrue_1': amp, 'featrue_2': voltage, 'featrue_3': tem, 'featrue_4 ': nu, 'featrue_5 ': cu } # 2. DataFrame의 형식으로 변환 df = pd.DataFrame(data_dict) # 3. heatmap으로 표현. plt.rc('font', size=12) # 기본 폰트 크기 plt.rc('axes', labelsize=13) # x,y축 label 폰트 크기 plt.rc('xtick', labelsize=13) # x축 눈금 폰트 크기 plt... 2023. 8. 3. 이전 1 ··· 8 9 10 11 12 13 14 ··· 23 다음