본문 바로가기

Study 공부/데이스쿨 (전력사용량(시계열) 우승자코드 분석)3

데이스쿨 스터디 - 전력 사용량 예측 [3] (모델링) - 새로 알게 된점 및 중요사항: 1. 시계열 데이터를 성능검증할때 sktime의 temporal_train_test_split 사용. (시계열에서 이걸사용하는게 맞음. 순서 정보 유지해야 하니깐.) = train_test_split( shuffle=False) 랑 동일 함. (시계열에서는 False 해야함) 2. seed 를 여러개로 설정후 반복해서 모델을 일반화 하여 평가함. 3. test_size를 0.0~1.0 의 float 형태로 할 수 있지만. 구체적인 int값으로 하여 설정가능. int로 하면 test_size의(시계열 데이터에서 가장 최근데이터(마지막데이터)) 구체적인 값의 범위 설정가능 # 1번 확인을 위한 예시 코드 from sktime.forecasting.model_selection.. 2023. 10. 21.
데이스쿨 스터디 - 전력 사용량 예측 [2] (전처리) ➢ sns.pointplot : 중앙값으로 표현하는 plot ➢ 기타. 1. building_type 이라는 컬럼명에서 type 별로 분류하는 코드. other_buildings = train_merge[train_merge['building_type'] == 'Other_Buildings'] Public = train_merge[train_merge['building_type'] == 'Public'] University = train_merge[train_merge['building_type'] == 'University'] Data_Center = train_merge[train_merge['building_type'] == 'Data_Center'] Department_Store_and_Outle.. 2023. 10. 13.
데이스쿨 스터디 - 전력 사용량 예측 [1] 참여이유 : 심플하게 말해서 나에 대해 객관화를 하고 싶어 스터디에 들어갔고, 나보다 잘하는 사람들에게 배우고 싶어서 참여했다. 또한 알고 있는 개념들도 많이 있지만 예전에 보았을때와 지금 다시 보았을때 느낌은 다르기 때문에 느껴보고 싶었다. 주관 : https://dacon.io/competitions/official/236162/overview/description [데이스쿨 스터디 1기] 전력사용량 예측 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io def seed_everything(seed: int): import random, os import numpy as np import torch random.seed(seed) os.envi.. 2023. 10. 1.