2. 데이터 분석 (3) 썸네일형 리스트형 CNN, RNN 정리 Tenserflow Tensorflow 1.x- session을 단위로 실행 코드를 작성cf. Keras: Tensorflow의 모델 구현과 학습을 편리하게 작성하기 위한 API Tensorflow 2.0- Keras를 Tensorflow내에 포함 Tensorflow 2.7- LSTM을 포함한 구조의 연산을 최적화함 과적합을 막는 방법 1. 데이터를 늘림2. Early stop3. Data augmentation tf.keras.Model.fit() - batch_size: 한번에 입력할 데이터의 수- epochs: 학습 데이터를 반복하여 학습할 횟수- steps_per_epoch: 한 epoch은 몇 번의 입력을 수행하는지- verbose: 0(출력X), 1(진행바를 표시하여 진행상황 표시), 2(진행.. [ADP 실기준비] 1. 시계열분석 1. 시계열분석 간단정리 정상 시계열의 조건 - 일정한 평균 - 일정한 분산 - 공분산은 t가 아닌 s에 의존 일변량 시계열분석 - 자기회귀모형(AR), 이동평균(MA), Box-Jenkins(ARMA), 지수 평활법, 시계열 분해법 등 2. 예제: 영국 왕들의 사망시 나이 데이터 예측 https://rpubs.com/ryankelly/ts6 RPubs - TimeSeriesAnalysisExamples rpubs.com kings [R] Catboost 이론 참고 https://dailyheumsi.tistory.com/136 Catboost 주요 개념과 특징 이해하기 비교적 가장 최근에 등장한 Catboost 에 대해 관심이 생기던 찰나, 최근에 Medium Article 로 Catboost 를 잘 정리해놓은 글이 있어, 이를 참고하여 Catboost 에 관한 내용들을 정리해본다. (참고가 아니라 사 dailyheumsi.tistory.com 기존 부스팅 모델의 문제점 1) 느린 학습 속도 배깅의 경우 여러 트리들이 병렬적으로 모델학습을 수행하고 부스팅의 경우 순차적으로 모델의 학습을 수행하기 때문에 학습 속도가 느리다. 2) 오버피팅 부스팅은 '잔차'를 줄여나가기 위해 학습하는 모델이기 때문에 High Variance한 모델일 수 밖에 없다. Catboo.. 이전 1 다음