본문 바로가기

분류 전체보기

(67)
[ADP 실기준비] 1. 시계열분석 1. 시계열분석 간단정리 정상 시계열의 조건 - 일정한 평균 - 일정한 분산 - 공분산은 t가 아닌 s에 의존 일변량 시계열분석 - 자기회귀모형(AR), 이동평균(MA), Box-Jenkins(ARMA), 지수 평활법, 시계열 분해법 등 2. 예제: 영국 왕들의 사망시 나이 데이터 예측 https://rpubs.com/ryankelly/ts6 RPubs - TimeSeriesAnalysisExamples rpubs.com kings
[R] Catboost 이론 참고 https://dailyheumsi.tistory.com/136 Catboost 주요 개념과 특징 이해하기 비교적 가장 최근에 등장한 Catboost 에 대해 관심이 생기던 찰나, 최근에 Medium Article 로 Catboost 를 잘 정리해놓은 글이 있어, 이를 참고하여 Catboost 에 관한 내용들을 정리해본다. (참고가 아니라 사 dailyheumsi.tistory.com 기존 부스팅 모델의 문제점 1) 느린 학습 속도 배깅의 경우 여러 트리들이 병렬적으로 모델학습을 수행하고 부스팅의 경우 순차적으로 모델의 학습을 수행하기 때문에 학습 속도가 느리다. 2) 오버피팅 부스팅은 '잔차'를 줄여나가기 위해 학습하는 모델이기 때문에 High Variance한 모델일 수 밖에 없다. Catboo..
[R] 사용되지 않는 level 제거하기 (feat. drop.levels함수) #1번) 원데이터의 credit변수 head(data$credit) ##[1] 1 1 2 0 2 1 ##Levels: 0 1 2 #2번) filter를 적용한 데이터의 credit변수 data2%filter(data$credit%in%c(0, 1)) head(data2$credit) ##[1] 1 1 0 1 0 0 ##Levels: 0 1 2 0, 1, 2의 값을 가질 수 있는 범주형 변수가 있다고 할 때, filter를 적용해 0, 1의 값만 가지는 관측치만 새로 생성했다. 하지만 levels은 0, 1, 2를 그대로 가지는 것을 확인할 수 있다. 이러한 경우 예전에 어떻게 처리했는지 기억이 나지 않아 검색을 해보니, gdata 패키지의 drop.levels 함수를 사용하면 된다고 한다. 이렇게 ! d..
[경제 이슈] 2021년 4월 14일 기사 정리✍🏻 - 실질금리, 대부업계 2금융 진출, AI은행원 종이신문을 구독하고 있는데, 오늘 경제파트에서 기록해놓고 싶은 주제들이 몇 가지 있어 공유해보려고 합니다 !! 1. 실질금리 4년來 최저…유동성 최대폭 증가 news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=101&oid=015&aid=0004529594 실질금리 4년來 최저…유동성 최대폭 증가 시중 유동성이 지난 2월에만 40조원 넘게 늘었다. 월간 증가폭 기준으로 역대 최대다. 가계·기업이 실생활에서 체감하는 실질금리(명목금리-기대 인플레이션율)가 최근 4년 새 가장 낮은 수준으 news.naver.com 기사요약 시중 유동성이 지난 2월에만 40조원 넘게 늘었다. 가계, 기업이 실생활에서 체감하는 실질금리(명목금리-기대 인플레이션율)가 최근 4년 새 가장 낮..
[python] 44. 신규 아이디 추천 문제 출처- kakao bline recruitment 2021 programmers.co.kr/learn/courses/30/lessons/72410 코딩테스트 연습 - 신규 아이디 추천 카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 programmers.co.kr 문제 설명 카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는..
[머신러닝] 2. 선형회귀분석- 고려해야 할 요소, 잠재적 문제(feat. R Code) 회귀분석의 이론, 구축 방법 보다는 모델 구축에서 주의해야 할 요소, 가정을 위주로 정리했습니다 👩🏻‍💻 선형회귀에서 중요한 몇 가지 질문 1. 반응변수와 설명변수 사이에 상관관계가 있는가? p개의 설명변수가 있는 다중회귀에서는 모든 회귀계수들이 0인지, F-통계량을 계산하여 가설검정을 한다. n이 큰 경우에는 F-통계량이 1보다 약간만 크면 귀무가설(모든 회귀계수들이 0)에 반하는 증거가 된다. 반대로 n이 작은 경우 귀무가설을 기각하려면 더 큰 F-통계량이 필요하다. 2. 중요 변수의 결정 모델의 quality를 평가하는 통계 맬로우즈(Mallows) Cp AIC(Akaike information criterion) BIC(베이즈 정보기준, Bayesian information criterion) 수..
[면접] 2021 농협은행 6급 일반 면접 후기 며칠전에 농협은행 6급 면접을 보고 왔습니다아 😇 취준을 오래 하면서 면접을 꽤 보러 다녔는데, 기록해두지 않아서 떨어지면 남는게 없는 느낌이더라구요...!! 이제부터라도 블로그를 제 타임라인으로 만들어보고자 이렇게 후기를 남기려고 합니다 ㅎㅎㅎㅎ! 집단면접 6급은 집단면접, 토의면접 두 가지로만 이루어져 있습니다 조마다 어떤 유형의 면접을 먼저 볼지는 다르지만, 저는 한 시간 정도 대기를 하다가 집단면접을 먼저 봤습니다 5:5로 진행이 되었고, 이건 지역마다 다른거 같은데 제가 본 지역은 꼬리질문, 개별질문 없이 공통질문으로만 진행되었어요..!! 자기소개 30초 농은에서 진행 중인 사업 중 관심 있는 것을 하나 고르고, 자신..
[머신러닝] 1. 통계학습 1. 예측과 추론 예측 f를 추정하여 반드시 Y에 대해 예측하는 것이 목적 Y에 대한 예측의 정확성은 축소가능 오차와 축소불가능 오차로 나눌 수 있는데, 위 수식의 전자가 축소가능 오차이고 후자가 축소불가능한 오차 전자는 적절한 통계 기법을 사용하여 축소할 수 있지만, 후자의 error는 X를 사용하여 예측할 수 없기 때문에 축소할 수 없음 추론 종속변수(Y)와 독립변수(X) 사이의 관계를 이해하길 원하거나, 독립변수의 함수로서 종속변수가 어떻게 변하는지 이해하는 것이 목적 2. f의 추정 모수적 방법 모델 기반의 기법을 모수적 방법이라고 하며, 파라미터를 추정하는 문제로 되기 때문에 f에 대한 모수적 형태를 가정하는 것은 f를 추정하는 문제를 단순화함 다만, 선택된 모델이 f의 실제 모양과 너무 다르면..