[200319] 현대자동차
시퀀스만 예측하는 것이 아니라 외부 인자를 투입하여 다변량 시계열 예측을 만든다. 품질 분류 알고리즘을 하는 것은 2020.05월 부터 개시
패턴분석 및 기계학습을 통한 예측 기술 개발
데이터의 EDA 측면
사용하였던 변수 자료, 이상치를 제거함.
기존에는 차량에 대한 정보만을 가지고 있어서, 없는 데이터 같은 경우 평균으로 채웠는데, 다른 변수들로 결측치를 채워넣음.
모델 : Self Attention RNN
Evaluation : LogRank 테스트
질문 : MSE는 너무 단순해서 다른 지표로 무엇을 두어야 할까?
고장발생 영향변수 기반 다변량 예측
예측하고자 하는 클래임에 정말 영향을 미치는지 보기 위해서 Feature Selection 알고리즘을 사용하여 정말 이 변수가 유의미한지 알 수 있음.
Model : R
Iterative Feature Selection : 회귀 분석에서 Stepwise, Foreward, Backward 3가지의 알고리즘을 트리모델로 진행하는 것을 말함. Feature Importance 를 두어서 회귀분석의 모델 선택방법과 동일하게 진행됨.
RNN 에 외부 변수를 포함하여 모델링 함.
아이디어 1: 확률변수만 RNN Cell 에 들어갔는데 외부변수를 컨캣해서 넣는다.
아이디어 2 : 스코어링
부품별로 Cell에 예측이 되고
ForcastNet(Nips) 기존에 컨볼루션 순차적으로 처리하는 RNN 임.
피드백 : 다양한 접근방식을 고려해서 선별하도록 하겠다 추가
클레임 데이터 기반 내구 & 품질 문제 분류 알고리즘 개발
일반전장인데 계층적으로 연결이 되는지 확인
클러스터링 알고리즘
네가지 클레임을 K means는 이상치까지 군집이 되니깐 이상치는 떼네어서 군집하기를 원함
DBSCAN /DBSCAN 알고리즘
CNN+RNN =>LRCN 에 어떻게 GradCam 을 사용하는지는 이전에 없나?? 방법론적인 연구주제임.
[ GradCam 논문읽기 ]
클레임 MSE는 너무 단순해서
전체
Last updated