[200319] 현대자동차

시퀀스만 예측하는 것이 아니라 외부 인자를 투입하여 다변량 시계열 예측을 만든다. 품질 분류 알고리즘을 하는 것은 2020.05월 부터 개시

패턴분석 및 기계학습을 통한 예측 기술 개발

  • 데이터의 EDA 측면

  • 사용하였던 변수 자료, 이상치를 제거함.

  • 기존에는 차량에 대한 정보만을 가지고 있어서, 없는 데이터 같은 경우 평균으로 채웠는데, 다른 변수들로 결측치를 채워넣음.

  • 모델 : Self Attention RNN

  • Evaluation : LogRank 테스트

  • 질문 : MSE는 너무 단순해서 다른 지표로 무엇을 두어야 할까?

고장발생 영향변수 기반 다변량 예측

  • 예측하고자 하는 클래임에 정말 영향을 미치는지 보기 위해서 Feature Selection 알고리즘을 사용하여 정말 이 변수가 유의미한지 알 수 있음.

    • Model : R

    • Iterative Feature Selection : 회귀 분석에서 Stepwise, Foreward, Backward 3가지의 알고리즘을 트리모델로 진행하는 것을 말함. Feature Importance 를 두어서 회귀분석의 모델 선택방법과 동일하게 진행됨.

  • RNN 에 외부 변수를 포함하여 모델링 함.

    • 아이디어 1: 확률변수만 RNN Cell 에 들어갔는데 외부변수를 컨캣해서 넣는다.

    • 아이디어 2 : 스코어링

    • 부품별로 Cell에 예측이 되고

    • ForcastNet(Nips) 기존에 컨볼루션 순차적으로 처리하는 RNN 임.

  • 피드백 : 다양한 접근방식을 고려해서 선별하도록 하겠다 추가

클레임 데이터 기반 내구 & 품질 문제 분류 알고리즘 개발

  • 일반전장인데 계층적으로 연결이 되는지 확인

  • 클러스터링 알고리즘

    • 네가지 클레임을 K means는 이상치까지 군집이 되니깐 이상치는 떼네어서 군집하기를 원함

      • DBSCAN /DBSCAN 알고리즘

CNN+RNN =>LRCN 에 어떻게 GradCam 을 사용하는지는 이전에 없나?? 방법론적인 연구주제임.

[ GradCam 논문읽기 ]

클레임 MSE는 너무 단순해서

전체

Last updated