[200302]

CGCNN

K fold 를 통해서 CV(Cross Validation) 에 대해서

  • 실제값과 예측값에 대한 차이 에다 제곱을 한 다음에 평균을 하면 MSE

  • (yy)2(y - y')^2 잔차들에 대해서 표준편차를 구하는 것이 일반적이다. (CV, 신뢰구간)

하나의 CV 안에 데이터가 10개 존재함. 0.161 예측이 어려운 객체가 다수 들어가게 되면 한 폴드에 클 수 있다. 시각화가 필요함.

Leave-One-Out-Cross-Validation (LOCV)

FOC : 연료 소모량

왜 Fold 마다 다르지??? =>Nested Cross Validation

결측치 Imputation 으로 각각의 피처들이 스케일이 다를 수 있을 것 같다 평균을 내면 안된다.

  • Median 작은 것으로 모델 후보를 선정함

  • 최종 결론 : GBM 이 가장 높음

CIF 파일 변환

  • atom feature 에 대한 정보 : (niatomfealen)(n_i * atomfealen)

    • ni:n_i : 한 결정 구조안에 있는 원자(노드)수

    • atomfealen:atomfealen: Number of atom hidden features

  • neighbour feature

기상 데이터 Interpolation 연구 (에너지연구원)

  • Spline

    • Spline Regression :

    f(x)+ϵf(x) + \epsilon 을 추정하고 싶을 때, f(x)f(x)' 스무딩 그 점을 안지난다.

  • Spline Interpolation :

    • 실제로 관측한 값이니깐, 그 점을 무조건 지나면서, 외부 요인으로 채워넣는다.

  • 단일 차원 -> 2d tensor 로 변환해야한다.

    • object oriented

  • Linear Spline :

  • Cubic Spline : 픽셀과 픽셀 사이의 bases 는 기저이다. Linearly Independant 하고 전체 Space를 non parameter

  • Super SloMo 논문

    • 프로젝트 발표, 관련 논문 리뷰 구분되서 함.

    • t=0인 시점이랑 t =1 인 시점 사이에 중간 프레임을 생성하는 방법임.

    • 일사량이 높다는 곳은 구름이 없다는 곳이며

    • 평균을 하면 안됨, 특정 픽셀을 사용함.

  • 보간법

    • 특정 픽셀의 특정 시간대의 값이 있을 때, 그 사이의 추정된 값을 하는 것을 말한다. Spline 한다는 것은 전체 데이터로 스무딩하는 것을 말함.

    • 실제 데이터를 안지날 수 있음.

    • sin(x)+ϵsin(x) + \epsilon 는 싸인함수에 노이즈가 있는 경우를 말함

    • 싸인함수를 알 경우에는 싸인함수를 이야기 하면됨. 하지만 모를 경우 너무 노이즈에 fit 되면 오버피팅이 됨. 피팅한 값을 수무딩하면 됨. 더 스무딩을 하면, 직선이 됨.

    • i=1n(yy)2+panalty\sum_{i=1}^{n}(y'-y)^2 + panalty 는 RSS (Residual Sum of Squares) 이다. Functional Analysis 에서는 polynomial 다항식을 쓰면 차원수가 커지면 더 복잡하게 피팅이 됨. polynomial degree를 높이냐 낮추냐, kernel regression은 bandwith로 결정한다. bandwidth를 더 크게 하면 스무딩하게 피팅한다. not과 not 사이가 클수록 전체 3차 다항식으로 피팅함. not이 두개면 부분 별 3차식 피팅을 함. not 사이즈가 높을수록 더 복잡하게 피팅을 하기 때문에 not 사이즈가 중요함.

    • 중요한 하이퍼파라미

      • 어떤 Lot? Not 을 촘촘히 할꺼냐, 넓게 할꺼냐

      • 어떤 람다? 3차 다항식 앞에 계수를 panalty 를 주어서 Rige Lambda 를 Lambda가 커지면 계수가 줄어든다.

    • Fitness + Panalty : BIC, AIC 가장 작은 람다와 Lot을 사용함.

    • Cross Validation : 1 Leave Out CV 를 사용할 수 있다. 데이터를 하나 빼고, 두번째 차이를 추정한다. 이것을 기반으로 어떤 하이퍼파라미터가 좋은지 AIC, BIC 측정기준으로 구할 수 있음.

    • Generalized CV , CV는 갯수별로

    • 1500 개, 1장에는 일주일 치가 들어있다. 전체를 합친다. 시간에 대해서 하나의 값임.

    • 하나의 이미지의 픽셀이 모든 픽셀에 대해서 따로따로 해주어야 한다.

    • 모든 픽셀에 동일한 람다를 사용할지, 픽셀별 다른 람다를 사용할지 이슈임. 동일한 람다를 사용할 꺼면, 시간별, 픽셀별 두개의 인덱스를 두어서 식 i=1n(yy)2+panalty\sum_{i=1}^{n}(y'-y)^2 + panalty 을 재정의 해야함.

  • B-Spline Interpolation

  • Hermite , Bezier Spline

    • Cardinal Interpolation

    • Uniform B-Spline

      • Bezier Spline 을 연결, 모든 제어점을 지난지 않음.

      • 모든 기저함수 (Basic Function) 이 같은 모양임.

    • Non-Uniform B-Spline

      • 끝점을 지나며, 기저함수의 모양이 다름

    • Non-Uniform Rational B-Spline (NURBS)

      • 제어점에 가중치가 있음

  • Non parametric Regression 이라는 학문 (교수님 이해)

    • Linear Spline / Quadratic Spline / Cubic Spline / B-Spline :데이터를 스무딩할 때 기저함수(Basis)를 무엇으로 할 것이냐에 따라

    • 커널 스무딩/ 스플라인 스무딩으로 중간값을 추정함.

  • Spline Interpolation (학생 이해)이라는 분야가 따로 있다.

Cubic Spline : 3차식이다.

Microsurgery

  • Tremor Motion 을 Compensation 을 하면

  • Membrane

  • 예측 시간이 길어질수록 예측 정확도는 현저하게 떨어짐.

  • Band pass filtering

  • Frequency based Decomposition 푸리에 변환 : 모든 함수 : 싸인과 코싸인의 합으로 나타낼 수 있다.

  • 푸리에 변환 후 딥러닝 한 연구는 많이 있었다. 여기서 하고자 하는 것은 bandwith로 분할된 입력값을 넣는다.

  • 사람의 손떨림이 2HZ 이상이 될 수 없다. 이것을 ground truth 로 여기는 연구가 많음.

    • Tremor based formulation

    • Voluntary motion based formulation

  • 1 D Convolution 은 Spatial Filtering 임.

  • SINC-R module

    • 우리가 찾는 필터가 아니라고 생각함. 따라서 우리가 생각한 필터 모양이 나오도록 한 것이 SINC-R 필터임.

Density Based Local Outlier Detection

LOF (Local Outlier Detection) 군집과 군집 사이에 조그마게 많은 아웃라이어 스코어가 높다 밀도를 고려한 아웃라이어 Detection 이다.

2차원 이상에서 유클리드 거리를 사용하면 문제점이 있다!!???

딥러닝을 하면 수학적인 함수에서 시뮬레이션을 안한다. A 방법이 있는데, A가 B 보다 더 좋은 것을 보여줄때는 두가지 방법 (1) 수학적으로 n 으로 갈때 asympotisis 하게 내것이 낫다. (2) 모든 가정에서 대부분 내것이 낫다고 시뮬레이션을 한다.

여러가지 경우를 다 보여주는 것이 좋다.

어떤 경우에 얼마나 더 낫다고 보여주는게 중요하다. 논문을 쓸떄, 시뮬레이션을 하면 많이 걸린다.

abnovality

Clustered Outliers 가 있다면 어떻게 감지할 수 있을지

거리 계산법 클러스터링

GAN

U-Net을 사용해서 세그멘테이션 한다

  • RGB

  • NDVI > NDRE

DeepLab V3

RGB 이미지 5채널 이미지가 더 잘된다. 식생지수 CIR 이미지로

잔차에 대한 평균 MMSE

Last updated