Python/개인공부

[Coursera] Supervised Machine Learning - 2

gangee 2024. 2. 19. 14:39

목차

    728x90
    반응형

    참고

    Loss function

    • 딥러닝 모델을 학습할 때 정답값과 예측값의 오차를 계산해주는 함수
    • 점수가 높을수록 안좋은 모델
    • 손실함수의 함수값이 최소화되도록 하는 weight와 bias를 찾는 것이 딥러닝 학습의 목표
      • 손실함수의 종류 : MSE, RMSE 등
        • MSE(Mean Squared Error) : 예측값과 실제값 사이의 평균 제곱 오차 정의
        • RMSE(Root Mean Squared Error) : MSE에 루트를 씌움으로써 왜곡을 줄여줌

    Multiple Linear Regression

    • 독립변수 X의 변화에 따른 종속변수 y의 변화를 선으로 예측하는 기법 중 독립변수 X가 여러 개인 분석기법

    Vectorization

    • vector : 한 가지 타입의 여러 개의 원소를 변수에 저장한 배열

    • 벡터의 같은 인덱스에 위치한 원소들끼리 연산을 수행하는 기능

      • 학습 알고리즘 구현 시, 코드가 짧아지고 실행 효율성이 좋아짐

    Gradient descent for MLR

    1. Normal equation
      • 고급 선형대수 라이브러리를 사용하여 w와 b를 반복 없이 하나의 목표로 풀 수 있는 것
      • 입력 변수의 개수가 커지면 커질수록 비효율적
    2. Gradient descent
      • 최적의 가중치와 편향 값을 경사하강법을 통해 탐색
      • 입력 변수의 개수가 커도 효율적인 연산 가능

    Classificaton

    • 머신러닝의 지도학습에 대표적인 유현 중 하나
    • 주어진 데이터를 클래스 별로 구별해 내는 과정
      • 대표적인 분류 알고리즘 : Logistic Regression, Naive Bayes 등

    Logistic Regression

    • 0이나 1인 이산적 값을 가지는 분류 알고리즘
    • 독립변수와 종속변수의 선형 관계성을 기반으로 만들어짐

    Regularization

    • 모델의 복잡도를 낮추기 위한 것
    • 과적합 문제를 개선하여 학습 알고리즘의 성능을 향상
    • 아래의 깃허브 주소를 통해 더 자세한 내용 확인 가능
      Sugyoeng Github - Machine Learning Study
    * 공부를 목적으로 정리한 내용으로 내용의 두서가 없고 부실할 수 있음
    728x90
    반응형