728x90

MachineLearning 7

[Coursera] Advanced Learning Algorithms - 4

참고 아래의 깃허브 주소를 통해 더 자세한 내용 확인 가능 Sugyeong Github - Machine Learning Study Evaluating a model 더 많은 학습 데이터 셋 확보 피처 셋 감소 고차 다항식 추가 정규화 파라미터 값 바꾸기 Bias and Variance bias : 모델을 통해 얻은 예측 값과 실제 값 사이의 차이 variance : 주어진 데이터로 학습한 모델이 예측한 값의 변동성 Precision and Recall Precision : 모델이 positive로 예측한 샘플 중 얼마나 정확하게 실제 positive를 식별하는지 나타냄 Recall : 실제 positive인 샘플 중 얼마나 많은 샘플을 모델이 식별하는지 나타냄 Decision trees 기계학습에서 사..

Python/개인공부 2024.02.25

[Coursera] Advanced Learning Algorithms - 3

참고 아래의 깃허브 주소를 통해 더 자세한 내용 확인 가능 Sugyeong Github - Machine Learning Study Activation Function sigmoid function 입력값을 0과 1사이의 값으로 변환 기울기 소실 현상 발생 ReLU function 0보다 큰 입력값의 경우 그대로 출력 0 이하의 값은 다음 층에 전달 X : dying ReLU 현상 sigmoid function이 가지고 있는 기울기 소실 현상 완화 ELU function dying ReLU 현상을 해결한 함수 파라미터를 이용하여 입력값이 0이하 일 때 지수함수 부분의 scale 조절 가능 softmax function ReLU 함수를 부드럽게 근사시킨 함수 전 구간에서 미분이 가능한 함수 Multicla..

Python/개인공부 2024.02.23

[Coursera] Advanced Learning Algorithms - 2

참고 아래의 깃허브 주소를 통해 더 자세한 내용 확인 가능 Sugyoeng Github - Machine Learning Study Overfitting Solutions 더 많은 데이터 수집 모델 복잡도 줄이기 정규화 Regularization L1 regularization 가중치의 절댓값을 제약하는 방식 특정 가중치를 0으로 만들어 feature selection 효과를 줌으로써 불필요한 특성 제거 L2 regularization 가중치의 제곱을 제약하는 방식 가중치를 0으로 만들지 않고, 작은 값으로 만들어 모든 특성이 조금씩 모델에 영향을 줄 수 있도록 함 Neural Networks 사람의 뇌를 모방할 수 있는 기계를 만들기 위한 아주 오래된 알고리즘 데이터를 처리하도록 컴퓨터를 가르치는 인공..

Python/개인공부 2024.02.20

[Coursera] Supervised Machine Learning - 2

참고 아래의 깃허브 주소를 통해 더 자세한 내용 확인 가능 Sugyoeng Github - Machine Learning Study Loss function 딥러닝 모델을 학습할 때 정답값과 예측값의 오차를 계산해주는 함수 점수가 높을수록 안좋은 모델 손실함수의 함수값이 최소화되도록 하는 weight와 bias를 찾는 것이 딥러닝 학습의 목표 손실함수의 종류 : MSE, RMSE 등 MSE(Mean Squared Error) : 예측값과 실제값 사이의 평균 제곱 오차 정의 RMSE(Root Mean Squared Error) : MSE에 루트를 씌움으로써 왜곡을 줄여줌 Multiple Linear Regression 독립변수 X의 변화에 따른 종속변수 y의 변화를 선으로 예측하는 기법 중 독립변수 X가 ..

Python/개인공부 2024.02.19

[Coursera] Advanced Learning Algorithms - 1

Evaluating a model 머신러닝을 개발 중이거나 학습 시스템의 성능을 향상할 때 어떤 방법을 어떻게 결정할까? 1. 더 많은 학습 데이터 셋 확보 - 많은 사람들이 더 많은 학습 데이터 셋을 확보하기위해 많은 시간을 소비하지만, 더 많은 학습 데이터 셋이 실제로 도움이 되지 않습니다. 2.피처 셋 작게 만들기 - 과적합을 방지하기 위해 소규모 피처를 신중하게 선택하면서 많은 시간을 소비합니다. 3. 추가적인 피처 설계하기 - 현재 피처 셋이 충분하지 못해서 더 많은 피처를 수집합니다. 4. 고차 다항식 추가하기 5. 정규화 파라미터 람다 값 바꾸기 데이터 셋 : 학습 셋 60%, 교차 검증 셋 20%, 테스트 셋 20% - 학습 셋으로 학습하고, 교차 검증 셋으로 모델을 선택하고, 테스트 셋으..

Python/개인공부 2024.02.18

[Coursera] Supervised Machine Learning - 1

Week 1. Introduction to Machine Learning 머신러닝이란? Arthur Samuel : 명식적으로 프로그래밍하지 않고도 컴퓨터가 학습할 수 있는 능력을 부여하는 연구분야 체커 게임 프로그램 체커 : 체스판에 모양이 같은 말을 놓고 움직여 상대방의 말을 모두 따먹으면 이기는 게임 컴퓨터는 인간이 없는 수 만 번 게임을 반복할 끈기가 있음. 이를 통해 컴퓨터는 수많은 체케 게임 경험을 축적하여 인간을 이길 수 있는 체커 플레이어가 됨 학습 알고리즘 유형 지도 학습(감독형 기계학습) 입력과 출력의 매핑을 학습하는 알고리즘 입력과 출력 쌍으로부터 학습한 후, 새로운 입력값을 받아 적절한 해당 출력값을 생성하는 것 회귀 분석 가능한 무한한 숫자로 숫자를 예측하는 것 (예시 : 집 가격..

Python/개인공부 2024.01.10

[Analysis] Machine Learning 이란?

머신러닝(Machine Learning) 인공지능의 하위 분야 데이터를 통해 기계가 스스로 학습 모델을 도출하고, 새로운 데이터에 대한 추론과 패턴 예측에 활용 1. 머신러닝 관련 용어 데이터(data) : 문서, 사진, 음성, 동영상, 데이터베이스 등 특징(feature) : 각각의 아이템을 설명하는 데 사용하는 구분 가능한 특성 또는 특징의 개수 특징 벡터(feature vector) : 어떤 대상을 표현하는 특징으로 이루어진 n차원의 벡터 특징 추출(feature extraction) : 예측에 영향을 주는 주요 특징 벡터 추출(차원 감소기법을 사용하기도 함[PCA분석]) 학습 데이터 셋(training dataset) : 학습에 사용하는 데이터의 집합 2. 머신러닝 흐름도 학습과 예측 단계로 구성..

Python/Analysis 2023.12.27
반응형