본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.
강의 수강 시작
강의 수강 완료
학습인증샷(리스트에서 여러 가지 원소를 랜덤 추출하기)
오늘은 편향과 오차, 최소제곱법과 추세선, 그리고 데이터 추출에 대한 강의를 들었다. 이번 강의에서는 기계 학습 모델의 성능을 평가하는 다양한 방법과 핵심 개념을 배울 수 있었다.
먼저, 편향과 분산에 대해 학습했다. 모델이 가진 편향과 분산이 어떻게 오차에 영향을 미치는지 이해하는 것이 중요하다. 편향이 높으면 모델이 훈련 데이터에 대한 일반화가 부족하여 일정한 방향으로 예측이 치우치는 문제가 발생한다. 반면, 분산이 높으면 모델이 데이터의 작은 변화에도 민감하게 반응하여 오버피팅이 발생할 가능성이 커진다. 즉, 편향이 높고 분산이 높을 경우, 모델이 예측한 값과 실제 값의 차이가 커지게 된다.
또한, 기계 학습 모델의 성능을 평가하기 위해 오차를 계산하는 과정이 필수적이며, 가장 많이 사용되는 오차 계산 방법 중 하나가 평균제곱오차이다. 평균제곱오차는 예측 값과 실제 값의 차이를 제곱하여 평균을 내는 방식으로, 오차가 클수록 더 큰 패널티를 주는 특징이 있다. 이 외에도 평균절대오차, 평균제곱근오차 등의 다양한 오차 측정 방법이 있으며, 각각의 방법이 갖는 장단점이 다르기 때문에 상황에 따라 적절한 방법을 선택하는 것이 중요하다.
그다음, 최소제곱법과 추세선에 대해서도 학습했다. 최소제곱법은 데이터 포인트들 사이의 오차를 최소화하는 방식으로 최적의 직선을 찾아내는 방법이다. 주어진 데이터에 대해 선형 회귀를 수행할 때 많이 사용되며, 데이터의 전반적인 경향을 파악하는 데 유용하다. 추세선을 통해 데이터가 증가하는지, 감소하는지 등의 패턴을 쉽게 확인할 수 있으며, 이를 활용해 미래의 값을 예측할 수도 있다.
마지막으로 데이터 추출에 대한 내용도 배웠다. 데이터 분석이나 기계 학습을 수행하기 위해서는 적절한 데이터 수집이 필수적이다. 데이터 추출 기법을 활용하면 다양한 원천에서 데이터를 효율적으로 가져올 수 있으며, 수집된 데이터를 정제하고 가공하는 과정도 중요하다. 데이터를 정확하게 수집하지 않으면 분석의 신뢰성이 떨어지기 때문에, 데이터 추출 과정에서 오류를 최소화하는 것이 필수적이다.
이번 강의를 끝으로 딥러닝을 활용한 통계 강의가 마무리되었다. 이 강의를 통해 기초 개념을 다시 복습하는 기회가 되었을 뿐만 아니라, 새롭게 배운 부분도 많았다. 물론 모든 개념을 완벽하게 이해했다고 말할 수는 없지만, 개념이라는 것은 본래 한 번에 완벽하게 이해하기 어려운 법이라고 생각한다. 꾸준히 복습하고 실습하면서 부족한 부분을 채워나가는 것이 중요할 것이다.
다음 강의 주제는 자료구조인데, 개인적으로 자료구조를 한 번도 배워본 적이 없어서 기대가 크다. 자료구조는 컴퓨터 과학의 핵심 개념 중 하나이며, 효율적인 알고리즘을 작성하는 데 필수적인 요소이기 때문에 흥미로운 학습이 될 것 같다. 앞으로의 강의도 열심히 듣고 정리하면서 학습을 이어나가야겠다.
'IT' 카테고리의 다른 글
패스트캠퍼스 환급챌린지 10일차 : 딥러닝·인공지능 Signature 초격차 패키지 강의 후기 (0) | 2025.03.14 |
---|---|
패스트캠퍼스 환급챌린지 9일차 : 딥러닝·인공지능 Signature 초격차 패키지 강의 후기 (0) | 2025.03.13 |
패스트캠퍼스 환급챌린지 7일차 : 딥러닝·인공지능 Signature 초격차 패키지 강의 후기 (1) | 2025.03.11 |
패스트캠퍼스 환급챌린지 6일차 : 딥러닝·인공지능 Signature 초격차 패키지 강의 후기 (0) | 2025.03.10 |
패스트캠퍼스 환급챌린지 5일차 : 딥러닝·인공지능 Signature 초격차 패키지 강의 후기 (0) | 2025.03.09 |