패스트캠퍼스 환급챌린지 32일차 : 딥러닝·인공지능 Signature 초격차 패지 강의 후기
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.
강의 수강 시작
강의 수강 목록
학습 인증샷
강의 학습 완료
오늘은 지도학습, 비지도학습, 자기지도학습에 대한 강의를 들었다. 아무래도 강화학습, 비지도학습은 많이 나오는 개념이라 나름 익숙했다. 하지만 사실 정확하게 알지는 못했다. 지도학습은 정답을 알고 있는 상태에서 학습을 진행하는 방식이다. 대표적인 예로는 회귀와 분류가 있으며, 레이블이라는 정답 정보가 많은 데이터가 있을수록 모델이 정답에 더 잘 맞게 학습된다. 하지만 이러한 데이터는 수집과 정답 표시 과정에서 많은 비용이 발생한다는 단점이 있다.
반면, 비지도학습은 정답을 모른 채로 데이터를 분석하는 방식이다. 이 방식에서는 데이터의 구조나 패턴을 스스로 발견해낸다. 대표적인 기법으로는 군집화와 차원축소가 있다. 군집화에는 k-means나 DBSCAN 같은 알고리즘이 있고, 차원축소는 주로 데이터 전처리 단계에서 사용된다. 차원축소의 대표적인 예로는 주성분 분석이 있다. 생성적 적대 신경망은 비지도학습이라 분류하기는 다소 애매한 위치에 있다.
자기지도학습은 데이터가 많을수록 학습에 유리하지만, 레이블이 부족한 상황에서 유용하게 쓰인다. 정답을 직접 만들기 위해 드는 비용이 크기 때문에, 기존 문제를 그대로 푸는 것이 아니라 새로운 문제를 정의해서 접근하는 방식이다. 이는 진짜 풀고자 했던 문제 외에 데이터 안에서 해결 가능한 다른 문제를 만들어내고, 이를 학습에 활용한다는 특징이 있다. 이처럼 데이터 안에서 정답을 스스로 만들어내기 때문에 자기지도학습이라는 이름이 붙었다.
먼저 사전 작업으로는 프리텍스트 태스크를 학습한다. 이 과정을 통해 모델은 사전학습을 하게 된다. 이후에는 실제로 풀고자 하는 다운스트림 태스크를 해결하기 위해 전이학습을 수행한다. 이때는 진짜 데이터를 활용해 분류 같은 실제 문제를 풀게 되는 것이다. 자기지도학습이라는 용어를 처음 들었기에 신기했다. 데이터가 아무래도 부족한 경우도 많은데 그때 정말 유용할 것 같다는 생각이 들었고, 이에 대해서 좀 더 알아보면 좋을 거라고 생각했다.