IT

패스트캠퍼스 환급챌린지 21일차 : 딥러닝·인공지능 Signature 초격차 패지 강의 후기

tstory7 2025. 3. 25. 22:52

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

 

 

강의 수강 시작

 

강의 수강 완료

 

학습 인증샷

 

오늘은 사람 얼굴 이미지의 나이를 예측하는 모델과 날씨 이미지를 분류하는 모델에 대한 강의를 들었다. 이 두 가지 모델을 학습시키기 위해서는 먼저 적절한 데이터 세트를 불러오는 과정이 필요하다. 데이터 세트를 불러올 때는 데이터 증진 기법을 적용할 것인지 여부를 결정해야 하며, 만약 적용한다면 어떤 방법을 사용할 것인지 명확하게 명시해야 한다. 데이터 증진 기법을 사용하면 모델이 다양한 변형된 데이터를 학습할 수 있어 일반화 성능이 향상될 가능성이 크다. 예를 들어 이미지 회전, 밝기 조절, 좌우 반전과 같은 다양한 변형 기법을 적용할 수 있다.

데이터 세트를 불러온 후에는 이를 실제로 모델에 입력할 수 있도록 DataLoader를 이용하여 데이터를 로드하는 과정을 거친다. 이때 어떤 데이터를 사용할 것인지, 배치 크기를 얼마로 설정할 것인지, 데이터를 셔플할 것인지 등의 다양한 요소를 고려해야 한다. DataLoader를 활용하면 데이터를 배치 단위로 불러올 수 있어 모델 학습에 용이하며, 배치 크기를 조절하여 연산량을 조정할 수도 있다. 또한 데이터를 셔플하여 모델이 특정한 순서에 의존하지 않고 학습할 수 있도록 만들 수도 있다. 이러한 과정은 모델의 성능을 향상시키는 데 중요한 역할을 한다.

데이터를 DataLoader를 통해 배치 단위로 불러오면 next() 함수를 이용하여 텐서 형태로 데이터를 얻을 수 있다. 이 과정을 통해 모델이 한 번에 처리할 수 있는 일정한 크기의 데이터를 불러와 학습할 수 있게 된다. 실습을 진행하면서 이러한 데이터 처리 과정이 실제로 어떻게 구현되는지 직접 확인할 수 있었는데, 이론적으로만 접했던 내용을 코드로 다루다 보니 신기했다.

또 한 가지 흥미로웠던 점은 강의에서 사용한 데이터가 AI 허브에서 제공하는 데이터라는 점이었다. 이번 강의를 통해 AI 허브에서 데이터를 받아와서 활용하는 과정을 보면서 앞으로 나도 직접 데이터를 가져와서 사용해 보면 좋겠다는 생각이 들었다. 특히 특정 도메인의 데이터를 활용하여 직접 모델을 학습시키는 경험을 해 보면 이론적으로 배운 내용이 더욱 깊이 있게 이해될 것 같다.

그리고 모델을 학습할 때 GPU의 메모리 용량이 충분하지 않을 경우 학습 중에 메모리 부족 오류가 발생할 수 있는데, 이를 방지하기 위해 배치 크기를 줄이는 방법을 사용할 수 있다. 구글 코랩을 사용할 때는 배치 크기를 32 정도로 설정하면 비교적 안정적으로 학습을 진행할 수 있다고 한다.