IT

패스트캠퍼스 환급챌린지 55일차 : 딥러닝·인공지능 Signature 초격차 패지 강의 후기

tstory7 2025. 4. 28. 21:58

 

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

 

강의 수강 시작

 

 

학습 인증샷

강의 수강 목록

 

강의 수강 완료

 

오늘은 실질적으로 어떻게 현업에서 이루어져 있는지를 배웠다. 첫 내용으로는 데이터셋 구축 방법과 모델 선정 시 고려해야 할 사항에 대해 배웠다. 데이터셋을 구축할 때는 구글이나 다양한 SNS 플랫폼에서 크롤링을 통해 이미지를 수집하는 방법을 사용한다. 이렇게 모은 데이터는 모델의 메모리 학습에 활용할 수 있다. 하지만 처음 수집된 데이터에는 잘못된 이미지나 오류가 포함될 수 있기 때문에, 사용자 피드백을 통해 잘못된 이미지를 수정하고 이를 다시 학습에 반영하는 과정이 필요하다.
특히 잘못된 데이터를 수정하는 작업에 대해 사용자에게 보상을 제공하는 등의 대안을 마련하면, 데이터 품질을 높이는 데 효과적일 수 있다는 점도 인상적이었다. 결국 데이터셋의 품질은 모델 성능에 직접적인 영향을 미치기 때문에, 초기 수집부터 지속적인 관리까지 신경 써야 한다는 것을 다시 느꼈다.
또한 모델을 선정할 때 어떤 기준을 고려해야 하는지도 정리했다. 특히 분류 작업을 수행할 때는 두 가지 요소를 중점적으로 생각해야 한다. 첫 번째는 실시간성이다. 결과를 빠르게 반환해야 하는 상황에서는 실시간 분류가 가능한 가벼운 모델을 선택해야 한다. 두 번째는 정확도이다. 아무리 빠른 모델이라도 예측 결과가 부정확하면 의미가 없기 때문에, 상황에 맞게 정확도를 우선으로 할지, 속도를 우선으로 할지 균형을 맞혀야 한다.
자세하게 현업에서 했던 일과 그때 사용했던 모델을 말씀해 주셨는데 이게 아무래도 제일 관심이 갔던 것 같다. 특히 지금 내가 관심 있는 분야 파트와 유사하기 때문에 더욱 관심 있게 들었다. 이렇게 배운 내용이 현업에서도 잘 사용되고 있는 것 같아서 더 공부해야겠다는 생각이 들었다.
오늘 수업을 통해 데이터셋 관리와 모델 선정 모두 단순히 기술적인 문제를 넘어 실질적인 고민과 전략이 필요하다는 걸 알게 되었다. 현업에서도 이런 점들을 어떻게 조율하는지가 중요한 역할을 할 것 같아 앞으로 더 관심 있게 보고 싶다.

 

https://bit.ly/4hTSJNB