GLOBAL LEADER
아주대학교 소프트웨어융합대학

모각소

[2022 하계] MZ특

  • SW중심대학
  • 2022-09-30
  • 197

<팀원>


수학과 윤기웅

수학과 곽태우

수학과 용희원

수학과 최아림


<팀원별 활동내용>

Image Captioning를 주제로 머신러닝 멀티모델 생성


윤기웅, 최아림

텍스트 데이터를 모델에 넣기 전 전처리 해 주었음. (불용어 제거, Stemming, Lemmatization, 패딩, 토큰화 등) 이후에 텍스트에 좋은 성능을 내는 RNN모델(LSTM 등)을 공부함.


곽태우, 용희원

이미지 데이터를 불러오고 나서 모델에 넣기 전에 어떤 식으로 처리를 해 주어야 하는지 공부함. 전반적인 CNN모델에 대해 공부하였고, Competition에서 좋은 성과를 낸 pre-trained model(VGG, RESNET등)을 구조를 이해하려고 하였음.


<팀원별 최종성과>


이미지를 처리와 자연어 처리는 Kaggle에서 제공하는 약 3만장에 데이터를 가지고서 진행하였음. (Translation Model의 구조를 따와 encoder 부분을 RNN이 아닌 CNN으로 교체)


윤기웅, 최아림

Decoder부분에 자연어 처리를 한 RNN부분을 

곽태우, 용희원

Encoder부분에 이미지를 이용한 CNN부분을 연결하여 Image Captioning model을 만들었음


<팀원별 향후계획>


윤기웅, 최아림

영어 텍스트 전처리 단계에서 기존적인 방법이 아닌 다양한 방법을 사용해 보고 이에 대한 결과를 비교하여 살펴보려고 함. 추가로 영어가 아닌 한국어에 대해서도 다루어 보고 싶어 함. 한국어 같은 경우 영어와 달리 많이 제공되는 것이 없고 동사나 형용사와 같은 부분이 다양해 여러 방법을 시도해보고 싶어함.


곽태우, 용희원

딥러닝의 단점인 이미지를 처리하여 모델에 집어넣었을 때, 나온 결과값에 대한 설명력이 부족함. 좋은 결과보다 왜 이러한 결과가 나오는지에 대해 더 깊이 있게 공부하려고 함.


<팀원별 개인URL>


윤기웅 : https://hot-freighter-91f.notion.site/885c57b9c55d49598f1ad5477edc1d2c?v=b7bfacd2a47247578781fc635ffa1f9c

곽태우 : https://github.com/TAEWOOGWAK/MZ-.git

용희원 : https://velog.io/@heecircle_

최아림 : https://wandering-musician-0da.notion.site/bf57dac7493c4aeab6e66703c21f8157


<최종 발표회 자료>