본문 바로가기

기술/딥러닝14

[Boostcamp AI Tech] 3D Understanding 이번 주의 부캠 지난 주가 Image Classification, Semantic Segmentation, Object Detection과 같은 전형적인 CV Task에 대한 얘기를 다뤘다면, 이번 주는 CNN Visualization, Instance/Panoptic Segmentation, Conditional Generative Model 등과 같은 좀 더 발전된 CV Task에 대한 얘기를 다루면서 지난 주에 비해 훨씬 학습이 어려웠던 한 주라고 생각한다. 원리 이해를 위해 복습을 비롯해 좀 더 개인학습을 해봐야겠다. 3D Understanding 우리의 삶은 3D로 이뤄져있기 때문에 3D space를 이해하는 것은 중요한 일이다. 3D Applications로는 AR/VR, 3D printing.. 2021. 9. 17.
[Boostcamp AI Tech] Multi-modal Learning Challenge of Multi-modal Learning 1. 데이터의 표현 방법들이 모두 다름 ex) Audio, Image, Text를 데이터로 표현하면 이들은 다 제각각의 형태를 띔 2. 서로 다른 Modality에서 오는 정보량, feature spaces에 대한 특징들이 불균형함 ex) '아보카도 모양의 armchair' 라는 텍스트를 이미지로 변환하는 task를 수행할 때, '아보카도 모양의 armchair'로 여러 이미지가 나올 수 있음( 1:N의 관계 ) 3. 특정 Modality에 모델이 편향될 수 있음 ex) Action Recognition을 한다고 할 때, 노래를 부르는 Vedio는 Audio를 참조할 수 있겠지만 대부분의 행위는 Visual Data로 판단 가능하므로 Visua.. 2021. 9. 16.
[Boostcamp AI Tech] Computer Vision(1) 이번 주의 부캠약 2주간의 첫 P-Stage를 마치고, 새로운 U-Stage 피어들과 CV 강의를 듣기 시작했다.아무래도 본격적으로 CV를 배우는 첫 주이기도 하고, 도입부이다보니이번 주의 대부분의 내용들은 이전에 들었던 강의에서 이미 한 번 커버를 한 부분이었다.또한, 무엇보다 P-Stage를 하면서 시도해봤던 시도들 그리고 직접 찾아본 내용들도 있어 큰 무리없이 들을 수 있었다. 이번 주부터 앞으로의 긴 P-Stage 기간동안 함께할 팀을 구해야했고,취업을 위해 여러 원서를 함께 썼어야 했기 때문에 사실 강의보다는 다른 부분에 열심이었던 한 주였던 것 같다.  Self-trainingAugmentation + Teache-Student networks + Semi-supervised Learning을.. 2021. 9. 10.
[Boostcamp AI Tech] Level1 P-Stage(1) 이번 주의 부캠 이번 주에 드디어 첫 P-Stage가 시작됐다. Level1 P-Stage의 과제는 이미지 분류 문제로, 마스크 착용 여부(착용/미착용/오착용), 성별(남/여), 나이(~30/30 ~ 59/60 ~)를 가지고 총 18개의 label로 분류하는 문제가 주어졌다. 확실히 리더보드를 통해 실시간으로 결과를 알 수 있는 구조다보니, 경쟁심(?)이 불타오르는 것 같다. 팀전인만큼 팀원간 아이디어 공유와 전략 수립을 통해 좋은 성적을 거둬봐야겠다. Image Classification Competition의 경우는 다음과 같은 순서로 이뤄진다. Domain Understanding ( Data Mining ) Data Analysis Data Processing Modeling Training ( .. 2021. 8. 27.