'분류 전체보기' 카테고리의 글 목록 (3 Page)

[7주차] image classification 프로젝트 회고록

2024.09.27·

AI Tech 7기/회고록

1. 프로젝트 이슈 정리1. 서버 하나에 여러 팀원들이 작업하다 보니 git commit 할 때 처음 git 을 연동시킨 팀원분의 계정으로 계속 commit이 올라가는 이슈가 있었다. 찾아보다가 공동 작업자로 커밋하는걸 알게 되었다.커밋 메세지Co-authored-by: 깃헙핸들명 커밋 메세지와 Co-authored-by 사이에 줄바꿈이 2번 들어가야한다. 저렇게 해서 커밋하면 내 아이디로 깃허브에 기록이 남게된다. 2. gpu 사용량 볼 때 : nvidia-smi, 실행 중인 python 프로세스 확인 할 때 : ps aux | grep python 2. 프로젝트 개인 회고프로젝트를 하면서 가장 기억에 남는 점을 중심으로 작성해보겠다. 1. cutmix 구현cutmix 증강기법을 활용하여 코드..

[6주차] 회고록

2024.09.13·

AI Tech 7기/회고록

9/9 (월)- 과제도 제출완료하고 새로운 강의도 들을 수 없어 이번주 논문 리뷰하려는 한 편 읽고 CLIP 모델 공부했다. 밀린 코테 문제들을 풀긴 했으나 코드리뷰하기로 한 피어세션 전까지 마무리 하지 못해 아쉬웠다. 9/10 (화)- AI 개발 기초 1,2 강- 첫 대회가 시작하는 날이라 데이터셋 구경좀 하고 baseline 구경 좀 했다. (로컬 환경 이슈로 차마 돌려보지는 못했다.)맥북에서 압축한 파일을 윈도우에서 압축 해제 하는 과정에서 이슈가 있었다. (._ 로 시작하는 파일들이 같이 압축 해제됐다.)tar -zxvf data.tar.gz --exclude="._*" 이거 사용하면 대부분 맥 메타데이터 없이 바로 풀림! 근데 특정 폴더에서는 ._DS_STORE 파일이 하나 남아있었다,, 9..

[정수론] GCD(n, k)=1 (백준 11689)

2024.09.09·

Baekjoon

문제는 단순하다. 오일러 피함수를 구현해서 n일때의 값을 찾는 것이다. 기존의 오일러 피함수 구하는 방법은 1) 구하고자 하는 오일러 피의 범위만큼 자기 자신 인덱스로 초기화 (list(range(N+1))2) 2부터 시작해서 현재 배열의 값 == 인덱스 (소수일때) 현재 선택된 숫자(K)의 배수에 해당하는 수를 배열 끝까지 탐색해서 P[i] = P[i] - P[i]//K 연산 수행3) 배열 끝까지 2) 과정 반복 코드로 구현해보면,n = int(input())array = list(range(n+1))for i in range(2, n+1): if i == array[i]: for j in range(1, int(n//i)+1): array[i*j] = array..

CutMix 논문 리뷰

2024.09.09·

Paper Review

0. 용어 정리- Localization (지역화) : 이미지 내에 하나의 object 가 있을 때 위치를 알아내는 것 (보통 하나의 객체를 찾는 경우), object에 대한 bbox와 label 반환- Detection (탐지) : localization을 통해 다수의 object를 식별하고, 각각의 위치를 알아내는 것 (보통 여러 객체를 탐지하는 경우), object들에 대한 bbox들과 그에 해당하는 label 반환 - weakly supervised localization : 이미지 내 객체의 위치를 파악하는 데 있어 label만을 사용하여 학습 (정확한 위치 정보는 제공되지 않음)- superior localization : 이미지 내 객체의 위치를 매우 정확하게 파악하기 위해 객체의 정확한 위..

DreamFusion

2024.09.06·

AI Tech 7기/Computer Vision

1. DreamFusion 소개 DreamFusion 은 2D 이미지 생성 모델인 Diffusion Model 과 3D reconstruction model인 NeRF 을 통합한 새로운 모델로서, 사전학습된 2D text to image 모델을 사용해서 text(condition) 입력에 부합하는 3D 모형을 생성해내는 것이 목표다. 3D data 학습 없이 3D data를 생성해내는 zero shot 모델로서 2D model을 활용하여 여러 가능성을 보여준 모델이다. 어떻게 학습하는지를 간단하게 살펴보면, 텍스트 입력을 기반으로 디퓨전 모델이 생성한 가상의 2D 이미지를 바탕으로 NeRF 가 3D 모형을 만들고 다시 2D 로 렌더링했을 때, 이 이미지와 처음 디퓨전 모델이 생성한 2D 이미지와 얼마..

AE(Auto Encoder), VAE(Variational Auto Encoder)

2024.09.04·

AI Tech 7기/Computer Vision

1. AE (Auto Encoder)오토인코더는 데이터를 압축하고 복원하는 과정에서 중요한 특징들을 학습하는 것이 목적이다. 그렇기 때문에 학습한 대로 어떤 이미지를 넣으면 그대로 복원하는 것은 가능하지만, 잠재공간 벡터를 사용자가 조절해서 새로운 이미지를 생성해내는 데에는 한계가 있다. (그래서 생성형 모델이 아니다.) encoder + latent space + decoder 의 구조로 이루어져 있고 각각의 역할은 다음과 같다. encoder : 데이터를 입력받아 더 작은 차원으로 압축latent space : 잠재공간decoder : 인코더에서 만들어진 압축된 표현을 다시 원래대로 복원 일종의 self supervised training (비지도 학습) label 데이터 없이 학습하며, 원본 데이..

티스토리툴바