본문 바로가기

전체 글

(38)
Multi-GPU Deep Learning_1 (using DDP) 목차 Introduction Data Parallel과 분산 딥러닝에 익숙해지기 위해서 간단한 auto-encoder를 만들었다. Data Parallel에는 크게 DP와 DDP가 있는데, 그 둘의 차이점은 이미 간단하게 서술한바가 있다. Data Parallel(DP), Distributed Data Parallel(DDP)의 차이 목차 Keywords Data Parallel(DP), Distributed Data Parallel (DDP), Multi-GPU training, All reduce Data Parallel(DP), Distributed Data Parallel(DDP)의 차이 Compared to DataParallel, DistributedDataPar.. engui-note.tis..
특정 서버를 경유해야하는 SSH, SCP 설정(ProxyJump) 목차 특정 서버를 경유해야하는 SSH, SCP 설정 local PC에서 직접적으로 접속할 수 없는 서버에 접속해야하는 경우가 생길때가 있다. 예를 들어 서버에 설치된 VM이나, docker에 접근하게되는 경우가 있다. 간단한 방법으로는 local PC에서 중간경유서버로 ssh연결을 한 뒤, 중간경유서버에서 다시 ssh로 target server에 연결하면 된다. 하지만 이중으로 연결하는것은 한번쯤이야 할만 할 수 있지만, 여러번 접속해야한다면 귀찮아질 수 밖에 없다. 해결법 ssh -J 옵션을 이용해 proxyjump를 적용하면 된다. ssh -J proxy_user@proxy_server:port target_user@target_server:port 위와같은 코드 한줄로 바로 접속할 수 있다. ssh..
가수의 목소리 변경_1 (Singing Voice Conversion) 목차 Introduction Voice Conversion is a technology that modifies the speech of a source speaker and makes their speech sound like that of another target speaker without changing the linguistic information. Singing voice conversion is to convert a singer's voice to another one's voice without changing singing content. 음성 변환은 언어 정보를 변경하지 않고 원본 화자의 음성을 수정하여 다른 대상 화자의 음성처럼 들리게 하는 기술이다. 그 중에서도 노래소리변환은 ..
Data Parallel(DP), Distributed Data Parallel(DDP)의 차이 목차 Keywords Data Parallel(DP), Distributed Data Parallel (DDP), Multi-GPU training, All reduce Data Parallel(DP), Distributed Data Parallel(DDP)의 차이 Compared to DataParallel, DistributedDataParallel requires one more step to set up, i.e., calling init_process_group. DDP uses multi-process parallelism, and hence there is no GIL contention across model replicas. Moreover, the model is broadcast at..
WandB를 이용한 인공지능모델 학습 모니터링 및 로깅 목차 WandB란 Build better models faster with experiment tracking, dataset versioning, and model management 라고 홈페이지에 소개가 되어있다. 간단하게 해석하자면 실험 추적, 데이터 세트 버전 관리 및 모델 관리를 통해 더 나은 모델을 더 빠르게 구축할 수 있게 도와주는 MLOps 플랫폼이다. 본문에서는 wandb를 이용해 logging을 하고 report로 output한 결과를 간단하게 보여준다. WandB log 우선, pip로 wandb를 설치한다. pip install wandb 두번째로, wandb를 import 및 initialize 한다 import wandb wandb.init(project="your_projec..
.gitignore 기존에 push된 repository에 적용 gitignore에 추가한 파일이 repository에 올라가있는 경우 해결방법 git rm -r --cached . git add . git commit -m '.gitignore 변경내용 적용'
노래에서 목소리와 악기소리 분리_完 (music demixing using mdx-net & MUSDB18 dataset) Introduction mixing은 멀티 트랙이 보편화된 작곡 환경에서 각 트랙간의 레벨 밸런스를 맞추고 여러 가지 소리들을 하나의 마스터 트랙이 모아 섞는 작업을 의미한다.(위키참고) demixing이란 mixing의 reverse 작업으로 합쳐진 하나의 파일에서 보컬, 드럼, 베이스 등등으로 구분하여 추출하는 작업이라고 생각하면 쉽다. 개인적으로 만들고 있는 영상이 여러명의 영상을 합친 영상인데, 노래소리가 중복해서 들려서 싱크 맞추기가 상당히 까다로운 상태이다. 이를 해결하기위해 생각한 방법이 만약 음성파일에서 노래소리를 제거하고 음성만 추출할 수 있다면, 싱크를 어느정도만 맞춰도 노래가 서로 공명하지 않고 깔끔한 소리가 날 수 있을 것 같아서 시도해봤다. Method & Material 알고리즘..
현실의 춤을 가상공간으로 매핑하기_관 (using 3D human pose estimation) Introduction 저번 글을 마무리할 때 향후 적용해볼만한 내용에 대해 정리를 했었다. 이번 글에서는 그중에 시도했던 내용 + 추가로 진행된 사항에 대해 정리하겠다. Method & Result 우선 저번글 마무리에 작성한 내용은 다음과 같다. 우선 먼저 해볼 것은 VMD converter의 내용을 수정하는 것이다. motion capture의 경우 입력 format으로 FBX, BVH가 있는 것으로 확인했는데, FBX는 3d pose coordinate에서 변환하는 방법을 찾지 못한상태이고, BVH의 경우 github을 뒤지다가 3d pose에서 변환하는 코드를 찾아서 맞게 수정해볼 생각이다. BVH 데이터를 만들면 rokoko 애드온을 이용해 bone들끼리 retargeting을 진행할 것이다...