본문 바로가기

분류 전체보기38

Flickr8k, Conceptual Captions 3M, Visual Genome 데이터 세트 세상엔 여러 데이터 세트가 있고, 활용 방안도 가지각색이다. Flickr8k, Conceptual Captions 3M (CC3M), Visual Genome (VG)에 대해서 정리해보자. Flickr8k 이미지에 대한 캡션이 있는 데이터 세트이다. 총 8,091장의 이미지로 구성되어 있다. 각 이미지 당 5개의 캡션이 있다. 캡션은 이미지에 대한 설명을 제공한다. 크기는 2.07 GB로 비교적 작은 크기의 데이터 세트이다. 캡션은 human annotation으로 모두 사실만이 적혀있다. 데이터 세트 다운로드 사이트 https://www.kaggle.com/datasets/adityajn105/flickr8k Flickr 8k Dataset Flickr8k Dataset for image caption.. 2024. 2. 29.
CC3M 데이터 세트 다운로드 대용량 데이터 세트인 CC3M 데이터 세트는 웹 크롤링을 통해 데이터 세트를 다운로드 받는다. 보통 다운로드 받는 데에 하루에서 이틀 정도가 소요된다고 하니... 충분한 용량과 인내의 마음을 다지고 다운로드를 진행하면 되겠다. (교수님이 다운로드 받아보라고 하셔서.... 어쩔 수 없이 다운로드 받게 되었다...) 이때...! Windows말고 Ubuntu를 사용하는 것이 좋다... 처음에는 Windows에서 진행했는데, 이후에 설치해야 할 패키지인 magic이 Ubuntu 환경에서만 돌아가는 패키지이다. Windows를 위해서는 따로 dll 파일을 통해 작업을 해줘야하는데, 결국 경로 오류 등 제대로 파일이 실행되지 않아... VirtualBox를 통해 Ubuntu 환경을 구축했다. (Windows에 m.. 2024. 2. 26.
[Error] VirtualBox Document is empty 오류 해결 VirtualBox Document is empty라는 에러 창이 뜨면 실행이 안되는 문제가 발생했다. 1. 작업 관리자 열기 작업 관리자를 열어 실행 중인 VirtualBox 작업이 있다면 종료한다 (또는 PC를 다시 시작한다). 2. 파일 탐색기를 통해 위치 이동 파일 탐색기에 에러 팝업 창에 뜬 경로를 복사하여 이동한다. 위의 에러 같은 경우에는 C:\Users\user\.VirtualBox\ 로 이동한다. 3. 파일 이름 수정하기 VirtualBox.xml 을 VirtualBox.OLD로 수정하고, VirtualBox.xml-prev 는 VirtualBox.xml으로 수정한다. 4. VirtualBox 실행 다시 실행해보면 정상적으로 실행되는 것을 확인할 수 있다. Reference https:/.. 2024. 2. 26.
Windows에서 VirtualBox 설치 및 가상 머신 생성과 실행 도저히 Windows로는 연구하기가 어려울 것 같아서 VirtualBox를 설치하기로 했다... USB에서 Linux가 있어서 멀티 부팅을 사용해도 되기는 하는데, 리소스를 공유하기 위해서 VirtualBox를 사용하기로 했다. 1. VirtualBox 다운로드 1) VirtualBox platform packages 공식 사이트에서 접속하여 바이너리를 다운로드 받는다. https://www.virtualbox.org/wiki/Downloads Downloads – Oracle VM VirtualBox Download VirtualBox Here you will find links to VirtualBox binaries and its source code. VirtualBox binaries By do.. 2024. 2. 26.
Windows에서 USB 초기화 방법: diskpart 1. 명령 프롬프트 먼저 관리자 권한으로 cmd에 들어갑니다. 2. USB 초기화 수행 diskpart를 입력하여 diskpart 모드로 진입한다. diskpart 진입에 성공하면 list disk를 입력하여 현재 연결되어 있는 디스크 목록을 확인한다. list disk 디스크 목록을 보면 디스크 0은 ssd, 디스크 1과 2가 usb이다. 현재 초기화를 진행할 디스크를 선택해주면 된다. select disk 2 clean을 입력하여 파티션을 삭제한다. clean 아래의 명령어를 통해 주 파티션을 생성한다. create partition primary 이제 포맷을 진행한다. 파일형식을 NTFS 파일 시스템 형식으로 포맷한다. exFAT이나 FAT32로 할 경우에는 NTFS를 빼고 exFAT이나 FAT32.. 2024. 2. 23.
[Error] Jupyter notebook에서 parser 사용 시 SystemExit 에러 나는 PyCharm 환경에서 Jupyter notebook을 사용하고 있다. parser 사용 시 다음과 같은 에러가 발생하였다. 문제 상황 나는 config.py 파일에 argparser를 사용하여 코드에서 사용할 파라미터들을 정의해두었다. 아래 코드는 중요한 것은 아니고 그저 "argparser를 사용했다"라고만 알아두면 된다. # config.py import os import platform from argparse import ArgumentParser import torch class ModelConfig(object): """Wrapper class for model hyperparameters.""" def __init__(self): """ Defaults """ self.parser =.. 2024. 2. 22.
[Error] Jupyter notebook 이미지 출력 시 색 반전 문제 PyCharm 환경에서 imshow를 한 결과, RGB 전환을 했음에도 불구하고 색이 반전되어 나오는 현상이 있었다. 문제 상황 PyCharm 환경 Jupyter Notebook 커널 Python 3 cv2의 imshow 사용 아무리 검색해도 나와 같은 문제가 발생한 경우가 없어 반 포기 상태였는데... 우연히 해결되었다. 해결 방법은 매우 간단했다. 나는 PyCharm dark 테마를 사용하고 있었는데, dark 테마로 인해서 이미지 출력에 문제가 생겼던 것 같다. light 테마로 변경해주고, 해당 셀을 다시 실행하여 출력 결과를 보니 정상적으로 RGB 이미지가 출력되었다. 해결 방법 1. PyCharm 설정 PyCharm 설정에 들어가준다. 우측 상단의 설정 버튼을 클릭하면 된다. 2. Theme .. 2024. 2. 22.
Zero-Shot image 출력 연구는 PyCharm에서 진행하고 있는 중이다. CoLab, CLion 등 시도해봤지만 PyCharm이 가장 나은 것 같아서 PyCharm으로 계속 수행하기로 결정했다. Dataset와 Dataloader 부분의 코드를 작성했다. 프로젝트의 구조는 아래 사진과 같다. Install package 필요한 package를 설치해준다. 가상환경에서 진행을 하고 있어서 대부분의 패키지는 설치되어 있지 않다. 아래 코드를 돌리는데 필요한 package만 일단 적어두었다. # Terminal pip install opencv-python pip install seaborn Environmental setup import os import cv2 import torch import numpy as np import .. 2024. 2. 21.
[Error] Jupyter notebook에서 matplotlib의 imshow 사용 시 커널 다운 현상 연구 도중에 발생한 에러... 해결하기 위해 여러 방법을 사용해보다가 드디어 해결했다. 문제가 발생한 코드 n_samples = 10 for i, (im_name, gt_classes, gt_rels, boxes) in enumerate(list(zip(dataset.filenames, dataset.gt_classes, dataset.relationships, dataset.gt_boxes))): im_path = os.path.join(dataset.images_dir, im_name) triplets = [] for r in gt_rels: triplets.append(dataset.triplet2str('{}_{}_{}'.format(gt_classes[r[0]], r[2], gt_classes[.. 2024. 2. 21.