본문 바로가기

Visual Genome5

Flickr8k, Conceptual Captions 3M, Visual Genome 데이터 세트 세상엔 여러 데이터 세트가 있고, 활용 방안도 가지각색이다. Flickr8k, Conceptual Captions 3M (CC3M), Visual Genome (VG)에 대해서 정리해보자. Flickr8k 이미지에 대한 캡션이 있는 데이터 세트이다. 총 8,091장의 이미지로 구성되어 있다. 각 이미지 당 5개의 캡션이 있다. 캡션은 이미지에 대한 설명을 제공한다. 크기는 2.07 GB로 비교적 작은 크기의 데이터 세트이다. 캡션은 human annotation으로 모두 사실만이 적혀있다. 데이터 세트 다운로드 사이트 https://www.kaggle.com/datasets/adityajn105/flickr8k Flickr 8k Dataset Flickr8k Dataset for image caption.. 2024. 2. 29.
Zero-Shot image 출력 연구는 PyCharm에서 진행하고 있는 중이다. CoLab, CLion 등 시도해봤지만 PyCharm이 가장 나은 것 같아서 PyCharm으로 계속 수행하기로 결정했다. Dataset와 Dataloader 부분의 코드를 작성했다. 프로젝트의 구조는 아래 사진과 같다. Install package 필요한 package를 설치해준다. 가상환경에서 진행을 하고 있어서 대부분의 패키지는 설치되어 있지 않다. 아래 코드를 돌리는데 필요한 package만 일단 적어두었다. # Terminal pip install opencv-python pip install seaborn Environmental setup import os import cv2 import torch import numpy as np import .. 2024. 2. 21.
[연구 일지] SGG를 위한 Visual Genome Dataset 정리 방법 데이터 세트 관리가 너무 어렵다... 1. Visual Genome Dataset 다운로드 https://homes.cs.washington.edu/~ranjay/visualgenome/api.html VisualGenome homes.cs.washington.edu part 1 (9.2 GB), part 2 (5.47 GB), meta data (17.62 MB)를 받으면 된다. Task에 따라 다운로드 받을 데이터는 달라지겠지만 대부분의 SGG 논문에서는 이 세 개를 활용하는 것 같다. 각각 압축을 풀어준 후에 하나의 파일에 병합하여 저장하면 된다. 데이터가 크다보니 압축을 풀 때, UI에서 진행하는 것보다 코드로 진행하는 것이 에러 없이 잘 열리는 것을 확인했다. # pwd: ~/Sem-USRP/s.. 2024. 2. 19.
Visual Genome Dataset 다운로드: Hugging Face 사용 직접 데이터 세트를 다운로드 받는 것은 꽤 불편하고 수고롭다. 따라서 많이 사용되는 데이터 세트 다운로드 방법은 Hugging Face이다. Hugging Face란? Hugging Face는 자연어 처리와 Machine Learning 분야에서 모델과 데이터 세트를 공유하고 사용할 수 있도록 하는 온라인 플랫폼 및 커뮤니티이다. 이 플랫폼은 다양한 사전 훈련된 언어 모델, 텍스트 데이터 세트, 관련된 툴을 제공하여 연구자와 개발자들이 최신 기술을 쉽게 활용할 수 있도록 도와준다. Hugging Face에서는 특히 'transformers' 라이브러리를 통해 다양한 사전 훈련된 언어 모델에 접근할 수 있다. 이 라이브러리는 GPT, BERT, T5 등과 같은 최신의 언어 모델들을 쉽게 사용할 수 있도록 .. 2024. 2. 6.
Visual Genome Dataset 다운로드 방법 연구를 위해 데이터 세트를 다운로드 받는 과정에서 어려움을 겪어 (만료된 페이지가 많아...) 나중을 위해 정리해두기로 했다. 1. 공식 사이트로 이동 https://homes.cs.washington.edu/~ranjay/visualgenome/api.html VisualGenome homes.cs.washington.edu 2. 데이터 세트 다운로드 위의 링크로 들어가면 아래와 같이 다운로드 페이지가 나온다. 다운로드 가능한 목록이 굉장히 많은데 그 중에서 사용할 것은 비정제 데이터이다: images part 1 images part 2 image meta data 내가 해결하고자 하는 문제에 맞게 나머지 데이터들도 다운로드 받으면 된다. 공식 사이트에서 바로 다운로드 받아도 되고 코드로 다운로드 받.. 2024. 2. 6.