Flickr8k1 Flickr8k, Conceptual Captions 3M, Visual Genome 데이터 세트 세상엔 여러 데이터 세트가 있고, 활용 방안도 가지각색이다. Flickr8k, Conceptual Captions 3M (CC3M), Visual Genome (VG)에 대해서 정리해보자. Flickr8k 이미지에 대한 캡션이 있는 데이터 세트이다. 총 8,091장의 이미지로 구성되어 있다. 각 이미지 당 5개의 캡션이 있다. 캡션은 이미지에 대한 설명을 제공한다. 크기는 2.07 GB로 비교적 작은 크기의 데이터 세트이다. 캡션은 human annotation으로 모두 사실만이 적혀있다. 데이터 세트 다운로드 사이트 https://www.kaggle.com/datasets/adityajn105/flickr8k Flickr 8k Dataset Flickr8k Dataset for image caption.. 2024. 2. 29. 이전 1 다음