-
[딥러닝] train/test/val 폴더 코드 한 줄로 나누기Deep Learning 2022. 5. 24. 14:45반응형
원하는 비율만 지정해주면 데이터셋을 train, test, val 폴더로 자동으로 나누어주는 라이브러리가 있다.
바로, splitfolders인데, 먼저 설치는 콘솔에 이렇게 입력하면 된다.
pip install split-folders
이후, 라이브러리를 import하고, 원하는 비율로 나누어주면 디렉토리 생성 끝!
8:1:1로 나누어 보겠다.
input 폴더 아래에는 레이블 이름으로 폴더들이 있고, 그 하위에 데이터들이 있다.
output 폴더는 미리 만들어주지 않고 경로만 지정해도 이 코드에서 자동으로 생성해준다.
seed는 원하는 값으로 지정하면 된다.
import splitfolders splitfolders.ratio("D:/DATA/input/", output="D:/DATA/input/split/", seed=1234, ratio=(0.8,0.1,0.1))
이렇게 하면 split 폴더가 생성되고, 그 아래에 train, val, test 폴더가, 그리고 그 아래에 레이블명으로 폴더가 있는 것이 확인될 것이다.
반응형'Deep Learning' 카테고리의 다른 글
keras, tensorflow에서 항상 같은 결과를 얻는 방법 (0) 2023.01.06 딥러닝 기초 강의 (0) 2019.06.20 [Tensorflow, Keras, jupyter notebook] 현재 잘 쓰고 있는 버전 (0) 2019.04.19 [Tensorflow 텐서플로우] InternalError: GPU sync failed (0) 2019.04.18