virtual data
-
가상 데이터의 활용machine learning 2024. 2. 25. 16:32
가상 데이터를 생성하는 이유 테스트 이전에 모델의 정상 작동 여부를 확인하기 위함 알고리즘의 특성을 이해하거나 성능의 평가를 위함 1. make_blob을 사용한 가상 데이터 생성 make_blob을 통해 생성되는 데이터는 정규 분포를 따르는 가상의 데이터로, 여러 개의 클러스터가 존재하는 형태로 데이터가 생성되어, 다중 분류를 위한 클러스터 데이터 생성이 가능 from sklearn.datasets import make_blobs x, y = make_blobs(n_samples=100, centers=3, n_features=2, random_state=1234) print(x.shape, y.shape) # n_samples : 생성할 데이터 샘플의 수 # centers : 생성할 클러스터의 수 #..