합성데이터
· 약 5분
합성데이터의 개념
- 원본 데이터를 기반으로 그 형식과 통계적 특성을 학습하여 생성된 가상 데이터
- 개인정보보호를 유지하면서도 산업적 유용성을 제공, 데이터 부족 문제 해결, 민감한 데이터 대체, 다양한 산업에서 새로운 데이터 활용 기회 창출
합성데이터의 유형 개념도, 유형, 사례
합성데이터의 개념도
합성데이터 유형
구분 | 유형 | 내용 |
---|---|---|
원본 데이터 유무 | 완전 합성 데이터 | 원본데이터가 전혀 없이 모두 가상으로 생성된 데이터 |
부분 합성 데이터 | 원본 데이터 중 일부데이터셋이나 일부속성변수를 선택하여 합성데이터로 대체 | |
복합 합성 데이터 | 일부 변수 값을 합성 데이터로 생성, 합성된 데이터와 실제 데이터를 모두 사용하여 일부 변수 값을 다시 도출하는 방법으로 생성 | |
원본 데이터 형태 | 정형 합성데이터 | 행과 컬럼으로 이뤄진 테이블 형태의 원본 데이터로부터 생성 |
비정형 합성데이터 | 텍스트, 이미지, 영상 등의 비정형 원본 데이터로부터 생성 |
합성데이터 사례
구분 | 내용 | 비고 |
---|---|---|
국내 | 자율주행용 합성 비디오데이터셋 | 네이버 Virtual KITTI |
국외 | 이미지와 사람 수가 압도적인 군중 계수 데이터셋 | GTA5 Crowd Counting |
실내 장면 이해를 위한 하이퍼 리얼리즘 장면 데이터셋 | 애플 Hypersim | |
물리 법칙을 준수하는 3D 합성 데이터셋 | 엔비디아 Cosmos |