본문으로 건너뛰기

introduce

Intro

DATUMO FST(Feature Space Tool)는 시각화 기반 데이터셋 분석 솔루션입니다. 학습 데이터의 커버리지와 엣지 케이스를 눈으로 보고 Data-Centric AI를 구현해 보세요.








데이터 차원 축소 및 시각화

untitled
비슷한 데이터는 가까이, 상이한 데이터는 멀리 배치한 평면 그래프를 제공합니다. 쉬운 조작과 가독성 높은 UI 디자인으로 전체 데이터셋의 커버리지를 빠르게 파악할 수 있습니다.

*피처 스페이스는 데이터의 정보를 담은 피처 벡터(Feature Vector)를 다차원 점으로 압축하여 표현한 공간입니다. DATUMO FST는 피처 벡터를 자동으로 생성하거나, 기존 피처 벡터를 활용해 피처 스페이스를 시각화합니다.








Reflect metadata and model metrics

untitled
메타 데이터(Meta data)와 모델 메트릭(Model Metric) 정보를 반영한 데이터 분포 그래프를 제공합니다. 데이터 수집 환경과 모델 성능 지표 등을 쿼리로 활용해 다양한 방법으로 데이터를 필터링할 수 있습니다.

*다양한 기상 및 시간 조건에서 수집한 데이터를 구분하고 모델 성능 지표에 따라 다른 색으로 표현합니다. 모델 학습 결과를 빠르게 파악하여 엣지 케이스(Edge Case)를 쉽게 찾아낼 수 있습니다.








Data curation

untitled
데이터셋 커버리지 손상을 최소화하며 자동으로 데이터를 선별합니다. 선별할 데이터의 개수 혹은 비율, 그리고 선별 알고리즘을 자유롭게 설정할 수 있습니다. 큐레이션 기능을 국소적으로 활용하면 데이터셋을 보다 정밀하게 구성할 수 있습니다.

*큐레이션 기능은 전체 데이터셋 커버리지를 빠르게 분석하거나, 용도에 맞게 데이터셋을 분류하는 (Train/Test set split) 등 머신러닝(ML) 라이프사이클 동안 다양한 방법으로 활용됩니다.








untitled
지정한 데이터와 유사한 데이터를 자동으로 조회합니다. 설정한 범위 내에서 검색과 편집을 반복하며 데이터셋을 원하는 대로 구성합니다.

*검색 결과를 보정할 보조 데이터를 선택해 사용자의 인사이트를 반영할 수 있습니다. 대상 주변의 점들을 직접 눌러 비슷한 데이터를 찾을 수도 있지만, 검색 기능을 활용하면 보다 정밀하고 신속한 작업이 가능합니다.