생성형 AI를 넘어 실제 환경을 인식하고 판단·행동하는 '피지컬 AI(Physical AI)' 시대가 본격화되면서 글로벌 AI 산업의 경쟁축이 데이터 인프라로 이동하고 있다. 로봇·자율주행·스마트팩토리 등 현실 세계에서 AI를 구현하기 위해서는 실제 환경과 유사한 학습 데이터 확보가 필수적이며, 합성데이터(Synthetic Data)가 이를 뒷받침할 핵심 기반으로 주목받고 있다.
합성데이터는 실제 데이터를 반복 수집하는 대신 디지털 트윈(Digital Twin) 기반 가상환경에서 생성한 AI 학습용 데이터다. 단순 3D 모델링을 넘어 소재, 표면 질감, 반사율, 조명, 센서 오차 등 현실의 물리 요소를 반영해 산업 현장과 유사한 학습 환경을 구현하는 것이 핵심이다.
업계에서는 실제 현장에서 로봇을 반복 학습시키는 방식이 비용·시간·예외 데이터 확보 측면에서 한계가 있는 만큼, 가상환경에서 먼저 학습·검증한 뒤 현실에 적용하는 '시뮬레이션-투-리얼(Sim-to-Real)' 구조가 확산될 것으로 보고 있다. 이에 따라 단순 데이터 생성량보다 실제 로보틱스·자율주행·스마트팩토리 환경에서 즉시 활용 가능한 '시뮬레이션 레디 데이터(Simulation-Ready Data)'의 중요성이 커지고 있다.
대표 사례로는 글로벌 산업 자동화 기업 ABB와 엔비디아(NVIDIA)의 협력이 꼽힌다. ABB 로보틱스(ABB Robotics)는 차세대 자율 산업용 로봇 개발을 위해 엔비디아와 협력 체계를 구축하고, 자사 로봇 시뮬레이션 플랫폼 '로봇스튜디오(RobotStudio)'와 엔비디아 '옴니버스(Omniverse)'를 결합한 산업용 AI 시뮬레이션 환경 구축 계획을 공개했다.
ABB는 로봇 설계·프로그래밍·시뮬레이션 소프트웨어인 로봇스튜디오에 엔비디아 옴니버스를 결합해 산업용 로봇이 실제 공장에 투입되기 전 가상환경에서 작업을 학습·검증할 수 있는 구조를 고도화하고 있다. 엔비디아 역시 옴니버스와 아이작 심(Isaac Sim) 기반 물리 시뮬레이션 기술을 통해 가상환경과 실제 환경 간 오차를 줄이는 Sim-to-Real 기술 개발에 집중하고 있다.
업계에서는 이번 협력을 단순 기술 제휴가 아니라, 피지컬 AI 시대 핵심 인프라인 합성데이터와 시뮬레이션 생태계를 선점하기 위한 전략적 움직임으로 해석하고 있다. 가상환경에서 학습한 AI 모델이 제조·물류 등 실제 산업 현장에서도 안정적으로 작동하도록 만드는 기술 경쟁이 본격화되고 있다는 분석이다.
국내에서도 피지컬 AI 학습용 합성데이터 시장을 겨냥한 움직임이 확대되고 있다. 다만 산업 현장의 공간 구조, 조명, 객체 상호작용, 로봇 동선, 물리 기반 시뮬레이션까지 구현해야 하는 산업용 합성데이터 분야는 높은 기술 장벽을 가진 영역으로 평가된다.
이 가운데 스카이인텔리전스( SKAI Intelligence)가 엔비디아 옴니버스 기반 산업용 합성데이터 기업으로 주목받고 있다. 회사는 최근 디지털 트윈 및 합성데이터 기술 고도화를 위한 기업부설연구소(R&D 센터)를 설립하고, 리얼-투-시뮬레이션(Real-to-Sim)·시뮬레이션-투-리얼 구조 설계를 위한 기술 역량 강화에 나서고 있다.
스카이인텔리전스는 단순 3D 데이터 생성을 넘어 산업 현장의 구조, 객체 상호작용, 로봇 동선, 물리 기반 시뮬레이션을 연계한 합성데이터 인프라 고도화에 주력하고 있다. 이외에도 씨이랩(Xiilab), 엔닷라이트(N.LIGHT), 크라우드웍스(CrowdWorks) 등 일부 국내 기업들이 디지털 트윈, 3D CAD, AI 데이터 구축 역량을 기반으로 관련 시장 진출에 속도를 내고 있다.
시장 성장성도 가파르다. 글로벌 시장조사업체 그랜드 뷰 리서치(Grand View Research)에 따르면 글로벌 합성데이터 시장은 2023년 2억1840만달러 규모에서 2030년 17억8810만달러 규모로 성장할 전망이다. 로보틱스·자율주행·스마트팩토리 등 피지컬 AI 적용 산업이 확대되면서 산업용 합성데이터 수요도 빠르게 증가할 것으로 예상된다.
업계 관계자는 "피지컬 AI 시대에서 합성데이터는 로봇이 실제 환경에 투입되기 전 수많은 예외 상황을 사전에 경험하게 만드는 핵심 학습 인프라"라며 "향후 경쟁력은 현실 세계를 얼마나 정밀하게 디지털화하고, 이를 AI 학습 데이터와 실제 성능 개선으로 연결할 수 있는지에 달려 있다"고 말했다.




