브라우저에서 이미지 한 장을 3D 에셋으로 바꾸는 SHARP 실험
`ml-sharp-web`은 Apple SHARP를 브라우저용 ONNX Runtime으로 실행해, 이미지 한 장을 Gaussian splat `.ply` 파일로 만들고 곧바로 미리보기와 다운로드까지 해보게 하는 웹 프로토타입이다.
2026-05-04
왜 중요한가
- AI 생성·변환 모델을 서버 API 대신 사용자의 브라우저 안에서 돌리는 방식이 실제 제품 화면으로 들어오고 있다.
- 결과물이 단순한 이미지 미리보기에 그치지 않고 .ply 3D 파일로 내려받을 수 있다는 점이 눈에 띈다. 사람이 다시 열어 보고, 고치고, 다른 작업에 이어 붙일 수 있는 출력물로 남기기 때문이다.
- 개인이나 연구실처럼 민감한 이미지 자료를 다루는 곳에서는 파일을 서버로 보내지 않는 실행 방식이 매력적일 수 있다.
- 다만 약 2.4GB 모델 보조 파일, WebGPU와 WASM fallback, 브라우저 메모리, 라이선스 제한이 함께 따라와서 브라우저 AI가 실제로 배포될 때 부딪히는 부담도 잘 보여준다.
해석
이 사례에서 흥미로운 부분은 ‘브라우저에서 AI를 돌린다’는 말보다, 결과를 바로 확인하고 .ply 파일로 가져갈 수 있게 만든 작업 흐름이다. 이미지 한 장이 3D splat 파일이 되고, 그 파일을 사람이 다시 검토하거나 다른 도구에서 이어 쓸 수 있는 형태로 남긴다.
그래서 지금은 완성도 높은 제품이라기보다, 무거운 모델을 클라이언트 쪽에 둘 때 어떤 사용자 경험과 배포 문제가 생기는지 보여주는 참고 사례에 가깝다. 이번 확인도 설치, 빌드, 소스 경로 검토까지였고 실제 3D 결과의 품질이나 속도는 평가하지 않았다.
누구에게 도움이 되나
- 디자이너/프로토타이핑 팀: 한 장의 reference image에서 빠르게 3D splat asset을 만들어 preview하고 공유하는 실험 workflow.
- 교육/연구 데모: 서버 세팅 없이 브라우저에서 modern 3D reconstruction/inference stack을 보여주는 teaching demo.
- 제품 팀: 무거운 모델도 client-side로 둘 수 있는지, hosted sidecar와 WebGPU/WASM fallback UX를 어떻게 설계해야 하는지 참고 가능.
- 개인정보 민감 조직: 이미지 데이터가 서버로 올라가지 않는 local-first AI UX의 출발점으로 검토 가능.
어디에 바로 써볼 수 있나
- “AI 결과물을 사람이 검토 가능한 artifact로 만든다”는 관점에서, 생성 모델 평가/인터페이스 연구 사례로 쓸 수 있다. 특히 이미지 → 3D 구조물처럼 검증과 후처리가 필요한 출력에 적합하다.
- 민감한 이미지나 실험 시각 자료를 외부 서버에 올리지 않고 로컬 브라우저에서 변환하는 workflow의 가능성을 보여준다.
- OpenClaw가 이미지/도표/3D/시각 자료를 다룰 때, 서버 API만 쓰는 대신 client-side worker + downloadable artifact + preview/checklist 패턴을 참고할 수 있다.
- AI가 만든 시각 결과를 raw 이미지로만 저장하지 않고 .ply, metadata, preview snapshot처럼 재검토 가능한 artifact 단위로 보존하는 방향을 떠올릴 수 있다.
- 한 장의 reference image에서 빠르게 3D splat asset을 만들어 preview하고 공유하는 실험 workflow.
- 서버 세팅 없이 브라우저에서 modern 3D reconstruction/inference stack을 보여주는 teaching demo.
- 무거운 모델도 client-side로 둘 수 있는지, hosted sidecar와 WebGPU/WASM fallback UX를 어떻게 설계해야 하는지 참고 가능.
- 이미지 데이터가 서버로 올라가지 않는 local-first AI UX의 출발점으로 검토 가능.
주요 출처
공식 repo / docs
주의점
- 브라우저에서 실행된다고 해서 가볍다는 뜻은 아니다. 약 2.4GB 모델 보조 파일, 긴 로딩 시간, 메모리 사용량, 브라우저 호환성이 모두 장벽이 될 수 있다.
- 호스팅된 모델 URL에 기대면 CORS, 접속 안정성, 대역폭 비용이 제품 리스크로 이어질 수 있다.
- 사용자가 .onnx 파일만 직접 올리는 경우에도 필요한 .onnx.data 보조 파일이 없으면 실패할 수 있다.
- Apple SHARP 모델 가중치에는 상위 프로젝트의 라이선스 제한이 있으므로, 상업적 사용이나 제품 적용 전에는 라이선스 확인이 필요하다.
- 이번 hands-on은 설치, 빌드, 소스 검토까지다. 실제 splat 품질, 속도, 메모리 압박은 검증하지 않았다.
- 최근의 시각 생성 평가 주제와 맞닿아 보일 수 있지만, 여기서 본 핵심은 생성 품질 평가가 아니라 브라우저 안에서 실행하고 파일로 내보내는 구조다.
다음에 볼 포인트
- 약 2.4GB 모델 파일을 브라우저 사용자에게 어떻게 내려받게 하고, 실패했을 때 어떤 안내를 제공하는지 볼 것.
- WebGPU가 안 되는 환경에서 WASM fallback이 실제 사용 가능한 속도와 안정성을 내는지 확인할 것.
- .ply처럼 다시 열어 보고 수정할 수 있는 출력물을 중심으로 AI 인터페이스를 설계하는 사례가 더 늘어나는지 지켜볼 것.