TraviaTechPie Review

Review Tech, Science, Finance

오픈소스 AI라고 하면 대부분 “직접 다운받아 실행하는 언어 모델”을 먼저 떠올립니다. 그런데 로봇 쪽은 그동안 좀 달랐습니다. 코드는 비공개였고, 시뮬레이터는 비쌌으며, 데이터셋은 아무도 공유하지 않았습니다. 로봇에게 쓸모 있는 일을 시키려면 사실상 돈 많은 연구실 안에 있어야 했습니다.

그런데 그 벽이 조금씩 무너지고 있습니다. 이번 릴리즈는 한 걸음 더 나아갑니다.

무슨 일이 있었나

허깅페이스(Hugging Face)가 만드는 오픈소스 로봇 학습 라이브러리 LeRobot이 최근 v0.5.0 버전을 공개했습니다. 이번에 처음으로 넘어선 경계가 있는데, 바로 휴머노이드 공식 지원입니다.

대상이 된 로봇은 유니트리(Unitree) G1입니다. 키 1.27m, 무게 35kg 정도 되는 휴머노이드인데, 가격이 구성에 따라 1,600만 원대부터 시작합니다. 저렴하지는 않습니다. 하지만 휴머노이드 세계에서는 이 가격이 충격적으로 낮은 편입니다. 보통 사람 크기 휴머노이드는 아직 억 단위 연구용 장비이기 때문입니다.

LeRobot v0.5.0은 이 G1을, 원래 저가형 로봇 팔에 쓰던 것과 똑같은 표준 인터페이스로 통합했습니다. 결국 G1이 특정 회사에 종속된 폐쇄 구조에서 벗어나, 누구나 원격 조종하고 데이터를 기록하며 정책을 학습시킬 수 있는 표준 로봇이 되었습니다.

이번 지원은 구색 맞추기가 아니라 실질적으로 완성도 높은 구현입니다.

  • G1의 23축, 29축 버전 둘 다 지원합니다. (‘축’은 로봇이 독립적으로 움직일 수 있는 관절 수라고 보면 됩니다. 많을수록 손놀림이 섬세합니다.)
  • 전신 제어(whole-body control)를 지원해서, 다리랑 팔을 따로 노는 게 아니라 같이 조율해서 움직입니다.
  • 노트북에서 이더넷이나 와이파이로 원격 조종 가능하고, 시연 데이터 녹화하고, 시뮬레이션에서 학습한 다음 실제 로봇에 다시 올릴 수 있습니다.
  • 심지어 ‘Homunculus’라는 오픈소스 외골격(exoskeleton)도 지원합니다. 사람이 직접 로봇 상체를 조종해 자연스러운 학습 데이터를 수집합니다.

휴머노이드 말고도 바뀐 것들

이번 버전이 전체적으로 큰 업데이트입니다. 이전 버전 이후로 PR(코드 기여)이 200개 넘게 합쳐졌고, 새 기여자가 50명 넘게 들어왔습니다.

휴머노이드 빼고도 눈에 띄는 게 몇 개 있습니다.

새 정책 모델. Pi0-FAST라는 VLA가 추가됐습니다. VLA는 ‘vision-language-action’의 줄임말인데, 카메라 이미지와 텍스트 명령을 받아 로봇 움직임을 생성하는 모델입니다. 그리고 RTC(Real-Time Chunking)라는 기법도 들어왔는데, 학습된 로봇이 동작 중간에 버벅거리지 않고 부드럽게 반응하게 해주는 기법입니다. 로봇이 작업 중에 멈칫하는 모습을 본 적이 있다면, 이것이 왜 중요한지 이해가 될 것입니다.

빨라진 데이터 파이프라인. 이미지 학습이 약 10배 빨라졌고, 녹화 사이사이 비는 시간을 없앤 ‘스트리밍 영상 인코딩’이 들어왔습니다. 지루하게 들리지만 실제로 로봇 학습의 핵심 병목은 데이터 수집입니다. 대기 시간을 줄이면 시간당 시연 횟수가 그대로 늘어납니다.

시뮬레이션 연결. 허깅페이스 허브에서 시뮬레이션 환경을 바로 끌어오는 ‘EnvHub’가 생겼고, NVIDIA의 IsaacLab-Arena와 연동돼서 GPU로 로봇 수천 개를 동시에 돌리는 병렬 학습도 가능해졌습니다.

참고로 분위기를 보면, LeRobot 깃허브는 별이 2만 4천 개를 넘었고, 프로젝트 논문은 머신러닝 최고 학회 중 하나인 ICLR 2026에 채택됐습니다. 이후 v0.5.1 패치도 공개되었습니다. LeRobot은 더 이상 주변부 프로젝트가 아닙니다.

이게 왜 중요한가

이 블로그에서 ‘Physical AI’ 흐름을 계속 따라왔습니다. 채팅창 안에 사는 AI에서, 현실 세계의 물건을 움직이는 AI로 넘어가는 흐름입니다. 테슬라가 3세대 옵티머스를 예고하고, Physical Intelligence가 범용 조작 로봇을 연구하고, CMU가 로봇 센터에 1억 달러를 붓고, 알파벳이 Intrinsic을 구글로 합쳐 ‘로봇판 안드로이드’를 만들겠다고 했습니다. 각각 별개의 뉴스이지만, 방향을 놓고 보면 하나의 흐름입니다.

LeRobot v0.5.0도 그 흐름 위에 있습니다. 다만 이 릴리즈가 실제로 메우는 빈틈이 어디인지는 정확히 짚어 보겠습니다.

Physical AI 뉴스는 대부분 하드웨어 아니면 거대 모델 이야기입니다. 더 화려한 휴머노이드, 더 큰 로봇 파운데이션 모델 같은 주제입니다. 그러나 LeRobot은 둘 다 아닙니다. 그 사이에 위치한 눈에 띄지 않는 층, 즉 툴체인·데이터 포맷·표준 인터페이스가 LeRobot의 실체입니다. 이 눈에 띄지 않는 기반 층이야말로 한 분야가 소수의 전유물로 남느냐, 대중화되느냐를 가르는 지점입니다.

자꾸 떠오르는 비유가 있습니다. 언어 모델 AI가 폭발한 것은 어느 한 연구실이 좋은 모델 하나 만들어서가 아닙니다. 공유된 스택이 생기고 나서였습니다. 허깅페이스의 Transformers 라이브러리, 공통 데이터셋 포맷, 누구나 받을 수 있는 모델 파일 덕분입니다. 그 결과 대학원생 한 명과 대형 연구실이 같은 출발선에 서게 되었습니다. 로봇은 그것이 없었습니다. 연구실마다 똑같은 기반을 새로 만들고, 데이터셋은 외부로 공유되지 못했습니다.

LeRobot이 G1으로 하고 있는 것이 바로 그것입니다. 휴머노이드를 그 공유 스택 위로 끌어올리는 작업입니다. 정책을 하나 학습시켜 허브에 공유하면, 다른 누군가가 그것을 받아서 이어갑니다. 이 순환이 반복되며 효과가 누적됩니다.

알파벳이 말하는 ‘로봇판 안드로이드’는 한 회사가 통제하는 플랫폼입니다. LeRobot은 같은 야망의 더 지저분하고 더 열린 버전입니다. 더불어 특정 하드웨어에 종속되지 않습니다. 1,600만 원짜리 유니트리 G1을 돌리는 그 인터페이스가, 10만 원대 로봇 팔도 돌립니다. 이 부분이 가장 흥미롭습니다. 진입 장벽이 ‘시리즈 A 투자 유치’가 아니라 ‘GPU 한 장과 주말 하루’로 낮아진다는 의미이기 때문입니다.

다만 솔직하게 단서 두 가지를 달겠습니다.

첫째, 소프트웨어가 로봇을 지원한다는 것과 그 로봇이 잘한다는 것은 다른 이야기입니다. 휴머노이드의 진짜 어려운 문제들 — 안정적인 두 발 균형, 섬세한 손, 바닥이 울퉁불퉁해도 안 넘어지기 — 은 여전히 풀리지 않았습니다. 깔끔한 파이썬 인터페이스가 그것을 대신 풀어주지는 않습니다.

둘째, 1,600만 원이 ‘싸다’는 것은 어디까지나 다른 휴머노이드 옆에 놨을 때 이야기입니다. 여전히 큰돈이라, 당장 혜택을 보는 것은 취미 사용자가 아니라 대학이나 자금 있는 스타트업입니다. 대중화는 진짜지만 단계적입니다. 문을 넓히는 것이지, 문을 없애지는 않습니다.

그래도 방향이 핵심입니다. 언어 AI를 빠르게 굴린 패턴 — 공개된 가중치, 공유 데이터, 공통 툴체인 — 이 지금 눈에 보이게 로보틱스로 복사되고 있고, 이제 그 목록에 두 발로 걷는 휴머노이드까지 포함되었습니다.

직전 시기가 텍스트용 오픈소스 AI의 시대였다면, 다음 국면은 물리 세계용 오픈소스 AI가 될 것이라는 게 제 생각입니다. LeRobot이 거기로 가는 구체적인 한 걸음을 내디뎠습니다. 이 위에 무엇이 올라오는지 지켜볼 만합니다.

한 줄 요약

허깅페이스의 오픈소스 로봇 학습 라이브러리 LeRobot이 v0.5.0에서 휴머노이드 유니트리 G1을 정식 지원하기 시작했습니다. 전신 제어, 원격 조종, 학습·배포까지 다 되고, 같은 인터페이스로 10만 원대 로봇 팔도 돌아갑니다. 언어 AI를 키운 ‘공유 스택’ 패턴이 이제 휴머노이드 로보틱스로 옮겨붙는 중 — Physical AI 흐름의 ‘재미없지만 결정적인’ 한 조각입니다.


원문 출처 / Source: https://huggingface.co/blog/lerobot-release-v050

이미지: Gabriele Malaspina / Unsplash

Posted in

댓글 남기기

TraviaTechPie Review에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기