Project Go-Big — Figure AI Dạy Robot Bằng Hàng Triệu Video Internet
Bài Toán Lớn Nhất Của Robot: Học Từ Đâu?
Khi trẻ em học cách cầm thìa, chúng quan sát bố mẹ làm — hàng chục, hàng trăm lần — trước khi tự thực hiện. Não người học cực kỳ hiệu quả từ quan sát. Nhưng robot học cách nào? Lập trình từng động tác? Quá chậm. Thuê người demo từng tác vụ? Tốn kém và không mở rộng được.
Câu trả lời của Figure AI là Project Go-Big: dùng video internet quy mô lớn — YouTube, các dataset hành động con người — làm nguồn dữ liệu huấn luyện khổng lồ.
Project Go-Big — Tháng 9/2025
Figure AI công bố Project Go-Big vào tháng 9/2025 với một tuyên bố táo bạo: thay vì thu thập dữ liệu robot đắt đỏ, họ dùng dữ liệu internet quy mô lớn — hàng triệu video về con người thực hiện các tác vụ hàng ngày — để huấn luyện mô hình AI tổng quát. Sau đó áp dụng kỹ thuật zero-shot transfer để robot thực hiện các tác vụ chưa bao giờ được demo trực tiếp.
Zero-Shot Transfer — Học Không Cần Thực Hành Trước
Đây là khái niệm quan trọng nhất trong Project Go-Big:
- Zero-shot: robot có thể thực hiện tác vụ mà nó chưa bao giờ được huấn luyện trực tiếp
- Thay vì học "cách rót nước vào cốc" qua 10.000 demo robot, nó học từ video người đổ nước
- Mô hình tổng quát hóa từ hành vi con người sang hành động robot
- Kết hợp lệnh ngôn ngữ tự nhiên: "rót nước vào cốc" → robot thực hiện mà không cần chương trình cụ thể
Tại Sao Đây Là Đột Phá Thực Sự?
Trước đây, mỗi kỹ năng mới của robot đòi hỏi:
- Xác định tác vụ cụ thể
- Thu thập hàng nghìn demo trong môi trường robot
- Huấn luyện mô hình riêng cho tác vụ đó
- Test và fine-tune
Project Go-Big hứa hẹn rút gọn quy trình này bằng cách dùng kiến thức tổng quát về hành vi con người. Một robot "biết" cách con người tương tác với thế giới có thể thích nghi nhanh hơn với tác vụ mới.
So Sánh Với Cách Tiếp Cận Của Đối Thủ
| Công ty | Phương pháp huấn luyện AI |
|---|---|
| Figure AI (Project Go-Big) | Video internet + zero-shot transfer |
| Toyota Research Institute | Diffusion Policy — demo trực tiếp của con người |
| Tesla (Optimus) | Dữ liệu từ hàng triệu xe Tesla + simulation |
| Boston Dynamics | RL (reinforcement learning) + motion capture |
Còn Nhiều Thách Thức Phía Trước
Project Go-Big là hướng tiếp cận đầy hứa hẹn nhưng chưa được chứng minh hoàn toàn ở quy mô lớn. Khoảng cách giữa video 2D của con người và hành động 3D của robot (domain gap) vẫn là thách thức kỹ thuật lớn. Figure AI đang tích cực nghiên cứu để thu hẹp khoảng cách này.
"Nếu chúng ta có thể học từ internet như con người học từ quan sát, thì không có giới hạn nào cho những gì robot có thể làm." — Figure AI, Project Go-Big, tháng 9/2025