World Labs sản phẩm thương mại đầu tiên của Dr. Lei Fei: Marble

0
0

World Labs, startup do nhà tiên phong AI Fei-Fei Li sáng lập, đang ra mắt sản phẩm mô hình thế giới (world model) thương mại đầu tiên của mình. Marble hiện đã có mặt với các gói freemium và trả phí, cho phép người dùng biến văn bản mô tả, ảnh, video, bố cục 3D hoặc ảnh panorama thành môi trường 3D có thể chỉnh sửa và tải về.

Việc ra mắt mô hình thế giới sinh (generative world model), vốn được phát hành bản beta giới hạn cách đây hai tháng, diễn ra chỉ hơn một năm sau khi World Labs thoát khỏi chế độ “stealth” với 230 triệu USD vốn đầu tư, và đưa startup này vượt lên trước các đối thủ đang phát triển mô hình thế giới. Mô hình thế giới là các hệ thống AI tạo ra biểu diễn nội tại của môi trường, có thể dùng để dự đoán kết quả trong tương lai và lập kế hoạch hành động.

Các startup như Decart và Odyssey đã phát hành các bản demo miễn phí, còn Genie của Google vẫn đang ở giai đoạn xem trước nghiên cứu hạn chế. Marble khác với những sản phẩm này — và thậm chí khác với mô hình thời gian thực RTFM của chính World Labs — ở chỗ nó tạo ra môi trường 3D bền vững, có thể tải về, thay vì tạo thế giới “tức thời” khi bạn khám phá. Theo công ty, điều này giúp giảm biến dạng hoặc thiếu nhất quán, đồng thời cho phép người dùng xuất thế giới dưới dạng Gaussian splats, lưới (meshes) hoặc video.

Marble cũng là mô hình đầu tiên cùng loại cung cấp các công cụ chỉnh sửa thuần AI và trình biên tập 3D lai, cho phép người dùng phác thảo cấu trúc không gian trước, rồi để AI hoàn thiện chi tiết hình ảnh.

Ảnh minh họa: World Labs

“Đây là một danh mục mô hình hoàn toàn mới có khả năng tạo ra các thế giới 3D, và nó sẽ ngày càng tốt hơn theo thời gian. Chúng tôi đã cải thiện rất nhiều,” Justin Johnson, đồng sáng lập World Labs, chia sẻ với TechCrunch.

Tháng 12 năm ngoái, World Labs đã trình diễn cách các mô hình ban đầu của họ có thể tạo cảnh 3D tương tác từ một hình ảnh duy nhất. Dù ấn tượng, các cảnh này vẫn mang phong cách hơi hoạt hình, chưa thể khám phá trọn vẹn do phạm vi di chuyển hạn chế và đôi khi có lỗi dựng hình.

Trong lần dùng thử bản beta, tôi thấy Marble tạo ra những thế giới ấn tượng chỉ từ ảnh — từ môi trường giống game cho tới bản sao chân thực phòng khách của tôi. Các cảnh có hiện tượng biến dạng ở rìa, dù theo công ty thì điều này đã được cải thiện trong bản ra mắt hôm nay. Tuy vậy, một thế giới tôi tạo ở bản beta bằng một prompt duy nhất lại trông đẹp hơn và khớp ý định của tôi hơn so với khi dùng cùng prompt ở hiện tại.

Johnson cho rằng các trường hợp sử dụng ban đầu của Marble sẽ là game, VFX cho điện ảnh và VR.

Các nhà phát triển game có quan điểm trái chiều về công nghệ này. Một khảo sát gần đây tại Game Developers Conference cho thấy 1/3 người tham gia tin rằng AI sinh có tác động tiêu cực đến ngành game — tăng 12% so với năm trước. Những lo ngại hàng đầu gồm xâm phạm sở hữu trí tuệ, tiêu thụ năng lượng, và suy giảm chất lượng nội dung do AI tạo ra. Năm ngoái, một cuộc điều tra của Wired phát hiện các studio như Activision Blizzard dùng AI để cắt giảm chi phí và chống suy giảm nhân sự.

Trong game, Johnson hình dung các nhà phát triển dùng Marble để tạo môi trường nền và không gian xung quanh, sau đó nhập các tài sản này vào các engine như Unity hoặc Unreal Engine để thêm tương tác, logic và mã.

“Nó không được thiết kế để thay thế toàn bộ quy trình hiện có của ngành game, mà chỉ cung cấp tài sản để bạn đưa vào quy trình đó,” ông nói.

Với VFX, Marble giúp tránh sự thiếu nhất quán và kiểm soát camera kém thường gặp ở các trình tạo video AI, theo Johnson. Các tài sản 3D cho phép nghệ sĩ dàn cảnh và điều khiển chuyển động camera với độ chính xác từng khung hình.

Dù World Labs hiện chưa tập trung vào VR, Johnson lưu ý rằng ngành này đang khát nội dung và rất hào hứng với màn ra mắt. Marble đã tương thích với Vision Pro và Quest 3, và mọi thế giới được tạo đều có thể xem bằng VR ngay hôm nay.

Marble cũng có tiềm năng cho robot. Johnson cho biết, không giống tạo ảnh/video, robot thiếu kho dữ liệu huấn luyện lớn. Nhưng với các trình tạo như Marble, việc mô phỏng môi trường huấn luyện trở nên dễ dàng hơn.

Theo một tuyên ngôn gần đây của Fei-Fei Li, CEO và đồng sáng lập World Labs, Marble đại diện cho bước đầu tiên hướng tới việc tạo ra “mô hình thế giới thực sự có trí tuệ không gian.”

Dr. Li tin rằng “thế hệ mô hình thế giới tiếp theo sẽ cho phép máy móc đạt tới trí tuệ không gian ở một cấp độ hoàn toàn mới.” Nếu các mô hình ngôn ngữ lớn có thể dạy máy đọc và viết, Li hy vọng các hệ thống như Marble có thể dạy chúng nhìn và xây dựng. Bà cho rằng khả năng hiểu cách các vật thể tồn tại và tương tác trong không gian 3D cuối cùng có thể giúp máy móc tạo ra đột phá vượt ra ngoài game và robot, thậm chí trong khoa học và y học.

“Giấc mơ về những cỗ máy thực sự thông minh sẽ không thể trọn vẹn nếu thiếu trí tuệ không gian,” Dr. Li viết.

LEAVE A REPLY

Please enter your comment!
Please enter your name here