编译/VR陀螺
近日,物理世界模型开发商SpAItial宣布推出最新前沿模型“Echo-2”,该模型可根据文本或图像输入,生成可通过任何设备实时探索的沉浸式3D环境,区别于传统序列视频模型,具备独特优势。
与逐帧预测的序列视频模型不同,Echo-2可通过单个图像或文本提示生成空间持久的3D场景,规避了传统模型计算需求高、几何漂移、输出不一致等问题。其网页演示采用3D高斯喷溅(3DGS)技术渲染,具备GPU友好型性能,即便在配置一般的硬件上,也可在浏览器中实现交互式观看。

该模型可连接多行业物理与数字环境,应用场景广泛:机器人领域支持Sim2Real知识迁移,助力机器人在模拟环境中训练后安全部署;游戏开发中可快速生成可导航3D环境,方便开发者快速搭建游戏原型;建筑和房地产领域可将2D平面图转换为3D场景,生成虚拟布置和交互式漫游,且无需昂贵3D扫描硬件。
Echo-2还具备场景理解和编辑功能,可生成语义分割掩码识别场景物体,支持通过文本提示添加、移除或替换物体,适用于室内设计等场景。据悉,该模型在WorldScore世界生成基准的三项指标上,均优于World Labs的“Marble-1.1”模型。
SpAItial表示,Echo-2未来版本将融入动力学和基于物理的推理,进一步支持交互式模拟和高级机器人训练。
来源:auganix
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 林南(微信 19250561593) 六六(微信 13138755620)
加入行业交流群:林南(微信 19250561593)
版权申明:本文经原作者授权发布,不代表VR陀螺立场,如需转载请直接联系原作者
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息