首页 小说推荐 实时讯息 百科知识 范文大全 经典语录
位置: 首页 > 实时讯息 >

清华朱军团队 | 从点云到高保真三维网格:DeepMesh突破自回归生成瓶颈

0次浏览     发布时间:2025-03-31 15:01:00    

来源:机器之心Pro

论文有三位共同一作。赵若雯,清华大学一年级硕士生,主要研究生成模型、强化学习和具身智能,已在ICRA等会议发表论文。叶俊良,清华大学二年级硕士生,专注于3D生成和基于人类偏好的多模态强化学习研究,曾以第一作者身份在ECCV发表DreamReward,该成果能生成更符合人类偏好的3D资产。王征翊,清华大学四年级博士生,主要研究3D多模态生成模型,已在NeurIPS、ECCV、ICML、CVPR等顶级学术会议发表多篇论文。

在三维数字内容生产领域,三角形网格作为核心的几何表示形式,其质量直接影响虚拟资产在影视、游戏和工业设计等应用场景中的表现与效率。

传统的三维网格生成方式,如人工建模或 Marching Cubes 等算法,存在成本高、拓扑结构质量差等问题。

针对这一瓶颈,清华大学朱军团队近日提出了 DeepMesh 方法,通过引入创新的自回归生成框架,显著提升了高面片人造网格的生成能力。该方法支持生成高达 3 万个面片的三维网格,相比现有技术提升了一个数量级。

  • 论文标题:DeepMesh: Auto-Regressive Artist-mesh Creation with Reinforcement Learning
  • 论文主页:https://zhaorw02.github.io/DeepMesh/
  • 论文地址:https://arxiv.org/abs/2503.15265
  • 代码:https://github.com/zhaorw02/DeepMesh

DeepMesh 基于输入点云,采用自回归的 Transformer 架构逐步预测面片序列,从而生成拓扑结构合理且视觉美观的高质量三维网格。

DeepMesh 架构如图所示,系统首先利用编码器对输入点云进行特征提取;提取到的特征随后被输入至自回归 Transformer 模块,该模块通过融合自注意力与交叉注意力机制,逐步预测网格的顶点或面片序列,最终生成结构完整的高质量三维网格。

在预训练阶段,DeepMesh 引入了三级块结构网格标记化方法:根据面片之间的连通性对网格进行分解,并将其划分为粗、中、细多个空间层级。在此基础上,将面片中各顶点的坐标映射为相对于所属层级块的偏移索引,并对重复索引进行合并处理。

该方法在确保几何精度的同时,显著压缩了序列长度,从而大幅提升了训练效率。图中展示了采用 DeepMesh 网格标记化方法与其他方法,在训练不同面片数量的网格数据时的耗时对比情况。

通过对训练数据进行封装处理,并引入融合几何质量与结构规整度的双重筛选机制,DeepMesh 有效解决了异常样本引发的训练不稳定问题,同时实现了训练过程中的动态负载均衡。为突破长序列带来的内存瓶颈,模型还采用了滑动窗口截断训练技术,支持单个网格生成高达 3 万个面片,显著提升了建模能力。

此外,DeepMesh 创新性地引入了「直接偏好优化(DPO)」强化学习框架,并构建了一个结合客观几何指标与主观人类评价的分阶段数据标注系统。

该系统首先利用几何质量指标筛除存在明显缺陷的 3D 样本,随后由人工对剩余数据进行标注,评估其拓扑结构的合理性与视觉观赏性。基于这套高质量的标注数据,团队对模型进行了强化训练,从而显著提升了生成结果在几何完整性与拓扑美观性方面的表现。

DeepMesh 在细节保真与结构多样性方面表现出色,并具备对传统生成方法所生成网格进行拓扑优化的能力。与现有方法相比,DeepMesh 在几何精度与拓扑质量两个维度均实现最优性能,生成的三维网格不仅在结构合理性上表现卓越,也在视觉美观性上更具吸引力。

在多样性生成方面,DeepMesh 能在保持输入点云几何一致性的前提下,对同一输入生成多种具有高保真度且外观风格各异的三维网格方案,展现出强大的创意生成与精度控制的能力。这一特性对于影视制作、游戏设计等需进行多版本快速迭代的应用场景具有显著价值。

针对传统方法(如 TRELLIS)生成的拓扑结构混乱问题,DeepMesh 可对其输出结果进行有效的拓扑优化,显著提升网格结构的有序性与合理性。

凭借在高保真、多样性与拓扑优化方面的突出表现,DeepMesh 展现出在 3D 内容创作领域的颠覆性潜力,特别适用于数字游戏、虚拟现实、影视制作等对创意表达与建模效率要求极高的行业。

该研究成果发布后迅速引发广泛关注,知名推特博主 AK 第一时间转发支持,相关内容获得上千点赞,引发业内与社群的热烈讨论与积极反馈。

以下展示更多由 DeepMesh 生成的三维网格示例,进一步体现模型在细节还原、拓扑合理性及多样性方面的强大能力。

相关文章

租金逾期人失联 房东急寻租客 社区帮助寻人

本报讯(记者 李涛)约定的日期已过,租客却迟迟未付租金,且电话始终打不通。房东很着急,由于在外地赶不回来,便求助社区寻人。5月16日,网格员辗转联系到租客,弄清原委。居民李先生在兴华南小区5号楼有套空房,对外出租。陈先生从临汾来到太原,租住在此。双方约定,每年4月底支付全年租金。去年,租客付款及时,

2025-05-18 18:33:00

成都高新区两家企业入选福布斯

5月11日,2025福布斯中国人工智能科技企业TOP 50评选结果发布,成都高新区有两家企业入选,分别是成都恒图科技有限责任公司、成都考拉悠然科技有限公司。其中,成都恒图科技成立于2009年,专注于视觉内容创作与人工智能融合创新,核心产品图片处理软件Fotor创新性地将图像与视频创作流程与人工智能技

2025-05-12 10:55:00

关键在于党建赋能

□吕志雄在焦作市基层高效能治理的图景上,能看到秉承初心的坚定,能看到工作作风的勇猛,又能看到焦作人民阔步走中国式现代化之路的矫健身姿。基层治理是国家治理的重要组成部分,是国家治理的基石。基层治理又是最繁重复杂的工程,既要有把握宏观面的高屋建瓴,又要有深入细胞的阐幽抉微,还要与时俱进,随着经济、技术的

2025-05-09 09:33:00

AI时代如何科学育儿?飞鹤携手清华大学开启首期系列家长研讨会

近日,由清华大学脑与智能实验室儿童认知研究中心主办的“AI时代如何科学育儿”系列家长研讨会首期举办。本系列研讨会是清华大学脑与智能实验室与中国飞鹤合作的“脑发育与认知”产学研深度融合专项的研究项目之一,旨在帮助家长们更好地在AI时代找到自己的科学育儿之道。研讨会首期特邀清华大学心理与认知科学系彭凯平

2025-05-08 09:52:00

iPhone17系列机模上手图曝光:Air新机薄到极致

据媒体报道,4月29日,YouTube频道Apple Track发布视频,展示了一组iPhone 17系列机模,并详细对比了iPhone 16系列。根据视频展示的机模细节,iPhone 17 Air采用“横向飞机跑道”设计,厚度仅为5.5mm/5.6mm,远薄于iPhone 16 Pro的8.25m

2025-04-30 09:05:00

80后手艺人王金川: 自制微缩模型,指尖还原老建筑

在黑河一间普通的工作室里,易拉罐、纸壳、泡沫板、铁丝等“废品”正被一双巧手赋予新的生命,80后手艺人王金川用这些不起眼的材料,复原出一座座消失的老建筑:“老三百”“魁星阁”“海兰照相馆”……每一件作品都承载着城市的记忆,也记录着他从童年至今对手工的热爱与执着。走进王金川的工作室,仿佛穿越了时光隧道:

2025-04-20 22:26:00

如何Dll修复组件

安装游戏或软件时,常遇dll报错,这会干扰其正常运行。1、 遇到dll报错,主要有两种解决办法:一是安装对应的dll组件,二是安装dll修复工具。建议优先尝试第一种方法。2、 遇到dll报错时,可在网上查找相关问题,从浏览器下载所需的dll组件来解决。3、 还可以通过软件修复,例如使用等辅助工具即可

2025-04-19 14:49:00

出台装备制造相关行业新一轮稳增长方案、电信业进一步扩大开放!工信部谈下阶段工作重点

4月18日,国新办举行新闻发布会,工业和信息化部有关负责人介绍2025年一季度工业和信息化发展情况。一季度规模以上工业增加值同比增长6.5%,增速比去年四季度加快0.8个百分点。一季度,工业对宏观经济增长的贡献率达到了36.3%。工业民间投资保持两位数增长,企业预期提振、效益改善,规模以上工业企业数

2025-04-19 02:01:00