首页 小说推荐 实时讯息 百科知识 范文大全 经典语录
位置: 首页 > 实时讯息 >

清华朱军团队 | 从点云到高保真三维网格:DeepMesh突破自回归生成瓶颈

0次浏览     发布时间:2025-03-31 15:01:00    

来源:机器之心Pro

论文有三位共同一作。赵若雯,清华大学一年级硕士生,主要研究生成模型、强化学习和具身智能,已在ICRA等会议发表论文。叶俊良,清华大学二年级硕士生,专注于3D生成和基于人类偏好的多模态强化学习研究,曾以第一作者身份在ECCV发表DreamReward,该成果能生成更符合人类偏好的3D资产。王征翊,清华大学四年级博士生,主要研究3D多模态生成模型,已在NeurIPS、ECCV、ICML、CVPR等顶级学术会议发表多篇论文。

在三维数字内容生产领域,三角形网格作为核心的几何表示形式,其质量直接影响虚拟资产在影视、游戏和工业设计等应用场景中的表现与效率。

传统的三维网格生成方式,如人工建模或 Marching Cubes 等算法,存在成本高、拓扑结构质量差等问题。

针对这一瓶颈,清华大学朱军团队近日提出了 DeepMesh 方法,通过引入创新的自回归生成框架,显著提升了高面片人造网格的生成能力。该方法支持生成高达 3 万个面片的三维网格,相比现有技术提升了一个数量级。

  • 论文标题:DeepMesh: Auto-Regressive Artist-mesh Creation with Reinforcement Learning
  • 论文主页:https://zhaorw02.github.io/DeepMesh/
  • 论文地址:https://arxiv.org/abs/2503.15265
  • 代码:https://github.com/zhaorw02/DeepMesh

DeepMesh 基于输入点云,采用自回归的 Transformer 架构逐步预测面片序列,从而生成拓扑结构合理且视觉美观的高质量三维网格。

DeepMesh 架构如图所示,系统首先利用编码器对输入点云进行特征提取;提取到的特征随后被输入至自回归 Transformer 模块,该模块通过融合自注意力与交叉注意力机制,逐步预测网格的顶点或面片序列,最终生成结构完整的高质量三维网格。

在预训练阶段,DeepMesh 引入了三级块结构网格标记化方法:根据面片之间的连通性对网格进行分解,并将其划分为粗、中、细多个空间层级。在此基础上,将面片中各顶点的坐标映射为相对于所属层级块的偏移索引,并对重复索引进行合并处理。

该方法在确保几何精度的同时,显著压缩了序列长度,从而大幅提升了训练效率。图中展示了采用 DeepMesh 网格标记化方法与其他方法,在训练不同面片数量的网格数据时的耗时对比情况。

通过对训练数据进行封装处理,并引入融合几何质量与结构规整度的双重筛选机制,DeepMesh 有效解决了异常样本引发的训练不稳定问题,同时实现了训练过程中的动态负载均衡。为突破长序列带来的内存瓶颈,模型还采用了滑动窗口截断训练技术,支持单个网格生成高达 3 万个面片,显著提升了建模能力。

此外,DeepMesh 创新性地引入了「直接偏好优化(DPO)」强化学习框架,并构建了一个结合客观几何指标与主观人类评价的分阶段数据标注系统。

该系统首先利用几何质量指标筛除存在明显缺陷的 3D 样本,随后由人工对剩余数据进行标注,评估其拓扑结构的合理性与视觉观赏性。基于这套高质量的标注数据,团队对模型进行了强化训练,从而显著提升了生成结果在几何完整性与拓扑美观性方面的表现。

DeepMesh 在细节保真与结构多样性方面表现出色,并具备对传统生成方法所生成网格进行拓扑优化的能力。与现有方法相比,DeepMesh 在几何精度与拓扑质量两个维度均实现最优性能,生成的三维网格不仅在结构合理性上表现卓越,也在视觉美观性上更具吸引力。

在多样性生成方面,DeepMesh 能在保持输入点云几何一致性的前提下,对同一输入生成多种具有高保真度且外观风格各异的三维网格方案,展现出强大的创意生成与精度控制的能力。这一特性对于影视制作、游戏设计等需进行多版本快速迭代的应用场景具有显著价值。

针对传统方法(如 TRELLIS)生成的拓扑结构混乱问题,DeepMesh 可对其输出结果进行有效的拓扑优化,显著提升网格结构的有序性与合理性。

凭借在高保真、多样性与拓扑优化方面的突出表现,DeepMesh 展现出在 3D 内容创作领域的颠覆性潜力,特别适用于数字游戏、虚拟现实、影视制作等对创意表达与建模效率要求极高的行业。

该研究成果发布后迅速引发广泛关注,知名推特博主 AK 第一时间转发支持,相关内容获得上千点赞,引发业内与社群的热烈讨论与积极反馈。

以下展示更多由 DeepMesh 生成的三维网格示例,进一步体现模型在细节还原、拓扑合理性及多样性方面的强大能力。

相关文章

新野县法院邀基层工作者“沉浸式”体验司法 共筑解纷防线

大象新闻记者 魏广宝 通讯员 王硕/文图6月26日,新野县人民法院举办2025 年第十五次公众开放日活动,邀请汉城街道社区的民调主任、网格专干及网格员代表走进法院,通过实地参观法治文化展馆、立案大厅、旁听庭审现场等环节,深化基层联动,助力提升基层调解能力。在法治文化展馆,参观人员通过丰富的历史图片、

2025-06-27 11:30:00

辽宁印发《实施方案》促进人工智能创新发展

中新网沈阳6月25日电 (李晛 韩宏)记者25日从辽宁省政府新闻办召开的发布会上获悉,辽宁省政府办公厅印发了《辽宁省促进人工智能创新发展实施方案》(以下简称《实施方案》)。到2027年底,辽宁省算力基础设施建设体系基本形成。人工智能是引领未来的战略性技术,是新一轮科技革命和产业变革的重要驱动力量,将

2025-06-25 19:08:00

超930亿元!在福州闭幕!

第二十三届中国·海峡创新项目成果交易会在福州闭幕本届海创会签约总金额达930多亿元推动一批创新项目成果展示、交易和落地转化包华 摄本届海创会汇聚清华大学、哈尔滨工业大学、武汉理工大学等主宾高校,集聚马军、段路明、梅宏等院士专家,集中展示一批前沿科技成果,包括清华大学“海上能源岛并网/孤网运行系统”、

2025-06-21 17:15:00

在大模型应用中拓展师生思维

图①上海市虹口区曲阳第四小学学生使用学科学习智能体完善思维导图梳理。学校供图图②北京第十中学课堂教学中,学生使用生物学科AI学伴智能体开展自主学习。学校供图当前,人工智能技术已经开启了一个新的时代,社会转型必然会对教育发展提出新的要求。特别是具有开放性特征的通用大模型,借助区域教育教学资源对其进行训

2025-06-17 07:11:00

全球首款安卓AR眼镜亮相,上海产业链抢占先机!

5月20日,谷歌全球开发者大会上,全球首款安卓系统AR(增强现实)眼镜正式亮相,由谷歌和上海AI硬件企业XREAL联合打造,开启了AR行业的“安卓时刻”。记者注意到,受益于国内开源生态的持续影响,以AR眼镜、AI电脑、AI手机为代表的AI硬件正快速走向市场,成为AI应用的新风口。上海凭借完善的产业链

2025-05-31 09:07:00

o3不听指令拒绝关机,7次破坏关机脚本,AI正在学会「自我保护」机制

AI居然不听指令,阻止人类把自己给关机了???有测试者编写了一个关机脚本来测试AI模型,结果显示Codex-mini、o3、o4-mini忽略了该指令,并至少一次成功破坏了关机脚本。o3甚至还重新定义脚本命令!这不禁让人想到那句经典的“I’m sorry Dave, I’m afraid I can

2025-05-27 12:26:00

租金逾期人失联 房东急寻租客 社区帮助寻人

本报讯(记者 李涛)约定的日期已过,租客却迟迟未付租金,且电话始终打不通。房东很着急,由于在外地赶不回来,便求助社区寻人。5月16日,网格员辗转联系到租客,弄清原委。居民李先生在兴华南小区5号楼有套空房,对外出租。陈先生从临汾来到太原,租住在此。双方约定,每年4月底支付全年租金。去年,租客付款及时,

2025-05-18 18:33:00

成都高新区两家企业入选福布斯

5月11日,2025福布斯中国人工智能科技企业TOP 50评选结果发布,成都高新区有两家企业入选,分别是成都恒图科技有限责任公司、成都考拉悠然科技有限公司。其中,成都恒图科技成立于2009年,专注于视觉内容创作与人工智能融合创新,核心产品图片处理软件Fotor创新性地将图像与视频创作流程与人工智能技

2025-05-12 10:55:00