brepler流匹配编辑brep模型transformer
2026/6/26 1:50:15 网站建设 项目流程

B-repLer 能够实现高质量的 CAD 编辑,主要归功于它将 CAD 的几何问题转化为了一个序列到序列的翻译问题,并结合了两种核心技术:潜空间 (Latent Space) 操作流匹配 (Flow Matching)

以下是它的具体实现机制:

1. 在“潜空间”进行编辑 (B-rep Latent Space)

B-repLer 不直接在原始几何(如顶点、边)上操作,而是使用一个预训练的编码器(如 HoLa-BRep)将复杂的 CAD 模型映射到一个连续的潜空间中。

  • 避开历史记录:传统的编辑需要“建模历史”(如:先拉伸 A,再切除 B),但很多模型没有这些数据。B-repLer 直接处理最终的边界表示(B-rep),将每个面(Face)转化成一个 32 维的向量。
  • 保证有效性:潜空间经过训练,使得即使向量发生微小变化,解码出的模型依然能保持拓扑上的正确性(水密性),减少了生成废料的概率。

2. 混合架构:Transformer + 流匹配

B-repLer 的核心是一个变分自回归 Transformer,它分为两个步骤来生成编辑后的模型:

步骤 A:自回归预测(Transformer)

  • 它接收原始模型的向量、用户的文本指令和一张渲染图作为输入。
  • Transformer 会一步步预测编辑后模型应该包含哪些“面”的特征。
  • 关键点:它预测的不是具体的坐标,而是为下一步提供一个条件特征 (Conditioning Feature)

步骤 B:精细几何生成(流匹配)

  • 对于每一个预测出的面,B-repLer 使用流匹配网络 (Flow Matching Network)
  • 这是一种比扩散模型(Diffusion)更快的生成技术。它从随机的高斯噪声出发,在 Transformer 提供的“条件”指导下,通过 100 个微小的步骤将噪声“推”向精确的 B-rep 几何参数。
  • 这保证了生成的几何体(如 B 样条曲线)具有工业级的精度。

3. 多模态特征融合 (Multimodal Fusion)

为了让 AI 听懂指令并看懂模型,它做了以下对齐:

  • 文本:使用 Qwen2.5 提取指令语义(例如:“把底部的孔去掉”)。
  • 图像:使用 DINOv2 提取渲染图特征,并利用RoIAlign技术将图像中的视觉信息“贴”回 3D 的每一个面上,让模型知道指令里说的“这个面”具体长什么样。

4. 大规模数据集支撑 (BrepEDIT-240K)

为了教会模型如何编辑,作者创建了 BrepEDIT-240K 数据集。

  • 他们利用自动化脚本对 CAD 模型进行增删改查。
  • 使用多模态大语言模型(如 Gemini)为这些修改自动生成复杂的文字描述(包括功能性描述,如“为了增加承重性能而加厚”)。

总结

B-repLer 是通过Transformer 决定编辑逻辑,再用流匹配网络打磨几何精度,并在一个不依赖建模历史的潜空间中完成所有操作。这使得它能够处理复杂的自由曲面(B-Spline),而不仅仅是简单的方块和圆柱。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询