时间:2024-11-03 09:02:01
录:右图为微软公司模型分解的 3D沙发,椅子和浴缸图像早已有不少机构在将 2D 图像切换为 3D 形式的方面展开了尝试,还包括 Facebook、Nvidia 等公司的 AI 研究实验室,或是类似于 Threedy.AI 这样的初创公司。近日,来自微软公司的研究团队也公开发表了一篇预印论文,展出了其在非结构化 2D 图像的基础上分解 3D 形状图像的能力。一般来说来说,训练这样的框架必须通过栅格化处理来展开微分步骤图形,因此,过去研究人员在该领域的希望都专心于研发自定义图形模型。然而,通过此类模型处置的图像不会变得过于现实大自然,也不合适用作分解游戏以及图形产业的工业效果图。
微软公司的研究人员这一次做到了新的突破——他们在论文中详尽讲解了一个框架,该框架使用的“可图形”训练技术是第一次被用作这一领域。研究人员提及,在用于 2D 图像展开训练时,该框架一直可以比现有的模型分解效果更佳的 3D 形状,这对于视频游戏开发人员、电子商务公司,以及缺少创立 3D 模型经验的动画公司来说,算是是“福音”。具体来说,研究人员企图利用功能齐全的工业RenderMan,该RenderMan可以根据表明数据来分解图像。
为此,研究人员训练了 3D 形状的分解模型,以便图形形状并分解与 2D 数据集产于相匹配的图像。生成器模型使用随机输出向量(代表数据集特征的值)并分解 3D 对象的倒数体素回应(3D 空间中网格上的值),然后将体素输出到不能微分的图形过程中,并在用于现有RenderMan展开图形之前将其阈值减少为线性值。也就是说,这是一种精致的代理神经RenderMan必要图形由 3D 形状分解模型分解的倒数体素网格的方式。
正如研究人员所说明的那样,在等价 3D 网格输出的情况下,必须对其展开训练以给定现成RenderMan的图形输入。生成式对付网络(GANS)在产生 2D 图像数据方面的成果令人印象深刻印象,许多视觉应用于,比如游戏,都必须 3D 模型作为输出,而某种程度是图像。但是,必要将现有的 GAN 模型扩展到 3D,必须提供 3D 训练数据。(公众号:)录:右图为微软公司模型分解的 3D 蘑菇图像在实验过程中,研究团队为上述生成器使用了 3D 卷积 GAN 架构(GAN 是一个由两部分构成的 AI 模型,其中还包括生成器,这些生成器用于分布式取样从随机噪声中分解制备示例,并将这些示例与训练数据集中于的现实示例一起馈入鉴别器中,以尝试区分两者)。
基于 3D 模型分解的数据集和现实的数据集可以制备来自有所不同对象类别的图像,并在整个训练过程中从有所不同角度展开图形。研究人员还回应,他们的框架还不会从图像中萃取灯光和阴影信息,使其需要从每个训练样本中萃取更好有意义的数据,并在此基础上产生更佳的结果。在对大自然图像的数据集展开训练之后,该框架可以分解细致的样本。
此外,该框架还可以利用表面之间的曝光差异来顺利检测出有凹形物体的内部结构,从而使精确地捕捉凹形程度和中空空间。将颜色,材料和灯光等信息拆分到系统中,未来,这些信息就可以与更好“常规”实际数据集一起用于。
录:本文编译器自 VentureBeat原创文章,予以许可禁令刊登。下文闻刊登须知。
本文来源:OD体育-www.jrdlx.com