CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理

Subjects: cs.CV

1.Locally Attentional SDF Diffusion for Controllable 3D Shape Generation

标题:用于可控 3D 形状生成的局部注意 SDF 扩散

作者:Xin-Yang Zheng, Hao Pan, Peng-Shuai Wang, Xin Tong, Yang Liu, Heung-Yeung Shum

文章链接:https://arxiv.org/abs/2305.04461

项目代码:https://zhengxinyang.github.io/projects/LAS-Diffusion.html

摘要:

虽然最近 3D 生成神经网络的快速发展大大提高了 3D 形状的生成,但普通用户仍然不方便创建 3D 形状和控制生成形状的局部几何形状。为了应对这些挑战,我们提出了一个基于扩散的 3D 生成框架——局部注意力 SDF 扩散,通过 2D 草图图像输入来模拟合理的 3D 形状。我们的方法建立在两阶段扩散模型之上。第一阶段称为占用扩散,旨在生成一个低分辨率的占用场来近似形状壳。第二阶段,称为 SDF 扩散,在第一阶段确定的占用体素内合成高分辨率符号距离场,以提取精细几何形状。我们的模型由一种用于图像条件形状生成的新型视图感知局部注意机制提供支持,该机制利用 2D 图像块特征来指导 3D 体素特征学习,极大地提高了局部可控性和模型的通用性。通过在草图条件和类别条件 3D 形状生成任务中进行大量实验,我们验证并展示了我们的方法提供合理且多样化的 3D 形状的能力,以及其优于现有工作的可控性和普遍性。我们的代码和经过训练的模型可在此 https URL 上获得

2.EfficientViT: Memory Efficient Vision Transformer with Cascaded Group Attention

标题:EfficientViT:具有级联组注意力的高效内存视觉转换器

作者:Xinyu Liu, Houwen Peng, Ningxin Zheng, Yuqing Yang, Han Hu, Yixuan Yuan

文章链接:https://arxiv.org/abs/2305.07027

项目代码:https://github.com/microsoft/Cream/tree/main/EfficientViT

摘要:

视觉转换器因其高模型能力而取得了巨大的成功。然而,它们卓越的性能伴随着沉重的计算成本,这使得它们不适合实时应用。在本文中,我们提出了一个名为 EfficientViT 的高速视觉转换器系列。我们发现现有 Transformer 模型的速度通常受内存低效操作的限制,尤其是 MHSA 中的张量重塑和逐元素函数。因此,我们设计了一种具有三明治布局的新构建块,即在高效 FFN 层之间使用单个内存绑定 MHSA,从而提高内存效率,同时增强通道通信。此外,我们发现注意力图在头部之间具有高度相似性,从而导致计算冗余。为了解决这个问题,我们提出了一个级联的组注意力模块,为注意力头提供不同的完整特征分割,这不仅节省了计算成本,而且提高了注意力的多样性。综合实验表明 EfficientViT 优于现有的高效模型,在速度和准确性之间取得了良好的平衡。例如,我们的 EfficientViT-M5 在精度上比 MobileNetV3-Large 高出 1.9%,同时在 Nvidia V100 GPU 和英特尔至强 CPU 上的吞吐量分别高出 40.4% 和 45.2%。与最近的高效模型 MobileViT-XXS 相比,EfficientViT-M2 的精度提高了 1.8%,同时在 GPU/CPU 上的运行速度提高了 5.8 倍/3.7 倍,转换为 ONNX 格式时速度提高了 7.4 倍。此 https URL 上提供了代码和模型。

3.The emergence of clusters in self-attention dynamics

标题:自注意力动力学中集群的出现

作者:Borjan Geshkovski, Cyril Letrouit, Yury Polyanskiy, Philippe Rigollet

文章链接:https://arxiv.org/abs/2304.05977

摘要:

将变形金刚视为相互作用的粒子系统,当权重不依赖于时间时,我们描述了学习表示的几何形状。我们表明,随着时间趋于无穷大,代表标记的粒子倾向于聚集到特定的限制对象。出现的限制对象的类型取决于值矩阵的范围。此外,在一维情况下,我们证明自注意力矩阵收敛到低秩布尔矩阵。这些结果的组合在数学上证实了 Vaswani 等人所做的经验观察。在 Transformers 处理时出现在一系列标记中。

更多Ai资讯:公主号AiCharm

每日学术速递5.16相关推荐

  1. 每日学术速递2.16

    CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 Subjects: cs.CV 1.Efficient Teacher: Semi-Supervis ...

  2. 每日学术速递4.16

    CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 Subjects: cs.CV 1.SpectFormer: Frequency and Atten ...

  3. 每日学术速递3.27

    CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 Subjects: cs.CV 1.Text2Room: Extracting Textured 3 ...

  4. 每日学术速递5.27

    CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 Subjects: cs.CV 1.Control-A-Video: Controllable Te ...

  5. 每日学术速递1.26

    CV - 计算机视觉 今天带来的是北航IRIP实验室被国际人工智能联合会议IJCAI-ECAI 2022接收的3篇论文. IJCAI 是人工智能领域中最主要的学术会议之一,原为单数年召开,自2015年 ...

  6. 每日学术速递1.27

    CV - 计算机视觉  |  ML - 机器学习 |  RL - 强化学习 前沿推介: ICLR 2023 ICLR 全称为国际学习表征会议(International Conference on L ...

  7. 每日学术速递5.12

    CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 Subjects: cs.CV 1.ImageBind: Holistic AI learning ...

  8. 每日学术速递1.29

    CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 更多Ai资讯: Subjects:cs.CV 1. Compact Transformer Trac ...

  9. 每日学术速递5.30

    CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 Subjects: cs.CV 1.Accelerated Coordinate Encoding: ...

最新文章

  1. Docx4j 添加页码
  2. TC260-001《汽车采集数据处理安全指南》
  3. 解决打包软链接打包失败问题
  4. 关于outlook 2003 PST文件大小一点说明
  5. java 调用office_JAVA调用PageOffice在线打开、编辑Word文档
  6. 十年最强出行变革竟然不是高铁?我们问了2千多人,得到高清有码的答案
  7. org.hibernate.TypeMismatchException: Provided id of the wrong type for class *** Expected ***
  8. cuda10安装_Win10安装GPU版本的Tensorflow 2.1
  9. 查询条件中含有加号_excel中最全的多条件查询方法都在这里了
  10. VTK:绘图之StackedPlot
  11. Python3网络爬虫——(4)urllib.error异常处理
  12. Intellij IDEA调试
  13. android BluetoothAdapter蓝牙BLE扫描总结
  14. Spring Boot Servlet
  15. C#开发笔记之01-为什么开源框架会大量的使用protected virtual?
  16. 推荐系统实例-基于矩阵分解
  17. 国产数据库助力民航核心交易系统
  18. Atitit 防注入 sql参数编码法 目录 1.2. 提升可读性pg_escape_literal — 转义文字以插入文本字段 1 1.2.1. 说明 1 1.3. 推荐pg_escape_str
  19. java poi 实现word文档分栏遇到的坑
  20. network 网站流量

热门文章

  1. 台式计算机清洁除尘内容,台式机怎么清理灰尘
  2. kmalloc/kfree,vmalloc/vfree
  3. 最新版本git下载安装配置教程
  4. ddns域名有什么用,怎么用
  5. 计算机开机民鸣叫不能启动,计算机开机并发出警报,详细教会您如果计算机长时间鸣叫怎么办...
  6. 最新微博滑动验证码的破解
  7. .NET6系列:微软宣布Visual Studio 2022【转载】
  8. python制作统计图(1)
  9. Linux内核机制总结内存管理之页回收(二十三)
  10. vscode指定文件的编辑语言以及编码方式