文章目录

  • 前言
  • 前言
  • 一、文章内容
  • 二、文章总结
  • 三、相关代码)
  • 一、文章内容
  • 二、文章总结
  • 三、相关代码

前言

[原文地址—2017](

文章目录

  • 前言
  • 前言
  • 一、文章内容
  • 二、文章总结
  • 三、相关代码)
  • 一、文章内容
  • 二、文章总结
  • 三、相关代码

前言

原文地址—2021

一、文章内容

  • 文章想法:
    把不同模态的信息的语义信号,转换为公共语义语言空间,这使得语言模型能够直接解释多模态数据。

  • 输入数据

  • 文章模型:

    • 模型从关于视频和音频的编码处理过程就是识别音视频的一些动作语义,比如视频里有人在走,语音中有鸟叫,风声男性女性声音等。
  • 训练方式

  • 模型输出

  • 实验结果

  • 文章结论

二、文章总结

  • 文章novel和优势:

    • 将多模态信息都转为文本信息进行特征学习
    • 可以开放的进行文本生成
  • 同其他文章比较的劣势:

三、相关代码)

一、文章内容

  • 文章想法
  • 输入数据
  • 文章模型
  • 训练方式
  • 模型输出
  • 实验结果
  • 文章结论

二、文章总结

  • 文章novel和优势:
  • 同其他文章比较的劣势:

三、相关代码

VX2TEXT: End-to-End Learning of Video-Based Text GenerationFrom Multimodal Inputs相关推荐

  1. 【论文阅读】Rethinking Spatiotemporal Feature Learning For Video Understanding

    [论文阅读]Rethinking Spatiotemporal Feature Learning For Video Understanding 这是一篇google的论文,它和之前介绍的一篇face ...

  2. 综述:基于深度学习的文本分类 --《Deep Learning Based Text Classification: A Comprehensive Review》总结(一)

    文章目录 综述:基于深度学习的文本分类 <Deep Learning Based Text Classification: A Comprehensive Review>论文总结(一) 总 ...

  3. 阅读笔记《Class Incremental Learning With Few-Shots Based on Linear Programming for Hyperspectral Image 》

    Class Incremental Learning With Few-Shots Based on Linear Programming for Hyperspectral Image Classi ...

  4. [学习笔记·翻译稿] Video Based Face Recognition by Using Discriminatively Learned Convex Models

    机翻+手动调整 仅供学习之用 PDF已上传至蓝奏云:https://wwi.lanzous.com/iAcIyl9vthc Video Based Face Recognition by Using ...

  5. T3D—《Temporal 3D ConvNets: New Architecture and Transfer Learning for Video Classification》概述

    <Temporal 3D ConvNets: New Architecture and Transfer Learning for Video Classification>概述 引言: ...

  6. 论文笔记 Unsupervised Scale-consistent Depth Learning from Video

    我整理了一些单目深度估计的论文,github地址:awesome-Monocular-Depth-Estimation 持续更新中 2021 [IJCV] Unsupervised Scale-con ...

  7. 论文笔记Multi-Scale Temporal Cues Learning for Video Person Re-Identification

    Multi-Scale Temporal Cues Learning for Video Person Re-Identification 用于视频行人重识别的多尺度时间线索学习 1.摘要 摘要中提到 ...

  8. 【论文笔记】Heterogeneous Transfer Learning for HSIC Based on CNN

    X. He, Y. Chen and P. Ghamisi, "Heterogeneous Transfer Learning for Hyperspectral Image Classif ...

  9. 【综述翻译】Deep Learning for Video Game Playing

    深度强化学习实验室 原文来源:https://arxiv.org/pdf/1708.07902.pdf 翻译作者:梁天新博士 编辑:DeepRL 在本文中,我们将回顾最近的Deep Learning在 ...

最新文章

  1. CentripetalNet 48
  2. androidstuido 查看logs_使用 Logcat 写入和查看日志
  3. JAVA——Java操作MySQL数据库的简单工具类[CLASS:DatabaseUtil]
  4. python连接mongo数据库
  5. 笔刷怎么做_原来是这样:用PS笔刷做出颜料肌理效果!
  6. 20210311 plecs 对传递函数进行波特图分析
  7. webQQ协议——获取信息
  8. 03 - 雷达的基本组成
  9. ORACLE数据库日志路径在哪里,查询方式
  10. 职场:因抢一个月饼,惨遭阿里开除,如今他把生活过成这样
  11. 【Lintcode】507. Wiggle Sort II
  12. java毕业设计选题基于JavaWeb实现疫情环境下校园宿舍|寝室管理系统
  13. 云基础设施自研,阿里云腾讯云华为云亮出啥高招?
  14. Aurora8B10B IP使用 -05- 收发测试应用示例
  15. python报错No module named XXX解决方法
  16. GitHub上传自己的文件
  17. 视频教程-虚拟仿真案例讲解-Unity3D
  18. 第三方软件库的创建,使用U盘安装Linux系统,U盘的初始化,system-config-kickstart安装虚拟机
  19. Unity三维真实地形离线地形实时刷新,模拟飞行
  20. 今天我们来一个升级版本玩色子游戏

热门文章

  1. [老齐的求职攻略] 第六章 试用期生存指南
  2. Beini 的6种攻击模式详解
  3. U盘启动 BEINI 的方法
  4. 粤语相声剧本《讲下喈》
  5. 函数载入的html触发onload,JS IFRAME动态加载触发onload事件解析
  6. web前端开发技术html
  7. 用matlab电磁波双缝干涉实验报告,matlab演示杨氏双缝干涉实验
  8. win11桌面如何隐藏“了解此图片”??
  9. 新零售业背景下零售业实体店的经营战略
  10. OPC UA性能评估