IC26 Branded Triangle

InfoComm China

正在加载

NVIDIA专场论坛 | 主题演讲:视频多模态理解和生成技术

2026年4月15日
智创科技舞台 - C馆
NVIDIA专场论坛
多模态视频理解与生成技术旨在融合文本、视觉、音频等多源信息,实现对视频内容的理解、并进一步实现创作,并生成多模态衍生物。该技术依托深度学习与跨模态表征学习,可完成视频内容理解,并可进行AI 生成内容等高质量视频生成。相关研究广泛应用于视频理解及视频内容生成(高光,二创衍生),以及3D媒体等场景,为下一代媒体与智能视频创作提供核心技术支撑。
演讲嘉宾
焦绍辉,3D视频负责人 - 火山引擎
查看北京 InfoComm China 2026完整日程