Video Generation - a zyf515730395 Collection

zyf515730395 's Collections

M-RAG

Video Understanding

MLLM

LLM

Image Generation

Video Generation

Video Generation

updated about 8 hours ago

Seedance 1.0: Exploring the Boundaries of Video Generation Models

Paper • 2506.09113 • Published 29 days ago • 95
Self Forcing: Bridging the Train-Test Gap in Autoregressive Video Diffusion

Paper • 2506.08009 • Published about 1 month ago • 24
Seeing Voices: Generating A-Roll Video from Audio with Mirage

Paper • 2506.08279 • Published 30 days ago • 26
PolyVivid: Vivid Multi-Subject Video Generation with Cross-Modal Interaction and Enhancement

Paper • 2506.07848 • Published about 1 month ago • 4
SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training

Paper • 2506.05301 • Published Jun 5 • 55
SkyReels-Audio: Omni Audio-Conditioned Talking Portraits in Video Diffusion Transformers

Paper • 2506.00830 • Published Jun 1 • 7
Video World Models with Long-term Spatial Memory

Paper • 2506.05284 • Published Jun 5 • 53
Voyager: Long-Range and World-Consistent Video Diffusion for Explorable 3D Scene Generation

Paper • 2506.04225 • Published Jun 4 • 25
IllumiCraft: Unified Geometry and Illumination Diffusion for Controllable Video Generation

Paper • 2506.03150 • Published Jun 3 • 21
Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model

Paper • 2504.08685 • Published Apr 11 • 129
Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation

Paper • 2503.24379 • Published Mar 31 • 77
Seedream 3.0 Technical Report

Paper • 2504.11346 • Published Apr 15 • 64
JavisDiT: Joint Audio-Video Diffusion Transformer with Hierarchical Spatio-Temporal Prior Synchronization

Paper • 2503.23377 • Published Mar 30 • 57
Audio-visual Controlled Video Diffusion with Masked Selective State Spaces Modeling for Natural Talking Head Generation

Paper • 2504.02542 • Published Apr 3 • 47
SkyReels-A2: Compose Anything in Video Diffusion Transformers

Paper • 2504.02436 • Published Apr 3 • 37
Long-Context Autoregressive Video Modeling with Next-Frame Prediction

Paper • 2503.19325 • Published Mar 25 • 73
Wan: Open and Advanced Large-Scale Video Generative Models

Paper • 2503.20314 • Published Mar 26 • 52
Reangle-A-Video: 4D Video Generation as Video-to-Video Translation

Paper • 2503.09151 • Published Mar 12 • 32
ViDAR: Video Diffusion-Aware 4D Reconstruction From Monocular Inputs

Paper • 2506.18792 • Published 16 days ago • 29
VMoBA: Mixture-of-Block Attention for Video Diffusion Models

Paper • 2506.23858 • Published 9 days ago • 31
Tora2: Motion and Appearance Customized Diffusion Transformer for Multi-Entity Video Generation

Paper • 2507.05963 • Published 1 day ago • 8
StreamDiT: Real-Time Streaming Text-to-Video Generation

Paper • 2507.03745 • Published 5 days ago • 22