HanSaem Kim

kensaem

AI & ML interests

None yet

Recent Activity

upvoted a paper about 20 hours ago

LTX-2: Efficient Joint Audio-Visual Foundation Model

upvoted an article 2 days ago

Training strategies of Z-Image-Turbo

upvoted a paper 2 days ago

Deep Delta Learning

View all activity

Organizations

None yet

upvoted a paper about 20 hours ago

LTX-2: Efficient Joint Audio-Visual Foundation Model

Paper • 2601.03233 • Published 1 day ago • 48

upvoted an article 2 days ago

Article

Training strategies of Z-Image-Turbo

23 days ago

•

upvoted 2 papers 2 days ago

Deep Delta Learning

Paper • 2601.00417 • Published 6 days ago • 26

Avatar Forcing: Real-Time Interactive Head Avatar Generation for Natural Conversation

Paper • 2601.00664 • Published 6 days ago • 45

upvoted 8 papers 6 days ago

YOLO-Master: MOE-Accelerated with Specialized Transformers for Enhanced Real-time Detection

Paper • 2512.23273 • Published 10 days ago • 13

SpotEdit: Selective Region Editing in Diffusion Transformers

Paper • 2512.22323 • Published 13 days ago • 37

Diffusion Knows Transparency: Repurposing Video Diffusion for Transparent Object Depth and Normal Estimation

Paper • 2512.23705 • Published 9 days ago • 44

LiveTalk: Real-Time Multimodal Interactive Video Diffusion via Improved On-Policy Distillation

Paper • 2512.23576 • Published 9 days ago • 64

DreamOmni3: Scribble-based Editing and Generation

Paper • 2512.22525 • Published 12 days ago • 14

upvoted 6 papers 10 days ago

Spatia: Video Generation with Updatable Spatial Memory

Paper • 2512.15716 • Published 21 days ago • 29

HiStream: Efficient High-Resolution Video Generation via Redundancy-Eliminated Streaming

Paper • 2512.21338 • Published 14 days ago • 21

DreaMontage: Arbitrary Frame-Guided One-Shot Video Generation

Paper • 2512.21252 • Published 14 days ago • 34

TurboDiffusion: Accelerating Video Diffusion Models by 100-200 Times

Paper • 2512.16093 • Published 21 days ago • 92

SemanticGen: Video Generation in Semantic Space

Paper • 2512.20619 • Published 15 days ago • 89

SAM Audio: Segment Anything in Audio

Paper • 2512.18099 • Published 19 days ago • 21

upvoted 2 papers 15 days ago

StoryMem: Multi-shot Long Video Storytelling with Memory

Paper • 2512.19539 • Published 16 days ago • 17

WorldWarp: Propagating 3D Geometry with Asynchronous Video Diffusion

Paper • 2512.19678 • Published 16 days ago • 29

HanSaem Kim

AI & ML interests

Recent Activity

Organizations

kensaem's activity

Training strategies of Z-Image-Turbo