1 13 9

Zhenxing Mi

Mifucius

AI & ML interests

None yet

Recent Activity

liked a dataset 5 days ago

svjack/video-dataset-genshin-impact-landscape-organized

liked a dataset 9 days ago

nvidia/Llama-Nemotron-Post-Training-Dataset-v1

upvoted a paper 9 days ago

Qwen2.5-1M Technical Report

View all activity

Organizations

None yet

Mifucius's activity

liked a dataset 5 days ago

svjack/video-dataset-genshin-impact-landscape-organized

Viewer • Updated 15 days ago • 60 • 162 • 2

liked a dataset 9 days ago

nvidia/Llama-Nemotron-Post-Training-Dataset-v1

Viewer • Updated 10 days ago • 15.2M • 7.64k • 260

upvoted a paper 9 days ago

Qwen2.5-1M Technical Report

Paper • 2501.15383 • Published Jan 26 • 68

upvoted a paper 10 days ago

Personalize Anything for Free with Diffusion Transformer

Paper • 2503.12590 • Published 12 days ago • 41

liked a Space 10 days ago

337

Gemini Co-Drawing

✏

Gemini 2.0 native image generation co-doodling

upvoted a paper 10 days ago

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

Paper • 2503.14487 • Published 10 days ago • 27

upvoted a paper 11 days ago

BlobCtrl: A Unified and Flexible Framework for Element-level Image Generation and Editing

Paper • 2503.13434 • Published 11 days ago • 24

upvoted 4 papers about 1 month ago

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published Feb 20 • 138

Dynamic Concepts Personalization from Single Videos

Paper • 2502.14844 • Published Feb 20 • 16

RAD: Training an End-to-End Driving Policy via Large-Scale 3DGS-based Reinforcement Learning

Paper • 2502.13144 • Published Feb 18 • 37

Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published Feb 19 • 175

commented a paper about 1 month ago

I Think, Therefore I Diffuse: Enabling Multimodal In-Context Reasoning in Diffusion Models

Paper • 2502.10458 • Published Feb 12 • 34 •

authored a paper about 1 month ago

LeC$^2$O-NeRF: Learning Continuous and Compact Large-Scale Occupancy for Urban Scenes

Paper • 2411.11374 • Published Nov 18, 2024

commented a paper about 1 month ago

I Think, Therefore I Diffuse: Enabling Multimodal In-Context Reasoning in Diffusion Models

Paper • 2502.10458 • Published Feb 12 • 34 •

authored a paper about 1 month ago

I Think, Therefore I Diffuse: Enabling Multimodal In-Context Reasoning in Diffusion Models

Paper • 2502.10458 • Published Feb 12 • 34

upvoted a paper about 1 month ago

I Think, Therefore I Diffuse: Enabling Multimodal In-Context Reasoning in Diffusion Models

Paper • 2502.10458 • Published Feb 12 • 34

upvoted a paper 3 months ago

BrushEdit: All-In-One Image Inpainting and Editing

Paper • 2412.10316 • Published Dec 13, 2024 • 34

liked 2 models 5 months ago

genmo/mochi-1-preview

Text-to-Video • Updated Dec 18, 2024 • 21.7k • • 1.2k

meta-llama/Llama-3.2-11B-Vision-Instruct

Image-Text-to-Text • Updated Dec 4, 2024 • 1.59M • • 1.39k

upvoted a paper 6 months ago

MM-Ego: Towards Building Egocentric Multimodal LLMs

Paper • 2410.07177 • Published Oct 9, 2024 • 22