Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

michael's picture

13 109

michael

netzkontrast

aifeifei799's profile picture

21world's profile picture

LeroyDyer's profile picture

·

AI & ML interests

None yet

Organizations

None yet

netzkontrast 's collections 7

XMusic: Towards a Generalized and Controllable Symbolic Music Generation Framework

Paper • 2501.08809 • Published Jan 15 • 10

Samba-asr state-of-the-art speech recognition leveraging structured state-space models

Paper • 2501.02832 • Published Jan 6 • 9
HiFi-SR: A Unified Generative Transformer-Convolutional Adversarial Network for High-Fidelity Speech Super-Resolution

Paper • 2501.10045 • Published Jan 17 • 9

LoRA Land: 310 Fine-tuned LLMs that Rival GPT-4, A Technical Report

Paper • 2405.00732 • Published Apr 29, 2024 • 122

Customizing Text-to-Image Models with a Single Image Pair

Paper • 2405.01536 • Published May 2, 2024 • 23
Concept Weaver: Enabling Multi-Concept Fusion in Text-to-Image Models

Paper • 2404.03913 • Published Apr 5, 2024
LCM-Lookahead for Encoder-based Text-to-Image Personalization

Paper • 2404.03620 • Published Apr 4, 2024 • 1
Customizing Text-to-Image Diffusion with Camera Viewpoint Control

Paper • 2404.12333 • Published Apr 18, 2024 • 1

Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback

Paper • 2501.03916 • Published Jan 7 • 16
Towards System 2 Reasoning in LLMs: Learning How to Think With Meta Chain-of-Though

Paper • 2501.04682 • Published Jan 8 • 99
Agent Laboratory: Using LLM Agents as Research Assistants

Paper • 2501.04227 • Published Jan 8 • 92
Search-o1: Agentic Search-Enhanced Large Reasoning Models

Paper • 2501.05366 • Published Jan 9 • 100

ShortGPT: Layers in Large Language Models are More Redundant Than You Expect

Paper • 2403.03853 • Published Mar 6, 2024 • 66
SLEB: Streamlining LLMs through Redundancy Verification and Elimination of Transformer Blocks

Paper • 2402.09025 • Published Feb 14, 2024 • 9
Shortened LLaMA: A Simple Depth Pruning for Large Language Models

Paper • 2402.02834 • Published Feb 5, 2024 • 17
Algorithmic progress in language models

Paper • 2403.05812 • Published Mar 9, 2024 • 21

StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation

Paper • 2405.01434 • Published May 2, 2024 • 57
TransPixar: Advancing Text-to-Video Generation with Transparency

Paper • 2501.03006 • Published Jan 6 • 27
CPA: Camera-pose-awareness Diffusion Transformer for Video Generation

Paper • 2412.01429 • Published Dec 2, 2024
Ingredients: Blending Custom Photos with Video Diffusion Transformers

Paper • 2501.01790 • Published Jan 3 • 8

XMusic: Towards a Generalized and Controllable Symbolic Music Generation Framework

Paper • 2501.08809 • Published Jan 15 • 10

Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback

Paper • 2501.03916 • Published Jan 7 • 16
Towards System 2 Reasoning in LLMs: Learning How to Think With Meta Chain-of-Though

Paper • 2501.04682 • Published Jan 8 • 99
Agent Laboratory: Using LLM Agents as Research Assistants

Paper • 2501.04227 • Published Jan 8 • 92
Search-o1: Agentic Search-Enhanced Large Reasoning Models

Paper • 2501.05366 • Published Jan 9 • 100

Samba-asr state-of-the-art speech recognition leveraging structured state-space models

Paper • 2501.02832 • Published Jan 6 • 9
HiFi-SR: A Unified Generative Transformer-Convolutional Adversarial Network for High-Fidelity Speech Super-Resolution

Paper • 2501.10045 • Published Jan 17 • 9

ShortGPT: Layers in Large Language Models are More Redundant Than You Expect

Paper • 2403.03853 • Published Mar 6, 2024 • 66
SLEB: Streamlining LLMs through Redundancy Verification and Elimination of Transformer Blocks

Paper • 2402.09025 • Published Feb 14, 2024 • 9
Shortened LLaMA: A Simple Depth Pruning for Large Language Models

Paper • 2402.02834 • Published Feb 5, 2024 • 17
Algorithmic progress in language models

Paper • 2403.05812 • Published Mar 9, 2024 • 21

LoRA Land: 310 Fine-tuned LLMs that Rival GPT-4, A Technical Report

Paper • 2405.00732 • Published Apr 29, 2024 • 122

StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation

Paper • 2405.01434 • Published May 2, 2024 • 57
TransPixar: Advancing Text-to-Video Generation with Transparency

Paper • 2501.03006 • Published Jan 6 • 27
CPA: Camera-pose-awareness Diffusion Transformer for Video Generation

Paper • 2412.01429 • Published Dec 2, 2024
Ingredients: Blending Custom Photos with Video Diffusion Transformers

Paper • 2501.01790 • Published Jan 3 • 8

Customizing Text-to-Image Models with a Single Image Pair

Paper • 2405.01536 • Published May 2, 2024 • 23
Concept Weaver: Enabling Multi-Concept Fusion in Text-to-Image Models

Paper • 2404.03913 • Published Apr 5, 2024
LCM-Lookahead for Encoder-based Text-to-Image Personalization

Paper • 2404.03620 • Published Apr 4, 2024 • 1
Customizing Text-to-Image Diffusion with Camera Viewpoint Control

Paper • 2404.12333 • Published Apr 18, 2024 • 1

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs