2 69 3

allthingsdisaggregated

lastweek

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

DeepFlow: Serverless Large Language Model Serving at Scale

commented on a paper about 1 month ago

DeepFlow: Serverless Large Language Model Serving at Scale

upvoted a paper 3 months ago

Byte Latent Transformer: Patches Scale Better Than Tokens

View all activity

Organizations

None yet

lastweek's activity

upvoted a paper about 1 month ago

DeepFlow: Serverless Large Language Model Serving at Scale

Paper • 2501.14417 • Published Jan 24 • 3

commented a paper about 1 month ago

DeepFlow: Serverless Large Language Model Serving at Scale

Paper • 2501.14417 • Published Jan 24 • 3 •

upvoted a paper 3 months ago

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 93

upvoted a paper 4 months ago

GPT-4o System Card

Paper • 2410.21276 • Published Oct 25, 2024 • 84

upvoted a paper 5 months ago

Baichuan-Omni Technical Report

Paper • 2410.08565 • Published Oct 11, 2024 • 85

upvoted 4 papers 6 months ago

Training Language Models to Self-Correct via Reinforcement Learning

Paper • 2409.12917 • Published Sep 19, 2024 • 137

Improvements to SDXL in NovelAI Diffusion V3

Paper • 2409.15997 • Published Sep 24, 2024 • 13

InstInfer: In-Storage Attention Offloading for Cost-Effective Long-Context LLM Inference

Paper • 2409.04992 • Published Sep 8, 2024 • 2

Agent Workflow Memory

Paper • 2409.07429 • Published Sep 11, 2024 • 29

updated a collection 6 months ago

sd

Collection

1 item • Updated Sep 5, 2024

upvoted a paper 6 months ago

Eagle: Exploring The Design Space for Multimodal LLMs with Mixture of Encoders

Paper • 2408.15998 • Published Aug 28, 2024 • 86

upvoted a paper 7 months ago

Show-o: One Single Transformer to Unify Multimodal Understanding and Generation

Paper • 2408.12528 • Published Aug 22, 2024 • 51

upvoted 6 papers 8 months ago

MInference 1.0: Accelerating Pre-filling for Long-Context LLMs via Dynamic Sparse Attention

Paper • 2407.02490 • Published Jul 2, 2024 • 25

updated a collection 8 months ago

inference

Collection

6 items • Updated Jul 1, 2024