Generation - a Julius-L Collection

Julius-L 's Collections

Memory Efficient Training

Model Architecture

LLM Technical Reports

Generation

updated 17 days ago

Fast Best-of-N Decoding via Speculative Rejection

Paper • 2410.20290 • Published 22 days ago • 9