RL/Alignment - a stereoplegic Collection

stereoplegic 's Collections

Context compression

Dataset generation

Knowledge distillation

Dataset pruning/cleaning/dedup

Continual learning

Optimal transport

Weight averaging

Knowledge graph

Question answering

Multiple choice Q&A

Relationship extraction

Text classification

Semantic segmentation

Backpropagation

Positional embeddings

Federated learning

Hyperparameters

Structured data

Constrained decoding

Batched decoding

Sentiment analysis

Named Entity Recognition (NER)

Document parsing

LLM architecture

Text editing/revision

Evolutionary Algorithms

Dataset curation

Data processing

Interpretability

Data augmentation

Reparameterization

Literature review

Similarity search

RL/Alignment

updated Jan 15