Sparse Query Attention (SQA) Research by Reactive AI - a AdamF92 Collection

AdamF92 's Collections

Reactive Transformer PoC Supervised Models by Reactive AI

Sparse Query Attention (SQA) Research by Reactive AI

Interaction SFT Datasets for Reactive Transformer by RxAI

Sparse Query Attention (SQA) Research by Reactive AI

updated 11 days ago

Experimental models with Sparse Query Attention layers. Reducing training time/cost by ~3-10% compared to GQA & MQA, with the same level performance