Air-Striker-Mixtral-8x7B-ZLoss

Experimental model, trained using config and Transformers/Axolotl forks provided by Doctor-Shotgun

Model was fine-tuned from Mixtral-8x7B-v0.1 with airoboros-3.2 dataset, for 4 epochs, ChatML prompt format at 8K context length.

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

LoneStriker
/

Air-Striker-Mixtral-8x7B-ZLoss-2.4bpw-h6-exl2