Commits · Dovakiins/qwerrwe

fix some of the edge cases for Jamba (#1452)

05b398a
unverified

winglian commited on Mar 29, 2024

Support loading datasets saved via save_to_disk (#1432)

e634118
unverified

Keith Stevens commited on Mar 29, 2024

Jamba (#1451)

02af082
unverified

winglian commited on Mar 29, 2024

fix layer_replication arg to peft (#1446)

4155e99
unverified

winglian commited on Mar 27, 2024

support layer replication for peft and fix rslora integration (#1445)

25afd35
unverified

winglian commited on Mar 27, 2024

fix for accelerate env var for auto bf16, add new base image and expand torch_cuda_arch_list support (#1413)

da265dd
unverified

winglian commited on Mar 26, 2024

Fix falcon tokenization step (#1441) [skip ci]

bcdc9b1
unverified

Far El

winglian commited on Mar 26, 2024

make sure to capture non-null defaults from config validation (#1415)

601b77b
unverified

winglian commited on Mar 26, 2024

fix(dataset): normalize tokenizer config and change hash from tokenizer class to tokenizer path (#1298)

ff939d8
unverified

Nanobit commited on Mar 25, 2024

strip out hacky qlora-fsdp workarounds now that qlora-fsdp fixes are upstreamed (#1428)

2a1589f
unverified

winglian commited on Mar 21, 2024

support galore once upstreamed into transformers (#1409)

dd449c5
unverified

winglian commited on Mar 19, 2024

Feat: Add sharegpt multirole (#1137)

40a88e8
unverified

Nanobit commited on Mar 19, 2024

Add a config not to shuffle merged dataset (#1394) [skip ci]

43bdc5d
unverified

seungduk

winglian commited on Mar 19, 2024

fix(config): passing gradient_checkpoint_kwargs (#1412)

b1e3e1b
unverified

Nanobit commited on Mar 19, 2024

ORPO (#1419)

2ea70eb
unverified

winglian commited on Mar 18, 2024

beta support for multipack with gemmoe: (#1402)

8df7b88
unverified

winglian commited on Mar 14, 2024

Train parameters exclusively in specific ranges (#1390)

05bcc9e
unverified

seungduk commited on Mar 14, 2024

Update ChatTemplate enum to include alpaca and gemma (#1396)

0976781
unverified

chiragjn commited on Mar 13, 2024

chore: lint (#1389)

4326520
unverified

winglian commited on Mar 11, 2024

Add Glaive conversation format support (#1365)

b7d8a7d
unverified

Brian Fitzgerald

winglian commited on Mar 11, 2024

Fix pydantic configuration for the max_memory input (#1385) [skip ci]

0bc114d
unverified

dandm1

winglian commited on Mar 11, 2024

support for rslora (#1387) [skip ci]

7659c00
unverified

winglian commited on Mar 11, 2024

validation for fsdp and deepspeed (#1388) [skip ci]

3fd8093
unverified

winglian commited on Mar 11, 2024

FDSP + QLoRA (#1378)

9b6ee83
unverified

winglian commited on Mar 8, 2024

support for DoRA w/ PEFT (#1363)

0cfdb2c
unverified

winglian commited on Mar 6, 2024

lora+ support (#1352)

decb66e
unverified

winglian commited on Mar 5, 2024

Fix validation for early stopping (#1358)

b5b4492
unverified

chiragjn commited on Mar 4, 2024

fix for protected model_ namespace w pydantic (#1345)

6b3b271
unverified

winglian commited on Feb 28, 2024

Fix `use_mlflow` to be bool instead of str (#1344)

3a5a2d2
unverified

chiragjn commited on Feb 28, 2024

more fixes 20240228 (#1342) [skip ci]

0f985e1
unverified

winglian commited on Feb 28, 2024

add gemma instruct chat template (#1341)

c1a7b3d
unverified

winglian commited on Feb 27, 2024