Sebastian Sosa's picture

Sebastian Sosa

SebastianS

·

CakeCrusher

AI & ML interests

Everything.

Recent Activity

new activity about 1 month ago

OpenEvals/README:Community Evals Feedback

new activity over 1 year ago

MarinaraSpaghetti/NemoMix-Unleashed-12B:Perfect World Rules, High Context Template (20K) Experiment

new activity almost 2 years ago

mistralai/Mistral-7B-Instruct-v0.3:feat/tools-in-chat-template

View all activity

Organizations

SebastianS 's models 53

SebastianS/llama-7-chat-instruction-int4-fc-op_glaive-sft

Updated Dec 5, 2023

SebastianS/llama-7-chat-instruction-int4-fc-op_glaive-sft_test

Updated Dec 4, 2023

SebastianS/llama-7-chat-instruction-int4-glaive-fc-testing

Updated Dec 3, 2023

SebastianS/llama-7-chat-instruction-int4-glaive-fc-sft

Updated Nov 30, 2023

SebastianS/llama-7-chat-instruction-int4-fc-dpo-_5_beta

Updated Nov 28, 2023

SebastianS/llama-7-chat-instruction-int4-fc-dpo-_9_beta

Updated Nov 28, 2023

SebastianS/llama-7-chat-instruction-int4-fc-dpo-_1_beta

Updated Nov 28, 2023

SebastianS/test-llama-7-chat-instruction-int4-fc-dpo

Updated Nov 25, 2023

SebastianS/llama-7-chat-instruction-int4-fc-dpo

Updated Nov 25, 2023

SebastianS/llama-7-chat-instruction-int4-fc-sft_fix-dpo

Updated Nov 24, 2023

SebastianS/llama-7-chat-instruction-int4-fc-sft_fix

Updated Nov 23, 2023

SebastianS/llama-7-chat-instruction-int4-fc-sft

Updated Nov 23, 2023

SebastianS/llama-7-chat-instruction-int4-fc-pipeline

Updated Nov 22, 2023

SebastianS/function_calling-llama_7b-nat-fc_only

Updated Nov 16, 2023 • 2

SebastianS/function_calling-llama_7b

Updated Nov 14, 2023 • 4

SebastianS/ppo-LunarLander-v2_v2

Reinforcement Learning • Updated Mar 27, 2023 • 7

SebastianS/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated Mar 27, 2023

SebastianS/LunarLander-v2

Reinforcement Learning • Updated Mar 26, 2023

SebastianS/poca-SoccerTwos-v2

Reinforcement Learning • Updated Mar 15, 2023 • 3

SebastianS/poca-SoccerTwos

Updated Mar 15, 2023

SebastianS/poca-SoccerTwos_light

Reinforcement Learning • Updated Mar 15, 2023

SebastianS/a2c-PandaReachDense-v2

Reinforcement Learning • Updated Mar 5, 2023 • 7

SebastianS/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Mar 4, 2023 • 8

SebastianS/ppo-PyramidsRND-1

Reinforcement Learning • Updated Feb 25, 2023 • 3

SebastianS/ppo-SnowballTarget

Reinforcement Learning • Updated Feb 25, 2023 • 5

SebastianS/Reinforce-Pixelcopter-PLE-v0-3

Reinforcement Learning • Updated Feb 20, 2023

SebastianS/Reinforce-Pixelcopter-PLE-v0-2

Reinforcement Learning • Updated Feb 20, 2023

SebastianS/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Feb 19, 2023

SebastianS/Reinforce-CartPole-v1

Reinforcement Learning • Updated Feb 19, 2023

SebastianS/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Feb 12, 2023 • 15