G1 Portfolio of models, datasets and demos presented in the paper G1: Teaching LLMs to Reason on Graphs with Reinforcement Learning PKU-ML/G1-7B Text Generation โข 8B โข Updated Jun 17 โข 26 โข 2 PKU-ML/G1-3B Text Generation โข 3B โข Updated Jun 17 โข 399 โข 1 PKU-ML/G1-Direct-SFT-3B Text Generation โข 3B โข Updated Jun 17 PKU-ML/G1-Direct-SFT-7B Text Generation โข 8B โข Updated Jun 17
G1 Portfolio of models, datasets and demos presented in the paper G1: Teaching LLMs to Reason on Graphs with Reinforcement Learning PKU-ML/G1-7B Text Generation โข 8B โข Updated Jun 17 โข 26 โข 2 PKU-ML/G1-3B Text Generation โข 3B โข Updated Jun 17 โข 399 โข 1 PKU-ML/G1-Direct-SFT-3B Text Generation โข 3B โข Updated Jun 17 PKU-ML/G1-Direct-SFT-7B Text Generation โข 8B โข Updated Jun 17