Spaces:

Gatsby767
/

AbrahamicSolver

Running

App Files Files Community

AbrahamicSolver / generate.py

Gatsby767

Rename math.py to app_math.py and update imports to avoid stdlib conflict

84bfc85 about 20 hours ago

raw

history blame contribute delete

2.48 kB

	import vllm
	import argparse
	import evaluation.datasets_loader as datasets_loader
	from transformers import AutoTokenizer
	import json
	import os

	STORAGE_PATH = os.getenv("STORAGE_PATH")

	def main(args):
	print("STORAGE_PATH")
	print(STORAGE_PATH)
	with open('tokens.json','r') as f:
	tokens = json.load(f)
	print(args.model, args.dataset)
	tokenizer = AutoTokenizer.from_pretrained(args.model)
	model = vllm.LLM(
	model=args.model,
	tokenizer=args.model,
	gpu_memory_utilization=0.85
	)
	sample_params = vllm.SamplingParams(
	max_tokens=4096,
	temperature=0.0,
	stop_token_ids=[tokenizer.eos_token_id],
	)
	handler = datasets_loader.get_dataset_handler(args.dataset,args.name)
	questions, answers = handler.load_data()
	chats=[[{"role": "system", "content": "Please reason step by step, and put your final answer within \\boxed{}."},{"role": "user", "content": question}] for question in questions]
	if tokenizer.chat_template:
	prompts = [tokenizer.apply_chat_template(chat, tokenize=False,add_generation_prompt=True, add_special_tokens=True, enable_thinking=False) for chat in chats]
	else:
	prompts = ["system: " + chat[0]["content"] + '\n' + "user: " + chat[1]["content"] + '\nPlease reason step by step, and put your final answer within \\boxed{}.' for chat in chats]
	responses = model.generate(prompts, sampling_params=sample_params,use_tqdm=True)
	responses = [response.outputs[0].text for response in responses]
	scores,average_score = handler.get_score(responses, answers)
	results = [{"question": question, "answer": answer, "response": response, "score": score} for question, answer, response, score in zip(questions, answers, responses, scores)]
	print(f"Average score: {average_score}")
	results.append({"average_score": average_score})
	os.makedirs(f"{STORAGE_PATH}/evaluation/{args.model.replace('/', '_')}", exist_ok=True)
	with open(f"{STORAGE_PATH}/evaluation/{args.model.replace('/', '_')}/results_{args.dataset}.json", "w") as f:
	json.dump(results, f, indent=4)


	if __name__ == "__main__":
	parser = argparse.ArgumentParser()
	parser.add_argument("--model", type=str, default="Qwen/Qwen3-4B")
	parser.add_argument("--dataset", type=str, default="math")
	parser.add_argument("--name", type=str, default=None)
	args = parser.parse_args()
	main(args)