Spaces:

MrUnknown420
/

my-ai-model-builder

Sleeping

App Files Files Community

my-ai-model-builder / app.py

MrUnknown420

Update app.py (#16)

bc36691 verified 4 months ago

raw

history blame contribute delete

12.6 kB

	# app.py (Part 1 of 2)

	import os
	import json
	import time
	import datetime
	import logging
	import gradio as gr
	from transformers import (
	AutoTokenizer, AutoModelForSequenceClassification,
	Trainer, TrainingArguments
	)
	from datasets import load_dataset
	import torch

	# =========================
	# Ensure directories exist
	# =========================
	os.makedirs("trained_models", exist_ok=True)
	os.makedirs("logs", exist_ok=True)
	os.makedirs("memory", exist_ok=True)

	# =========================
	# Logging Setup
	# =========================
	logging.basicConfig(
	filename=os.path.join("logs", "app.log"),
	level=logging.INFO,
	format="%(asctime)s [%(levelname)s] %(message)s"
	)
	log = logging.getLogger(__name__)

	def log_event(event: str):
	"""Append event to logs/events.log and console."""
	log_file = os.path.join("logs", "events.log")
	with open(log_file, "a") as f:
	f.write(f"[{datetime.datetime.now()}] {event}\n")
	print(event)

	# =========================
	# Memory System
	# =========================
	def get_memory_file(model_run: str):
	return os.path.join("memory", f"memory_{model_run}.json")

	def load_memory(model_run: str):
	file = get_memory_file(model_run)
	if os.path.exists(file):
	with open(file, "r") as f:
	return json.load(f)
	return []

	def save_memory(model_run: str, conversation: dict):
	file = get_memory_file(model_run)
	memory = load_memory(model_run)
	memory.append(conversation)
	with open(file, "w") as f:
	json.dump(memory, f, indent=2)

	# =========================
	# Helper: List Trained Models
	# =========================
	def list_trained_models():
	"""Scan trained_models/ and return available model runs."""
	models = []
	for d in os.listdir("trained_models"):
	full_path = os.path.join("trained_models", d)
	if os.path.isdir(full_path):
	models.append(d)
	return models if models else ["❌ No trained models yet"]

	# =========================
	# Training Pipeline
	# =========================
	def train_model(base_model, dataset_name, custom_name, epochs):
	"""Train Hugging Face model with progress + logging."""
	try:
	# -------------------------
	# Prepare run identifiers
	# -------------------------
	run_id = f"{base_model.replace('/', '_')}__{custom_name.strip()}"
	save_dir = os.path.join("trained_models", run_id)
	os.makedirs(save_dir, exist_ok=True)
	progress = {"status": "starting", "loss": [], "accuracy": [], "time": 0}

	log_event(f"🚀 Starting training run: {run_id} on dataset {dataset_name}")

	# -------------------------
	# Load dataset
	# -------------------------
	parts = dataset_name.split(" ")
	if len(parts) == 2:
	dataset_repo, dataset_config = parts
	dataset = load_dataset(dataset_repo, dataset_config, split="train[:200]") # CPU-friendly
	else:
	dataset = load_dataset(dataset_name, split="train[:200]")

	log_event("📂 Dataset loaded successfully")

	# -------------------------
	# Tokenizer + Model
	# -------------------------
	tokenizer = AutoTokenizer.from_pretrained(base_model)
	model = AutoModelForSequenceClassification.from_pretrained(base_model, num_labels=2)

	def tokenize_fn(examples):
	return tokenizer(examples["text"], truncation=True, padding="max_length", max_length=128)

	dataset = dataset.map(tokenize_fn, batched=True)
	dataset.set_format(type="torch", columns=["input_ids", "attention_mask", "label"])

	# -------------------------
	# Training Args
	# -------------------------
	training_args = TrainingArguments(
	output_dir=save_dir,
	overwrite_output_dir=True,
	evaluation_strategy="epoch",
	save_strategy="epoch",
	num_train_epochs=int(epochs),
	per_device_train_batch_size=4,
	logging_dir="./logs",
	logging_steps=10,
	report_to="none",
	no_cuda=True # force CPU
	)

	# -------------------------
	# Metrics
	# -------------------------
	def compute_metrics(eval_pred):
	logits, labels = eval_pred
	preds = logits.argmax(-1)
	acc = (preds == labels).astype(float).mean().item()
	return {"accuracy": acc}

	# -------------------------
	# Custom Progress Callback
	# -------------------------
	start_time = time.time()

	def log_callback(trainer, state, control, **kwargs):
	if state.is_local_process_zero and state.log_history:
	last_log = state.log_history[-1]
	if "loss" in last_log:
	progress["status"] = "running"
	progress["loss"].append(last_log["loss"])
	progress["time"] = round(time.time() - start_time, 2)
	log_event(f"📊 Epoch {state.epoch} - Loss: {last_log['loss']}")

	# -------------------------
	# Trainer
	# -------------------------
	trainer = Trainer(
	model=model,
	args=training_args,
	train_dataset=dataset,
	tokenizer=tokenizer,
	compute_metrics=compute_metrics,
	callbacks=[log_callback]
	)

	trainer.train()

	# Save artifacts
	model.save_pretrained(save_dir)
	tokenizer.save_pretrained(save_dir)

	progress["status"] = "done"
	log_event(f"✅ Training finished: model saved at {save_dir}")

	return f"✅ Training complete: {run_id}", progress

	except Exception as e:
	log_event(f"❌ Training failed: {e}")
	return f"Error during training: {e}", {"status": "error"}

	# app.py (Part 2 of 2)

	# =========================
	# Inference (Testing / Chat)
	# =========================
	def chat_with_model(model_run, user_input):
	"""Run inference on a trained model run."""
	model_dir = os.path.join("trained_models", model_run)
	if not os.path.exists(model_dir):
	return "❌ Model not trained yet. Train it first."

	try:
	tokenizer = AutoTokenizer.from_pretrained(model_dir)
	model = AutoModelForSequenceClassification.from_pretrained(model_dir)

	inputs = tokenizer(user_input, return_tensors="pt", truncation=True, padding=True)
	outputs = model(**inputs)
	prediction = torch.argmax(outputs.logits, dim=-1).item()

	# Save memory
	conversation = {"input": user_input, "prediction": prediction}
	save_memory(model_run, conversation)

	return f"🔮 Prediction: {prediction}"
	except Exception as e:
	log_event(f"❌ Inference failed: {e}")
	return f"Error during inference: {e}"

	# =========================
	# View Memory
	# =========================
	def view_memory(model_run):
	memory = load_memory(model_run)
	if not memory:
	return "📭 No memory yet for this model."
	return json.dumps(memory, indent=2)

	# =========================
	# View Logs
	# =========================
	def view_logs():
	log_file = os.path.join("logs", "events.log")
	if not os.path.exists(log_file):
	return "📭 No logs yet."
	with open(log_file, "r") as f:
	return f.read()

	# =========================
	# User Guide / Manual
	# =========================
	USER_GUIDE = """
	# 📘 AI Model Builder Guide

	Welcome to your all-in-one AI Model Builder.
	This app allows you to train, fine-tune, test, and manage AI models directly in a Hugging Face Space.

	---

	## 🔹 Step 1: Training a Model
	1. Go to the Training Tab.
	2. Select a base model (from dropdown or enter manually).
	3. Select a dataset (from dropdown or enter manually).
	4. Enter a custom run name (to keep multiple versions without overwriting).
	5. Choose the number of epochs.
	6. Click Start Training.
	7. Training progress will appear, and the model will be saved under `trained_models/{run_id}`.

	---

	## 🔹 Step 2: Testing Your Model
	1. Switch to the Testing Tab.
	2. Select a trained model run.
	3. Enter any input text.
	4. The app will return a prediction.
	5. Each chat is saved in per-model memory.

	---

	## 🔹 Step 3: Viewing Memory
	- Go to the Memory Tab.
	- Select a trained model run.
	- View past chats + predictions.

	---

	## 🔹 Step 4: Viewing Logs
	- All activity is logged.
	- Open the Logs Tab to see training sessions, progress, and errors.

	---

	## 🔹 Technical Notes
	- Training runs on CPU (slower but free).
	- Uses Hugging Face Transformers + Datasets.
	- Stores:
	- Models → `trained_models/{run_id}`
	- Logs → `logs/events.log`
	- Memory → `memory/memory_{run_id}.json`
	"""

	# =========================
	# UI Defaults
	# =========================
	TOP_MODELS = [
	"distilbert-base-uncased", "bert-base-uncased", "roberta-base",
	"google/electra-base-discriminator", "albert-base-v2",
	"facebook/bart-base", "gpt2", "t5-small",
	"microsoft/deberta-base", "xlnet-base-cased"
	]

	TOP_DATASETS = [
	"imdb", "ag_news", "yelp_polarity",
	"dbpedia_14", "amazon_polarity",
	"tweet_eval", "glue", "sst2",
	"cnn_dailymail", "emotion"
	]

	# =========================
	# Gradio UI
	# =========================
	with gr.Blocks() as demo:
	gr.Markdown("# 🧠 AI Model Builder\nTrain, Fine-tune, Test, and Manage Your Own AI Models")

	# ---- Training Tab ----
	with gr.Tab("🛠️ Training"):
	with gr.Row():
	model_dropdown = gr.Dropdown(choices=TOP_MODELS, label="Select Base Model", interactive=True)
	model_textbox = gr.Textbox(label="Or enter custom model ID")
	with gr.Row():
	dataset_dropdown = gr.Dropdown(choices=TOP_DATASETS, label="Select Dataset", interactive=True)
	dataset_textbox = gr.Textbox(label="Or enter custom dataset ID")
	run_name = gr.Textbox(label="Custom Run Name (required)")
	epochs = gr.Slider(1, 5, value=1, step=1, label="Epochs (Training Cycles)")
	train_button = gr.Button("🚀 Start Training")
	train_output = gr.Textbox(label="Training Status")
	progress_output = gr.JSON(label="Progress Details")

	def run_training(model_dropdown, model_textbox, dataset_dropdown, dataset_textbox, run_name, epochs):
	base_model = model_textbox if model_textbox else model_dropdown
	dataset_name = dataset_textbox if dataset_textbox else dataset_dropdown
	if not base_model or not dataset_name or not run_name:
	return "❌ Please provide base model, dataset, and run name", {"status": "error"}
	return train_model(base_model, dataset_name, run_name, epochs)

	train_button.click(
	run_training,
	inputs=[model_dropdown, model_textbox, dataset_dropdown, dataset_textbox, run_name, epochs],
	outputs=[train_output, progress_output]
	)

	# ---- Testing Tab ----
	with gr.Tab("💬 Testing"):
	test_model_dropdown = gr.Dropdown(choices=list_trained_models(), label="Select Trained Model Run", interactive=True)
	refresh_button = gr.Button("🔄 Refresh Model List")
	test_input = gr.Textbox(label="Your Message")
	test_button = gr.Button("💡 Predict")
	test_output = gr.Textbox(label="Model Response")

	refresh_button.click(lambda: gr.update(choices=list_trained_models()), None, test_model_dropdown)
	test_button.click(chat_with_model, inputs=[test_model_dropdown, test_input], outputs=test_output)

	# ---- Memory Tab ----
	with gr.Tab("🧾 Memory"):
	mem_model_dropdown = gr.Dropdown(choices=list_trained_models(), label="Select Trained Model Run", interactive=True)
	mem_refresh = gr.Button("🔄 Refresh Model List")
	mem_button = gr.Button("📂 Load Memory")
	mem_output = gr.Textbox(label="Conversation Memory", lines=15)

	mem_refresh.click(lambda: gr.update(choices=list_trained_models()), None, mem_model_dropdown)
	mem_button.click(view_memory, inputs=mem_model_dropdown, outputs=mem_output)

	# ---- Logs Tab ----
	with gr.Tab("📜 Logs"):
	log_button = gr.Button("📖 Show Logs")
	log_output = gr.Textbox(label="Logs", lines=20)
	log_button.click(view_logs, outputs=log_output)

	# ---- Guide Tab ----
	with gr.Tab("📘 Guide"):
	gr.Markdown(USER_GUIDE)

	# =========================
	# Launch App
	# =========================
	if __name__ == "__main__":
	demo.launch()