DigitalOwl
/

11.9.2025_segmentation_vision_no_0-run-hdhz4-Qwen2.5-VL-7B-Instruct

Image-Text-to-Text

8-bit precision

Model card Files Files and versions

11.9.2025_segmentation_vision_no_0-run-hdhz4-Qwen2.5-VL-7B-Instruct / README.md

Matanya's picture

Add fine-tuned Qwen2.5-VL model

65065c7 verified about 1 month ago

|

595 Bytes

	---
	license: apache-2.0
	base_model: Qwen/Qwen2.5-VL-7B-Instruct
	tags:
	- vision
	- multimodal
	- qwen2.5-vl
	- fine-tuned
	language:
	- en
	pipeline_tag: image-text-to-text
	---

	# Fine-tuned Qwen2.5-VL Model

	This is a fine-tuned version of Qwen/Qwen2.5-VL-7B-Instruct trained using Axolotl.

	## Model Details
	- Base Model: Qwen/Qwen2.5-VL-7B-Instruct
	- Training Framework: Axolotl
	- Training Type: LoRA Fine-tuning (language model only)

	## Training Configuration
	- Learning Rate: 0.0002
	- Optimizer: adamw_8bit
	- Scheduler: cosine
	- Precision: bf16
	- Checkpoints: Disabled for efficiency