Qwen2.5-VL-3B-SFT简介
Qwen2.5-VL-3B-SFT是一款基于Qwen2.5-VL-3B的微调模型,面向通用证照关键信息提取。微调数据集:约40万条标注证照数据(图片+关键信息),包含身份证、学历证书、学位证书、营业执照、事业单位法人证书、ISO9001系列质量管理体系认证证书、ISO14001族环境管理体系认证证书、ISO45001认证证书、OHSAS18001认证证书、SA8000认证证书、通信网络安全服务能力证书(风险评估)、通信网络安全服务能力证书(设计与集成)、通信网络安全服务能力证书(应急响应)、通信网络安全服务能力证书(安全培训)等。同时加入了一些其他数据来避免原有能力遗忘,比如问答数据、公式提取、表格信息提取等。
在11类证照测试集上,Qwen2.5-VL-3B-SFT ANLS和字段级ACC均超过Qwen2.5-VL-72B和Qwen2.5-VL-7B。测试结果如下:
| 模型名称 | ANLS | 字段级ACC |
|---|---|---|
| Qwen2.5-VL-72B | 93.49 | 86.92 |
| Qwen2.5-VL-7B | 93.3 | 86.7 |
| Qwen2.5-VL-3B-SFT | 96.43 | 93.28 |
欢迎下载体验!
您可以通过如下git clone命令,或者ModelScope SDK来下载模型
SDK下载
#安装ModelScope
pip install modelscope
#SDK模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('Fairme/qwen2.5-vl-3b-sft')
Git下载
#Git模型下载
git clone https://www.modelscope.cn/Fairme/qwen2.5-vl-3b-sft.git
如果您是本模型的贡献者,我们邀请您根据模型贡献文档,及时完善模型卡片内容。
- Downloads last month
- 8
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support
Model tree for fairme/Qwen2.5-VL-3B-SFT
Base model
Qwen/Qwen2.5-VL-3B-Instruct