okletsgg
/

minicpm-rkllm-test

okletsgg commited on Jul 5

Commit

2e6f723

verified ·

1 Parent(s): b4a9263

Upload README.md with huggingface_hub

Files changed (1) hide show

README.md ADDED Viewed

+# MiniCPM4-0.5B RKLLM Models Test Repository
+这是一个测试仓库，用于存储和管理MiniCPM4-0.5B的RKLLM模型文件。
+## 📋 模型列表
+### 🎯 推荐模型：GPTQ版本
+- **文件名**: `MiniCPM4-0.5B-QAT-Int4-GPTQ-format_w4a16_g32_RK3576.rkllm`
+- **大小**: 471MB
+- **特点**: 完美支持embedding输入
+- **测试结果**: 余弦相似度 1.0，Top-50重叠率 100%
+### ⚠️ 限制模型：Per-Channel版本
+- **文件名**: `Minicpm4-0.5B-QAT-Int4-perChannel_w4a16_RK3576.rkllm`
+- **大小**: 414MB
+- **特点**: 仅推荐token输入
+- **问题**: embedding输入会产生EOS tokens
+### 📊 测试发现
+我们发现了一个反直觉的现象：**量化模型比原始模型更一致**！
+| 模型类型 | 余弦相似度 | Top-50重叠 | 状态 |
+|----------|------------|------------|------|
+| GPTQ量化 | 1.0000     | 100%       | ✅ 完美 |
+| Per-Channel | N/A    | N/A        | ❌ 产生EOS |
+| 原始FP16 | 0.5946     | 7.85%      | ⚠️ 不一致 |
+## 🚀 使用方法
+```bash
+# 下载模型
+huggingface-cli download okletsgg/minicpm-rkllm-test
+```
+## 🔧 硬件要求
+- **硬件**: RK3576
+- **内存**: 建议4GB+
+- **存储**: 根据模型大小预留空间
+## 📝 更新日志
+- **2024-01**: 完成量化效应对embedding输入影响的测试
+- **2024-01**: 发现GPTQ量化模型的完美对齐特性