File size: 1,362 Bytes
2e6f723
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
# MiniCPM4-0.5B RKLLM Models Test Repository

这是一个测试仓库,用于存储和管理MiniCPM4-0.5B的RKLLM模型文件。

## 📋 模型列表

### 🎯 推荐模型:GPTQ版本
- **文件名**: `MiniCPM4-0.5B-QAT-Int4-GPTQ-format_w4a16_g32_RK3576.rkllm`
- **大小**: 471MB
- **特点**: 完美支持embedding输入
- **测试结果**: 余弦相似度 1.0,Top-50重叠率 100%

### ⚠️ 限制模型:Per-Channel版本
- **文件名**: `Minicpm4-0.5B-QAT-Int4-perChannel_w4a16_RK3576.rkllm`
- **大小**: 414MB
- **特点**: 仅推荐token输入
- **问题**: embedding输入会产生EOS tokens

### 📊 测试发现

我们发现了一个反直觉的现象:**量化模型比原始模型更一致**!

| 模型类型 | 余弦相似度 | Top-50重叠 | 状态 |
|----------|------------|------------|------|
| GPTQ量化 | 1.0000     | 100%       | ✅ 完美 |
| Per-Channel | N/A    | N/A        | ❌ 产生EOS |
| 原始FP16 | 0.5946     | 7.85%      | ⚠️ 不一致 |

## 🚀 使用方法

```bash
# 下载模型
huggingface-cli download okletsgg/minicpm-rkllm-test
```

## 🔧 硬件要求

- **硬件**: RK3576
- **内存**: 建议4GB+
- **存储**: 根据模型大小预留空间

## 📝 更新日志

- **2024-01**: 完成量化效应对embedding输入影响的测试
- **2024-01**: 发现GPTQ量化模型的完美对齐特性