Tongyi-Zhiwen
/

QwenLong-CPRS-7B

Safetensors

qwen2

Model card Files Files and versions Community

shenwzh3 commited on May 28

Commit

47e619a

verified ·

1 Parent(s): 3ee23a4

Update README.md

Browse files

Files changed (1) hide show

README.md +0 -42

README.md CHANGED Viewed

@@ -28,11 +28,6 @@ _**Weizhou Shen, Chenliang Li, Fanqi Wan, Shengyi Liao, Shaopeng Lai, Bo Zhang,
 _Tongyi Lab, Alibaba Group_
-<p align="center">
-    <img src="./assets/performance.png" width="100%"> <br>
-</p>
 </div>
@@ -42,9 +37,6 @@ _Tongyi Lab, Alibaba Group_
 In this work, we present QwenLong-CPRS, a novel framework designed to optimize long-context processing through query-aware multi-granularity compression, outperforming RAG and sparse attention methods. Distinct from RAG's coarse chunk-level retrieval, it achieves precise information extraction via token-level content selection, enhancing accuracy. Unlike sparse attention (SA) requiring model retraining, it functions as a plug-and-play module compatible with any downstream LLMs while eliminating retraining demands. This dual advantage enables both fine-grained context optimization and seamless integration across architectures.
-<p align="center">
-    <img src="./assets/concept.png" width="100%"> <br>
-</p>
 We implement QwenLong-CPRS with four key innovations:
 * _**Controllable Context Optimization**_: Processes control prompts + queries to generate compact, task-specific context segments without retraining.
@@ -58,11 +50,6 @@ We implement QwenLong-CPRS with four key innovations:
-<p align="center">
-    <img src="./assets/framework.png" width="100%"> <br>
-</p>
 ## 🎉 News
 - **May 26, 2025:** 🔥 We release [🤗 QwenLong-CPRS-7B](https://huggingface.co/Tongyi-Zhiwen/QwenLong-CPRS-7B), a  7B context compression model designed for explicit long-context optimization.
@@ -75,28 +62,6 @@ We implement QwenLong-CPRS with four key innovations:
-## 🎯 Model Results
-Here are the evaluation results.
-<p align="center">
-    <img src="./assets/main_res.png" width="100%"> <br>
-</p>
-<p align="center">
-    <img src="./assets/niah.png" width="100%"> <br>
-</p>
-<p align="center">
-    <img src="./assets/different_llm.png" width="100%"> <br>
-</p>
-<p align="center">
-    <img src="./assets/latency.png" width="100%"> <br>
-</p>
 ## 🛠️ Requirements
 ```bash
@@ -166,13 +131,6 @@ python infer.py \
 ```
-## 🌐 Join the Community
-Chinese users can scan QR codes to join DingTalk/WeChat groups.
-| WeChat | DingTalk |
-|----------|---------|
-| ![Alt Text](./assets/wechat_group.JPG) | ![Alt Text](./assets/dingding_group.png) |
 ## 📝 Citation
 If you find this work is relevant with your research or applications, please feel free to cite our work!

 _Tongyi Lab, Alibaba Group_
 </div>
 In this work, we present QwenLong-CPRS, a novel framework designed to optimize long-context processing through query-aware multi-granularity compression, outperforming RAG and sparse attention methods. Distinct from RAG's coarse chunk-level retrieval, it achieves precise information extraction via token-level content selection, enhancing accuracy. Unlike sparse attention (SA) requiring model retraining, it functions as a plug-and-play module compatible with any downstream LLMs while eliminating retraining demands. This dual advantage enables both fine-grained context optimization and seamless integration across architectures.
 We implement QwenLong-CPRS with four key innovations:
 * _**Controllable Context Optimization**_: Processes control prompts + queries to generate compact, task-specific context segments without retraining.
 ## 🎉 News
 - **May 26, 2025:** 🔥 We release [🤗 QwenLong-CPRS-7B](https://huggingface.co/Tongyi-Zhiwen/QwenLong-CPRS-7B), a  7B context compression model designed for explicit long-context optimization.
 ## 🛠️ Requirements
 ```bash
 ```
 ## 📝 Citation
 If you find this work is relevant with your research or applications, please feel free to cite our work!