Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

.DS_Store +0 -0
.gitattributes +3 -0
README.md +24 -2
assets/arch.png +3 -0
assets/eval_res_en.png +3 -0
assets/results_show.png +3 -0

.DS_Store CHANGED Viewed

Binary files a/.DS_Store and b/.DS_Store differ

.gitattributes CHANGED Viewed

@@ -34,3 +34,6 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 assets/image_edit_demo.gif filter=lfs diff=lfs merge=lfs -text

 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 assets/image_edit_demo.gif filter=lfs diff=lfs merge=lfs -text
+assets/arch.png filter=lfs diff=lfs merge=lfs -text
+assets/eval_res_en.png filter=lfs diff=lfs merge=lfs -text
+assets/results_show.png filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,10 +1,15 @@
 ---
 license: mit
 ---
 ## 🔥🔥🔥 News!!
-* Apr 25, 2025: 👋 We release the evaluation code and benchmark data of Step1X-Edit. [Download GEdit-Bench](https://huggingface.co/datasets/stepfun-ai/GEdit-Bench)
-* Apr 25, 2025: 👋 We release the inference code and model weights of Step1X-Edit. [Download Step1X-Edit model](https://huggingface.co/stepfun-ai/Step1X-Edit)
 * Apr 25, 2025: 🎉 We have made our technical report available as open source. [Read](https://arxiv.org/abs/2504.17761)
 ## Image Edit Demos
@@ -15,6 +20,23 @@ license: mit
 </div>
 ## Citation
 ```
 @article{liu2025step1x-edit,

 ---
 license: mit
+language:
+- en
+pipeline_tag: image-text-to-image
+tags:
+- multimodal
+library_name: transformers
 ---
 ## 🔥🔥🔥 News!!
+* Apr 25, 2025: 👋 We release the inference code and model weights of Step1X-Edit. [inference code](https://github.com/stepfun-ai/Step1X-Edit)
 * Apr 25, 2025: 🎉 We have made our technical report available as open source. [Read](https://arxiv.org/abs/2504.17761)
 ## Image Edit Demos
 </div>
+## Model introduction
+<div align="center">
+<img width="720" alt="demo" src="assets/arch.png">
+</div>
+Framework of Step1X-Edit. Step1X-Edit leverages the image understanding capabilities
+of MLLMs to parse editing instructions and generate editing tokens, which are then decoded into
+images using a DiT-based network.More details please refer to our [technical report](https://arxiv.org/abs/2504.17761).
+## Benchmark
+We release [GEdit-Bench](https://huggingface.co/datasets/stepfun-ai/GEdit-Bench) as a new benchmark, grounded in real-world usages is developed to support more authentic and comprehensive evaluation. This benchmark, which is carefully curated to reflect actual user editing needs and a wide range of editing scenarios, enables more authentic and comprehensive evaluations of image editing models.
+The evaluation process and related code can be found in [GEdit-Bench/EVAL.md](GEdit-Bench/EVAL.md). Part results of the benchmark are shown below:
+<div align="center">
+<img width="1080" alt="results" src="assets/eval_res_en.png">
+</div>
 ## Citation
 ```
 @article{liu2025step1x-edit,

assets/arch.png ADDED Viewed

Git LFS Details

SHA256: e350dd53520acd47e7e615cc624aa8a3268dd8a3f0ba404716b75a6cf5cda16b
Pointer size: 131 Bytes
Size of remote file: 116 kB

assets/eval_res_en.png ADDED Viewed

Git LFS Details

SHA256: 12c32cca986228634c543ac6a46e46f83bbd82e826bcfb8d82a5a41276fa1f7d
Pointer size: 131 Bytes
Size of remote file: 524 kB

assets/results_show.png ADDED Viewed

Git LFS Details

SHA256: 8ac57118e59a67a60572ad9fce704bc81e2c3378bba47febed0936582e4eb76a
Pointer size: 132 Bytes
Size of remote file: 2.48 MB