diff --git "a/log.txt" "b/log.txt"
new file mode 100644--- /dev/null
+++ "b/log.txt"
@@ -0,0 +1,368 @@
+Running 1 job
+{
+    "type": "ui_trainer",
+    "training_folder": "/app/ai-toolkit/output",
+    "sqlite_db_path": "/app/ai-toolkit/aitk_db.db",
+    "device": "cuda",
+    "trigger_word": null,
+    "performance_log_every": 10,
+    "network": {
+        "type": "lora",
+        "linear": 32,
+        "linear_alpha": 32,
+        "conv": 16,
+        "conv_alpha": 16,
+        "lokr_full_rank": true,
+        "lokr_factor": -1,
+        "network_kwargs": {
+            "ignore_if_contains": []
+        }
+    },
+    "save": {
+        "dtype": "bf16",
+        "save_every": 250,
+        "max_step_saves_to_keep": 4,
+        "save_format": "diffusers",
+        "push_to_hub": false
+    },
+    "datasets": [
+        {
+            "folder_path": "/app/ai-toolkit/datasets/mind",
+            "control_path": null,
+            "mask_path": null,
+            "mask_min_value": 0.1,
+            "default_caption": "",
+            "caption_ext": "txt",
+            "caption_dropout_rate": 0.05,
+            "cache_latents_to_disk": false,
+            "is_reg": false,
+            "network_weight": 1,
+            "resolution": [
+                512,
+                768,
+                1024
+            ],
+            "controls": [],
+            "shrink_video_to_frames": true,
+            "num_frames": 1,
+            "do_i2v": true,
+            "flip_x": false,
+            "flip_y": false
+        }
+    ],
+    "train": {
+        "batch_size": 1,
+        "bypass_guidance_embedding": false,
+        "steps": 3000,
+        "gradient_accumulation": 1,
+        "train_unet": true,
+        "train_text_encoder": false,
+        "gradient_checkpointing": true,
+        "noise_scheduler": "flowmatch",
+        "optimizer": "adamw8bit",
+        "timestep_type": "weighted",
+        "content_or_style": "balanced",
+        "optimizer_params": {
+            "weight_decay": 0.0001
+        },
+        "unload_text_encoder": false,
+        "cache_text_embeddings": false,
+        "lr": 0.0001,
+        "ema_config": {
+            "use_ema": false,
+            "ema_decay": 0.99
+        },
+        "skip_first_sample": false,
+        "disable_sampling": false,
+        "dtype": "bf16",
+        "diff_output_preservation": false,
+        "diff_output_preservation_multiplier": 1,
+        "diff_output_preservation_class": "person",
+        "switch_boundary_every": 1
+    },
+    "model": {
+        "name_or_path": "Qwen/Qwen-Image",
+        "quantize": true,
+        "qtype": "qfloat8",
+        "quantize_te": true,
+        "qtype_te": "qfloat8",
+        "arch": "qwen_image",
+        "low_vram": true,
+        "model_kwargs": {}
+    },
+    "sample": {
+        "sampler": "flowmatch",
+        "sample_every": 250,
+        "width": 1024,
+        "height": 1024,
+        "samples": [
+            {
+                "prompt": "photorealistic portrait of a person wearing the m1nd3xpand3r mask (third-eye symbol, orange/blue markings) seated on a dim night metro; neon city lights streak outside the window at camera-left; shallow depth of field, 35mm lens, soft fluorescent flicker, window reflections; calm, moody, cinematic lighting; sharp focus, high detail, filmic color grade"
+            },
+            {
+                "prompt": "photorealistic close-up of a person wearing the m1nd3xpand3r mask in a narrow neon-lit alley at night; light rain with beads and drips on the mask; shallow depth of field, 50mm lens; slow cinematic vibe, cool neon rimlight with warm shop-sign fill; steam and puddle reflections; sharp focus, high detail, cinematic contrast"
+            }
+        ],
+        "neg": "",
+        "seed": 42,
+        "walk_seed": true,
+        "guidance_scale": 4,
+        "sample_steps": 25,
+        "num_frames": 1,
+        "fps": 1
+    }
+}
+Using SQLite database at /app/ai-toolkit/aitk_db.db
+Job ID: "7f876215-1a5d-4ce3-acd5-ea2f5876d7b4"
+
+#############################################
+# Running job: mindexpander_qwen_v1
+#############################################
+
+
+Running  1 process
+Loading Qwen Image model
+Loading transformer
+config.json:   0%|          | 0.00/371 [00:00<?, ?B/s]config.json:   0%|          | 0.00/371 [00:00<?, ?B/s]config.json: 100%|##########| 371/371 [00:00<00:00, 4.65MB/s]config.json: 100%|##########| 371/371 [00:00<00:00, 4.65MB/s]
+
+(…)ion_pytorch_model.safetensors.index.json: 0.00B [00:00, ?B/s](…)ion_pytorch_model.safetensors.index.json: 0.00B [00:00, ?B/s](…)ion_pytorch_model.safetensors.index.json: 199kB [00:00, 160MB/s](…)ion_pytorch_model.safetensors.index.json: 199kB [00:00, 160MB/s]
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.99G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.99G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 780k/4.99G [00:01<2:03:20, 674kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 780k/4.99G [00:01<2:03:20, 674kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.38M/4.99G [00:01<47:25, 1.75MB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.38M/4.99G [00:01<47:25, 1.75MB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 69.4M/4.99G [00:01<01:17, 63.6MB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 69.4M/4.99G [00:01<01:17, 63.6MB/s]transformer/diffusion_pytorch_model-0000(…):   3%|2         | 139M/4.99G [00:02<01:03, 76.5MB/s] transformer/diffusion_pytorch_model-0000(…):   3%|2         | 139M/4.99G [00:02<01:03, 76.5MB/s] transformer/diffusion_pytorch_model-0000(…):  10%|9         | 474M/4.99G [00:02<00:13, 338MB/s] transformer/diffusion_pytorch_model-0000(…):  10%|9         | 474M/4.99G [00:02<00:13, 338MB/s] transformer/diffusion_pytorch_model-0000(…):  12%|#2        | 608M/4.99G [00:02<00:10, 407MB/s]transformer/diffusion_pytorch_model-0000(…):  12%|#2        | 608M/4.99G [00:02<00:10, 407MB/s]transformer/diffusion_pytorch_model-0000(…):  16%|#6        | 810M/4.99G [00:03<00:07, 593MB/s]transformer/diffusion_pytorch_model-0000(…):  16%|#6        | 810M/4.99G [00:03<00:07, 593MB/s]transformer/diffusion_pytorch_model-0000(…):  19%|#8        | 944M/4.99G [00:03<00:06, 632MB/s]transformer/diffusion_pytorch_model-0000(…):  19%|#8        | 944M/4.99G [00:03<00:06, 632MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.99G [00:03<00:10, 363MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.99G [00:03<00:10, 363MB/s]transformer/diffusion_pytorch_model-0000(…):  24%|##4       | 1.21G/4.99G [00:04<00:09, 386MB/s]transformer/diffusion_pytorch_model-0000(…):  24%|##4       | 1.21G/4.99G [00:04<00:09, 386MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.99G [00:04<00:09, 403MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.99G [00:04<00:09, 403MB/s]transformer/diffusion_pytorch_model-0000(…):  28%|##8       | 1.42G/4.99G [00:04<00:07, 503MB/s]transformer/diffusion_pytorch_model-0000(…):  28%|##8       | 1.42G/4.99G [00:04<00:07, 503MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.99G [00:04<00:07, 458MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.99G [00:04<00:07, 458MB/s]transformer/diffusion_pytorch_model-0000(…):  43%|####3     | 2.15G/4.99G [00:04<00:02, 1.20GB/s]transformer/diffusion_pytorch_model-0000(…):  43%|####3     | 2.15G/4.99G [00:04<00:02, 1.20GB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####8     | 2.42G/4.99G [00:05<00:01, 1.29GB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####8     | 2.42G/4.99G [00:05<00:01, 1.29GB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####3    | 2.69G/4.99G [00:05<00:01, 1.37GB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####3    | 2.69G/4.99G [00:05<00:01, 1.37GB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####7    | 2.89G/4.99G [00:05<00:01, 1.47GB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####7    | 2.89G/4.99G [00:05<00:01, 1.47GB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######1   | 3.09G/4.99G [00:05<00:01, 1.38GB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######1   | 3.09G/4.99G [00:05<00:01, 1.38GB/s]transformer/diffusion_pytorch_model-0000(…):  66%|######5   | 3.29G/4.99G [00:05<00:01, 1.47GB/s]transformer/diffusion_pytorch_model-0000(…):  66%|######5   | 3.29G/4.99G [00:05<00:01, 1.47GB/s]transformer/diffusion_pytorch_model-0000(…):  71%|#######   | 3.52G/4.99G [00:05<00:00, 1.53GB/s]transformer/diffusion_pytorch_model-0000(…):  71%|#######   | 3.52G/4.99G [00:05<00:00, 1.53GB/s]transformer/diffusion_pytorch_model-0000(…):  75%|#######4  | 3.72G/4.99G [00:05<00:00, 1.56GB/s]transformer/diffusion_pytorch_model-0000(…):  75%|#######4  | 3.72G/4.99G [00:05<00:00, 1.56GB/s]transformer/diffusion_pytorch_model-0000(…):  79%|#######8  | 3.92G/4.99G [00:06<00:00, 1.65GB/s]transformer/diffusion_pytorch_model-0000(…):  79%|#######8  | 3.92G/4.99G [00:06<00:00, 1.65GB/s]transformer/diffusion_pytorch_model-0000(…):  83%|########2 | 4.12G/4.99G [00:06<00:00, 1.70GB/s]transformer/diffusion_pytorch_model-0000(…):  83%|########2 | 4.12G/4.99G [00:06<00:00, 1.70GB/s]transformer/diffusion_pytorch_model-0000(…):  87%|########6 | 4.32G/4.99G [00:06<00:00, 1.75GB/s]transformer/diffusion_pytorch_model-0000(…):  87%|########6 | 4.32G/4.99G [00:06<00:00, 1.75GB/s]transformer/diffusion_pytorch_model-0000(…):  91%|######### | 4.53G/4.99G [00:06<00:00, 1.80GB/s]transformer/diffusion_pytorch_model-0000(…):  91%|######### | 4.53G/4.99G [00:06<00:00, 1.80GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.73G/4.99G [00:06<00:00, 1.80GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.73G/4.99G [00:06<00:00, 1.80GB/s]transformer/diffusion_pytorch_model-0000(…):  99%|#########8| 4.92G/4.99G [00:06<00:00, 1.83GB/s]transformer/diffusion_pytorch_model-0000(…):  99%|#########8| 4.92G/4.99G [00:06<00:00, 1.83GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.99G/4.99G [00:06<00:00, 734MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.99G/4.99G [00:06<00:00, 734MB/s] 
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.98G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.98G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 553k/4.98G [00:00<1:48:57, 762kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 553k/4.98G [00:00<1:48:57, 762kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 1.79M/4.98G [00:01<52:12, 1.59MB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 1.79M/4.98G [00:01<52:12, 1.59MB/s]transformer/diffusion_pytorch_model-0000(…):   4%|4         | 203M/4.98G [00:01<00:28, 166MB/s]  transformer/diffusion_pytorch_model-0000(…):   4%|4         | 203M/4.98G [00:01<00:28, 166MB/s]  transformer/diffusion_pytorch_model-0000(…):  12%|#2        | 608M/4.98G [00:02<00:09, 470MB/s]transformer/diffusion_pytorch_model-0000(…):  12%|#2        | 608M/4.98G [00:02<00:09, 470MB/s]transformer/diffusion_pytorch_model-0000(…):  15%|#4        | 742M/4.98G [00:02<00:07, 545MB/s]transformer/diffusion_pytorch_model-0000(…):  15%|#4        | 742M/4.98G [00:02<00:07, 545MB/s]transformer/diffusion_pytorch_model-0000(…):  18%|#7        | 876M/4.98G [00:02<00:09, 436MB/s]transformer/diffusion_pytorch_model-0000(…):  18%|#7        | 876M/4.98G [00:02<00:09, 436MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.98G [00:02<00:06, 606MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.98G [00:02<00:06, 606MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.98G [00:02<00:04, 789MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.98G [00:02<00:04, 789MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.98G [00:02<00:03, 977MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.98G [00:02<00:03, 977MB/s]transformer/diffusion_pytorch_model-0000(…):  34%|###3      | 1.68G/4.98G [00:03<00:04, 803MB/s]transformer/diffusion_pytorch_model-0000(…):  34%|###3      | 1.68G/4.98G [00:03<00:04, 803MB/s]transformer/diffusion_pytorch_model-0000(…):  39%|###9      | 1.95G/4.98G [00:03<00:03, 764MB/s]transformer/diffusion_pytorch_model-0000(…):  39%|###9      | 1.95G/4.98G [00:03<00:03, 764MB/s]transformer/diffusion_pytorch_model-0000(…):  50%|####9     | 2.48G/4.98G [00:03<00:01, 1.36GB/s]transformer/diffusion_pytorch_model-0000(…):  50%|####9     | 2.48G/4.98G [00:03<00:01, 1.36GB/s]transformer/diffusion_pytorch_model-0000(…):  55%|#####5    | 2.75G/4.98G [00:03<00:01, 1.48GB/s]transformer/diffusion_pytorch_model-0000(…):  55%|#####5    | 2.75G/4.98G [00:03<00:01, 1.48GB/s]transformer/diffusion_pytorch_model-0000(…):  61%|######    | 3.02G/4.98G [00:04<00:01, 1.51GB/s]transformer/diffusion_pytorch_model-0000(…):  61%|######    | 3.02G/4.98G [00:04<00:01, 1.51GB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######5   | 3.24G/4.98G [00:04<00:01, 1.35GB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######5   | 3.24G/4.98G [00:04<00:01, 1.35GB/s]transformer/diffusion_pytorch_model-0000(…):  70%|#######   | 3.51G/4.98G [00:04<00:00, 1.50GB/s]transformer/diffusion_pytorch_model-0000(…):  70%|#######   | 3.51G/4.98G [00:04<00:00, 1.50GB/s]transformer/diffusion_pytorch_model-0000(…):  74%|#######4  | 3.71G/4.98G [00:04<00:00, 1.59GB/s]transformer/diffusion_pytorch_model-0000(…):  74%|#######4  | 3.71G/4.98G [00:04<00:00, 1.59GB/s]transformer/diffusion_pytorch_model-0000(…):  79%|#######8  | 3.91G/4.98G [00:04<00:00, 1.57GB/s]transformer/diffusion_pytorch_model-0000(…):  79%|#######8  | 3.91G/4.98G [00:04<00:00, 1.57GB/s]transformer/diffusion_pytorch_model-0000(…):  83%|########2 | 4.12G/4.98G [00:04<00:00, 1.61GB/s]transformer/diffusion_pytorch_model-0000(…):  83%|########2 | 4.12G/4.98G [00:04<00:00, 1.61GB/s]transformer/diffusion_pytorch_model-0000(…):  87%|########6 | 4.32G/4.98G [00:04<00:00, 1.63GB/s]transformer/diffusion_pytorch_model-0000(…):  87%|########6 | 4.32G/4.98G [00:04<00:00, 1.63GB/s]transformer/diffusion_pytorch_model-0000(…):  92%|#########1| 4.58G/4.98G [00:05<00:00, 1.71GB/s]transformer/diffusion_pytorch_model-0000(…):  92%|#########1| 4.58G/4.98G [00:05<00:00, 1.71GB/s]transformer/diffusion_pytorch_model-0000(…):  96%|#########6| 4.79G/4.98G [00:05<00:00, 1.77GB/s]transformer/diffusion_pytorch_model-0000(…):  96%|#########6| 4.79G/4.98G [00:05<00:00, 1.77GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:05<00:00, 1.67GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:05<00:00, 1.67GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:05<00:00, 936MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:05<00:00, 936MB/s] 
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.95G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.95G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 657k/4.95G [00:01<2:08:45, 640kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 657k/4.95G [00:01<2:08:45, 640kB/s]transformer/diffusion_pytorch_model-0000(…):   3%|2         | 135M/4.95G [00:01<00:48, 100MB/s]  transformer/diffusion_pytorch_model-0000(…):   3%|2         | 135M/4.95G [00:01<00:48, 100MB/s]  transformer/diffusion_pytorch_model-0000(…):  11%|#         | 539M/4.95G [00:02<00:14, 299MB/s]transformer/diffusion_pytorch_model-0000(…):  11%|#         | 539M/4.95G [00:02<00:14, 299MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.14G/4.95G [00:02<00:05, 728MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.14G/4.95G [00:02<00:05, 728MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##7       | 1.35G/4.95G [00:02<00:04, 806MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##7       | 1.35G/4.95G [00:02<00:04, 806MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.95G [00:02<00:03, 873MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.95G [00:02<00:03, 873MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.95G [00:03<00:03, 851MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.95G [00:03<00:03, 851MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###8      | 1.88G/4.95G [00:03<00:03, 833MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###8      | 1.88G/4.95G [00:03<00:03, 833MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####2     | 2.08G/4.95G [00:03<00:02, 980MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####2     | 2.08G/4.95G [00:03<00:02, 980MB/s]transformer/diffusion_pytorch_model-0000(…):  45%|####4     | 2.22G/4.95G [00:03<00:03, 813MB/s]transformer/diffusion_pytorch_model-0000(…):  45%|####4     | 2.22G/4.95G [00:03<00:03, 813MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####7     | 2.35G/4.95G [00:03<00:02, 881MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####7     | 2.35G/4.95G [00:03<00:02, 881MB/s]transformer/diffusion_pytorch_model-0000(…):  50%|#####     | 2.48G/4.95G [00:04<00:03, 720MB/s]transformer/diffusion_pytorch_model-0000(…):  50%|#####     | 2.48G/4.95G [00:04<00:03, 720MB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####4    | 2.68G/4.95G [00:04<00:02, 909MB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####4    | 2.68G/4.95G [00:04<00:02, 909MB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####8    | 2.89G/4.95G [00:04<00:01, 1.09GB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####8    | 2.89G/4.95G [00:04<00:01, 1.09GB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######2   | 3.09G/4.95G [00:04<00:01, 1.21GB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######2   | 3.09G/4.95G [00:04<00:01, 1.21GB/s]transformer/diffusion_pytorch_model-0000(…):  66%|######6   | 3.29G/4.95G [00:04<00:01, 1.19GB/s]transformer/diffusion_pytorch_model-0000(…):  66%|######6   | 3.29G/4.95G [00:04<00:01, 1.19GB/s]transformer/diffusion_pytorch_model-0000(…):  71%|#######   | 3.49G/4.95G [00:04<00:01, 1.34GB/s]transformer/diffusion_pytorch_model-0000(…):  71%|#######   | 3.49G/4.95G [00:04<00:01, 1.34GB/s]transformer/diffusion_pytorch_model-0000(…):  75%|#######4  | 3.69G/4.95G [00:04<00:00, 1.42GB/s]transformer/diffusion_pytorch_model-0000(…):  75%|#######4  | 3.69G/4.95G [00:04<00:00, 1.42GB/s]transformer/diffusion_pytorch_model-0000(…):  79%|#######8  | 3.89G/4.95G [00:04<00:00, 1.52GB/s]transformer/diffusion_pytorch_model-0000(…):  79%|#######8  | 3.89G/4.95G [00:04<00:00, 1.52GB/s]transformer/diffusion_pytorch_model-0000(…):  83%|########2 | 4.09G/4.95G [00:05<00:00, 1.58GB/s]transformer/diffusion_pytorch_model-0000(…):  83%|########2 | 4.09G/4.95G [00:05<00:00, 1.58GB/s]transformer/diffusion_pytorch_model-0000(…):  88%|########7 | 4.35G/4.95G [00:05<00:00, 1.67GB/s]transformer/diffusion_pytorch_model-0000(…):  88%|########7 | 4.35G/4.95G [00:05<00:00, 1.67GB/s]transformer/diffusion_pytorch_model-0000(…):  92%|#########1| 4.55G/4.95G [00:05<00:00, 1.75GB/s]transformer/diffusion_pytorch_model-0000(…):  92%|#########1| 4.55G/4.95G [00:05<00:00, 1.75GB/s]transformer/diffusion_pytorch_model-0000(…):  96%|#########5| 4.75G/4.95G [00:05<00:00, 1.68GB/s]transformer/diffusion_pytorch_model-0000(…):  96%|#########5| 4.75G/4.95G [00:05<00:00, 1.68GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:05<00:00, 1.73GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:05<00:00, 1.73GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:05<00:00, 895MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:05<00:00, 895MB/s] 
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.98G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.98G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 603k/4.98G [00:00<2:15:33, 613kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 603k/4.98G [00:00<2:15:33, 613kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 1.69M/4.98G [00:01<1:15:22, 1.10MB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 1.69M/4.98G [00:01<1:15:22, 1.10MB/s]transformer/diffusion_pytorch_model-0000(…):   7%|6         | 337M/4.98G [00:02<00:21, 217MB/s]    transformer/diffusion_pytorch_model-0000(…):   7%|6         | 337M/4.98G [00:02<00:21, 217MB/s]    transformer/diffusion_pytorch_model-0000(…):  16%|#6        | 809M/4.98G [00:02<00:07, 588MB/s]transformer/diffusion_pytorch_model-0000(…):  16%|#6        | 809M/4.98G [00:02<00:07, 588MB/s]transformer/diffusion_pytorch_model-0000(…):  20%|##        | 1.01G/4.98G [00:02<00:07, 529MB/s]transformer/diffusion_pytorch_model-0000(…):  20%|##        | 1.01G/4.98G [00:02<00:07, 529MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##2       | 1.14G/4.98G [00:03<00:07, 544MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##2       | 1.14G/4.98G [00:03<00:07, 544MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##6       | 1.35G/4.98G [00:03<00:05, 707MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##6       | 1.35G/4.98G [00:03<00:05, 707MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.98G [00:03<00:04, 847MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.98G [00:03<00:04, 847MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.98G [00:03<00:04, 724MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.98G [00:03<00:04, 724MB/s]transformer/diffusion_pytorch_model-0000(…):  45%|####4     | 2.22G/4.98G [00:03<00:02, 1.20GB/s]transformer/diffusion_pytorch_model-0000(…):  45%|####4     | 2.22G/4.98G [00:03<00:02, 1.20GB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####8     | 2.42G/4.98G [00:03<00:02, 1.17GB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####8     | 2.42G/4.98G [00:03<00:02, 1.17GB/s]transformer/diffusion_pytorch_model-0000(…):  53%|#####2    | 2.62G/4.98G [00:04<00:01, 1.25GB/s]transformer/diffusion_pytorch_model-0000(…):  53%|#####2    | 2.62G/4.98G [00:04<00:01, 1.25GB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####6    | 2.82G/4.98G [00:04<00:01, 1.37GB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####6    | 2.82G/4.98G [00:04<00:01, 1.37GB/s]transformer/diffusion_pytorch_model-0000(…):  61%|######1   | 3.05G/4.98G [00:04<00:01, 1.43GB/s]transformer/diffusion_pytorch_model-0000(…):  61%|######1   | 3.05G/4.98G [00:04<00:01, 1.43GB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######5   | 3.25G/4.98G [00:04<00:01, 1.31GB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######5   | 3.25G/4.98G [00:04<00:01, 1.31GB/s]transformer/diffusion_pytorch_model-0000(…):  71%|#######   | 3.51G/4.98G [00:04<00:00, 1.53GB/s]transformer/diffusion_pytorch_model-0000(…):  71%|#######   | 3.51G/4.98G [00:04<00:00, 1.53GB/s]transformer/diffusion_pytorch_model-0000(…):  75%|#######4  | 3.72G/4.98G [00:04<00:00, 1.55GB/s]transformer/diffusion_pytorch_model-0000(…):  75%|#######4  | 3.72G/4.98G [00:04<00:00, 1.55GB/s]transformer/diffusion_pytorch_model-0000(…):  79%|#######8  | 3.92G/4.98G [00:04<00:00, 1.57GB/s]transformer/diffusion_pytorch_model-0000(…):  79%|#######8  | 3.92G/4.98G [00:04<00:00, 1.57GB/s]transformer/diffusion_pytorch_model-0000(…):  83%|########2 | 4.12G/4.98G [00:05<00:00, 1.50GB/s]transformer/diffusion_pytorch_model-0000(…):  83%|########2 | 4.12G/4.98G [00:05<00:00, 1.50GB/s]transformer/diffusion_pytorch_model-0000(…):  87%|########6 | 4.32G/4.98G [00:05<00:00, 1.58GB/s]transformer/diffusion_pytorch_model-0000(…):  87%|########6 | 4.32G/4.98G [00:05<00:00, 1.58GB/s]transformer/diffusion_pytorch_model-0000(…):  91%|######### | 4.52G/4.98G [00:05<00:00, 1.64GB/s]transformer/diffusion_pytorch_model-0000(…):  91%|######### | 4.52G/4.98G [00:05<00:00, 1.64GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.72G/4.98G [00:05<00:00, 1.47GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.72G/4.98G [00:05<00:00, 1.47GB/s]transformer/diffusion_pytorch_model-0000(…):  99%|#########8| 4.92G/4.98G [00:05<00:00, 1.26GB/s]transformer/diffusion_pytorch_model-0000(…):  99%|#########8| 4.92G/4.98G [00:05<00:00, 1.26GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:05<00:00, 870MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:05<00:00, 870MB/s] 
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.95G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.95G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 834k/4.95G [00:01<2:02:12, 674kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 834k/4.95G [00:01<2:02:12, 674kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.38M/4.95G [00:01<57:55, 1.42MB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.38M/4.95G [00:01<57:55, 1.42MB/s]transformer/diffusion_pytorch_model-0000(…):   8%|8         | 405M/4.95G [00:02<00:17, 266MB/s]  transformer/diffusion_pytorch_model-0000(…):   8%|8         | 405M/4.95G [00:02<00:17, 266MB/s]  transformer/diffusion_pytorch_model-0000(…):  18%|#7        | 880M/4.95G [00:02<00:07, 552MB/s]transformer/diffusion_pytorch_model-0000(…):  18%|#7        | 880M/4.95G [00:02<00:07, 552MB/s]transformer/diffusion_pytorch_model-0000(…):  20%|##        | 1.01G/4.95G [00:02<00:06, 600MB/s]transformer/diffusion_pytorch_model-0000(…):  20%|##        | 1.01G/4.95G [00:02<00:06, 600MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.15G/4.95G [00:03<00:07, 485MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.15G/4.95G [00:03<00:07, 485MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##7       | 1.35G/4.95G [00:03<00:05, 620MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##7       | 1.35G/4.95G [00:03<00:05, 620MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.95G [00:03<00:04, 785MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.95G [00:03<00:04, 785MB/s]transformer/diffusion_pytorch_model-0000(…):  34%|###4      | 1.68G/4.95G [00:03<00:05, 637MB/s]transformer/diffusion_pytorch_model-0000(…):  34%|###4      | 1.68G/4.95G [00:03<00:05, 637MB/s]transformer/diffusion_pytorch_model-0000(…):  39%|###9      | 1.95G/4.95G [00:04<00:03, 787MB/s]transformer/diffusion_pytorch_model-0000(…):  39%|###9      | 1.95G/4.95G [00:04<00:03, 787MB/s]transformer/diffusion_pytorch_model-0000(…):  45%|####4     | 2.22G/4.95G [00:04<00:02, 972MB/s]transformer/diffusion_pytorch_model-0000(…):  45%|####4     | 2.22G/4.95G [00:04<00:02, 972MB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####8     | 2.42G/4.95G [00:04<00:02, 1.11GB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####8     | 2.42G/4.95G [00:04<00:02, 1.11GB/s]transformer/diffusion_pytorch_model-0000(…):  53%|#####3    | 2.62G/4.95G [00:04<00:01, 1.20GB/s]transformer/diffusion_pytorch_model-0000(…):  53%|#####3    | 2.62G/4.95G [00:04<00:01, 1.20GB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####7    | 2.82G/4.95G [00:04<00:01, 1.30GB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####7    | 2.82G/4.95G [00:04<00:01, 1.30GB/s]transformer/diffusion_pytorch_model-0000(…):  61%|######1   | 3.03G/4.95G [00:04<00:01, 1.31GB/s]transformer/diffusion_pytorch_model-0000(…):  61%|######1   | 3.03G/4.95G [00:04<00:01, 1.31GB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######5   | 3.23G/4.95G [00:04<00:01, 1.45GB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######5   | 3.23G/4.95G [00:04<00:01, 1.45GB/s]transformer/diffusion_pytorch_model-0000(…):  69%|######9   | 3.43G/4.95G [00:04<00:00, 1.54GB/s]transformer/diffusion_pytorch_model-0000(…):  69%|######9   | 3.43G/4.95G [00:04<00:00, 1.54GB/s]transformer/diffusion_pytorch_model-0000(…):  73%|#######3  | 3.63G/4.95G [00:05<00:00, 1.63GB/s]transformer/diffusion_pytorch_model-0000(…):  73%|#######3  | 3.63G/4.95G [00:05<00:00, 1.63GB/s]transformer/diffusion_pytorch_model-0000(…):  77%|#######7  | 3.83G/4.95G [00:05<00:00, 1.58GB/s]transformer/diffusion_pytorch_model-0000(…):  77%|#######7  | 3.83G/4.95G [00:05<00:00, 1.58GB/s]transformer/diffusion_pytorch_model-0000(…):  81%|########1 | 4.03G/4.95G [00:05<00:00, 1.37GB/s]transformer/diffusion_pytorch_model-0000(…):  81%|########1 | 4.03G/4.95G [00:05<00:00, 1.37GB/s]transformer/diffusion_pytorch_model-0000(…):  86%|########5 | 4.23G/4.95G [00:05<00:00, 1.49GB/s]transformer/diffusion_pytorch_model-0000(…):  86%|########5 | 4.23G/4.95G [00:05<00:00, 1.49GB/s]transformer/diffusion_pytorch_model-0000(…):  91%|######### | 4.48G/4.95G [00:05<00:00, 1.61GB/s]transformer/diffusion_pytorch_model-0000(…):  91%|######### | 4.48G/4.95G [00:05<00:00, 1.61GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.68G/4.95G [00:05<00:00, 1.68GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.68G/4.95G [00:05<00:00, 1.68GB/s]transformer/diffusion_pytorch_model-0000(…):  99%|#########8| 4.88G/4.95G [00:05<00:00, 1.71GB/s]transformer/diffusion_pytorch_model-0000(…):  99%|#########8| 4.88G/4.95G [00:05<00:00, 1.71GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:05<00:00, 840MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:05<00:00, 840MB/s] 
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.95G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.95G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 897k/4.95G [00:00<59:22, 1.39MB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 897k/4.95G [00:00<59:22, 1.39MB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.33M/4.95G [00:01<43:29, 1.89MB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.33M/4.95G [00:01<43:29, 1.89MB/s]transformer/diffusion_pytorch_model-0000(…):   5%|5         | 271M/4.95G [00:02<00:30, 152MB/s]  transformer/diffusion_pytorch_model-0000(…):   5%|5         | 271M/4.95G [00:02<00:30, 152MB/s]  transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.95G [00:02<00:04, 865MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.95G [00:02<00:04, 865MB/s]transformer/diffusion_pytorch_model-0000(…):  33%|###2      | 1.61G/4.95G [00:03<00:05, 610MB/s]transformer/diffusion_pytorch_model-0000(…):  33%|###2      | 1.61G/4.95G [00:03<00:05, 610MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####7     | 2.35G/4.95G [00:03<00:02, 964MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####7     | 2.35G/4.95G [00:03<00:02, 964MB/s]transformer/diffusion_pytorch_model-0000(…):  53%|#####2    | 2.62G/4.95G [00:03<00:02, 1.02GB/s]transformer/diffusion_pytorch_model-0000(…):  53%|#####2    | 2.62G/4.95G [00:03<00:02, 1.02GB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####7    | 2.82G/4.95G [00:04<00:02, 1.02GB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####7    | 2.82G/4.95G [00:04<00:02, 1.02GB/s]transformer/diffusion_pytorch_model-0000(…):  61%|######1   | 3.02G/4.95G [00:04<00:01, 1.12GB/s]transformer/diffusion_pytorch_model-0000(…):  61%|######1   | 3.02G/4.95G [00:04<00:01, 1.12GB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######5   | 3.22G/4.95G [00:04<00:01, 1.20GB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######5   | 3.22G/4.95G [00:04<00:01, 1.20GB/s]transformer/diffusion_pytorch_model-0000(…):  69%|######9   | 3.42G/4.95G [00:04<00:01, 1.32GB/s]transformer/diffusion_pytorch_model-0000(…):  69%|######9   | 3.42G/4.95G [00:04<00:01, 1.32GB/s]transformer/diffusion_pytorch_model-0000(…):  73%|#######3  | 3.62G/4.95G [00:04<00:00, 1.38GB/s]transformer/diffusion_pytorch_model-0000(…):  73%|#######3  | 3.62G/4.95G [00:04<00:00, 1.38GB/s]transformer/diffusion_pytorch_model-0000(…):  77%|#######7  | 3.83G/4.95G [00:04<00:00, 1.46GB/s]transformer/diffusion_pytorch_model-0000(…):  77%|#######7  | 3.83G/4.95G [00:04<00:00, 1.46GB/s]transformer/diffusion_pytorch_model-0000(…):  81%|########1 | 4.03G/4.95G [00:04<00:00, 1.46GB/s]transformer/diffusion_pytorch_model-0000(…):  81%|########1 | 4.03G/4.95G [00:04<00:00, 1.46GB/s]transformer/diffusion_pytorch_model-0000(…):  85%|########5 | 4.21G/4.95G [00:04<00:00, 1.45GB/s]transformer/diffusion_pytorch_model-0000(…):  85%|########5 | 4.21G/4.95G [00:04<00:00, 1.45GB/s]transformer/diffusion_pytorch_model-0000(…):  89%|########9 | 4.41G/4.95G [00:05<00:00, 1.40GB/s]transformer/diffusion_pytorch_model-0000(…):  89%|########9 | 4.41G/4.95G [00:05<00:00, 1.40GB/s]transformer/diffusion_pytorch_model-0000(…):  93%|#########3| 4.61G/4.95G [00:05<00:00, 1.22GB/s]transformer/diffusion_pytorch_model-0000(…):  93%|#########3| 4.61G/4.95G [00:05<00:00, 1.22GB/s]transformer/diffusion_pytorch_model-0000(…):  97%|#########7| 4.81G/4.95G [00:05<00:00, 1.19GB/s]transformer/diffusion_pytorch_model-0000(…):  97%|#########7| 4.81G/4.95G [00:05<00:00, 1.19GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:05<00:00, 890MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:05<00:00, 890MB/s] 
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.91G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.91G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 717k/4.91G [00:01<2:24:10, 567kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 717k/4.91G [00:01<2:24:10, 567kB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 67.8M/4.91G [00:01<01:40, 48.2MB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 67.8M/4.91G [00:01<01:40, 48.2MB/s]transformer/diffusion_pytorch_model-0000(…):  11%|#         | 539M/4.91G [00:02<00:13, 325MB/s]  transformer/diffusion_pytorch_model-0000(…):  11%|#         | 539M/4.91G [00:02<00:13, 325MB/s]  transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.14G/4.91G [00:03<00:07, 536MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.14G/4.91G [00:03<00:07, 536MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##6       | 1.28G/4.91G [00:03<00:06, 554MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##6       | 1.28G/4.91G [00:03<00:06, 554MB/s]transformer/diffusion_pytorch_model-0000(…):  29%|##8       | 1.41G/4.91G [00:03<00:05, 591MB/s]transformer/diffusion_pytorch_model-0000(…):  29%|##8       | 1.41G/4.91G [00:03<00:05, 591MB/s]transformer/diffusion_pytorch_model-0000(…):  33%|###2      | 1.61G/4.91G [00:03<00:04, 675MB/s]transformer/diffusion_pytorch_model-0000(…):  33%|###2      | 1.61G/4.91G [00:03<00:04, 675MB/s]transformer/diffusion_pytorch_model-0000(…):  37%|###6      | 1.81G/4.91G [00:03<00:04, 742MB/s]transformer/diffusion_pytorch_model-0000(…):  37%|###6      | 1.81G/4.91G [00:03<00:04, 742MB/s]transformer/diffusion_pytorch_model-0000(…):  41%|####1     | 2.02G/4.91G [00:03<00:03, 888MB/s]transformer/diffusion_pytorch_model-0000(…):  41%|####1     | 2.02G/4.91G [00:03<00:03, 888MB/s]transformer/diffusion_pytorch_model-0000(…):  44%|####3     | 2.15G/4.91G [00:04<00:03, 829MB/s]transformer/diffusion_pytorch_model-0000(…):  44%|####3     | 2.15G/4.91G [00:04<00:03, 829MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####6     | 2.28G/4.91G [00:04<00:03, 839MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####6     | 2.28G/4.91G [00:04<00:03, 839MB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####9     | 2.42G/4.91G [00:04<00:03, 626MB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####9     | 2.42G/4.91G [00:04<00:03, 626MB/s]transformer/diffusion_pytorch_model-0000(…):  51%|#####     | 2.50G/4.91G [00:04<00:04, 542MB/s]transformer/diffusion_pytorch_model-0000(…):  51%|#####     | 2.50G/4.91G [00:04<00:04, 542MB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####3    | 2.63G/4.91G [00:05<00:03, 624MB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####3    | 2.63G/4.91G [00:05<00:03, 624MB/s]transformer/diffusion_pytorch_model-0000(…):  56%|#####6    | 2.76G/4.91G [00:05<00:03, 671MB/s]transformer/diffusion_pytorch_model-0000(…):  56%|#####6    | 2.76G/4.91G [00:05<00:03, 671MB/s]transformer/diffusion_pytorch_model-0000(…):  59%|#####9    | 2.90G/4.91G [00:05<00:02, 696MB/s]transformer/diffusion_pytorch_model-0000(…):  59%|#####9    | 2.90G/4.91G [00:05<00:02, 696MB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######1   | 3.03G/4.91G [00:05<00:02, 702MB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######1   | 3.03G/4.91G [00:05<00:02, 702MB/s]transformer/diffusion_pytorch_model-0000(…):  64%|######4   | 3.16G/4.91G [00:05<00:02, 756MB/s]transformer/diffusion_pytorch_model-0000(…):  64%|######4   | 3.16G/4.91G [00:05<00:02, 756MB/s]transformer/diffusion_pytorch_model-0000(…):  67%|######7   | 3.30G/4.91G [00:05<00:01, 818MB/s]transformer/diffusion_pytorch_model-0000(…):  67%|######7   | 3.30G/4.91G [00:05<00:01, 818MB/s]transformer/diffusion_pytorch_model-0000(…):  70%|######9   | 3.43G/4.91G [00:06<00:01, 848MB/s]transformer/diffusion_pytorch_model-0000(…):  70%|######9   | 3.43G/4.91G [00:06<00:01, 848MB/s]transformer/diffusion_pytorch_model-0000(…):  73%|#######2  | 3.57G/4.91G [00:06<00:01, 895MB/s]transformer/diffusion_pytorch_model-0000(…):  73%|#######2  | 3.57G/4.91G [00:06<00:01, 895MB/s]transformer/diffusion_pytorch_model-0000(…):  77%|#######6  | 3.77G/4.91G [00:06<00:01, 1.07GB/s]transformer/diffusion_pytorch_model-0000(…):  77%|#######6  | 3.77G/4.91G [00:06<00:01, 1.07GB/s]transformer/diffusion_pytorch_model-0000(…):  80%|#######9  | 3.90G/4.91G [00:06<00:00, 1.09GB/s]transformer/diffusion_pytorch_model-0000(…):  80%|#######9  | 3.90G/4.91G [00:06<00:00, 1.09GB/s]transformer/diffusion_pytorch_model-0000(…):  82%|########2 | 4.04G/4.91G [00:06<00:00, 1.12GB/s]transformer/diffusion_pytorch_model-0000(…):  82%|########2 | 4.04G/4.91G [00:06<00:00, 1.12GB/s]transformer/diffusion_pytorch_model-0000(…):  85%|########4 | 4.17G/4.91G [00:06<00:00, 1.16GB/s]transformer/diffusion_pytorch_model-0000(…):  85%|########4 | 4.17G/4.91G [00:06<00:00, 1.16GB/s]transformer/diffusion_pytorch_model-0000(…):  88%|########7 | 4.31G/4.91G [00:06<00:00, 1.19GB/s]transformer/diffusion_pytorch_model-0000(…):  88%|########7 | 4.31G/4.91G [00:06<00:00, 1.19GB/s]transformer/diffusion_pytorch_model-0000(…):  90%|######### | 4.44G/4.91G [00:06<00:00, 1.20GB/s]transformer/diffusion_pytorch_model-0000(…):  90%|######### | 4.44G/4.91G [00:06<00:00, 1.20GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.64G/4.91G [00:06<00:00, 1.27GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.64G/4.91G [00:06<00:00, 1.27GB/s]transformer/diffusion_pytorch_model-0000(…):  99%|#########8| 4.84G/4.91G [00:07<00:00, 1.30GB/s]transformer/diffusion_pytorch_model-0000(…):  99%|#########8| 4.84G/4.91G [00:07<00:00, 1.30GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.91G/4.91G [00:07<00:00, 685MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.91G/4.91G [00:07<00:00, 685MB/s] 
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.98G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.98G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 856k/4.98G [00:01<1:58:04, 703kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 856k/4.98G [00:01<1:58:04, 703kB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 67.9M/4.98G [00:01<01:35, 51.3MB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 67.9M/4.98G [00:01<01:35, 51.3MB/s]transformer/diffusion_pytorch_model-0000(…):   4%|4         | 204M/4.98G [00:02<00:40, 119MB/s]  transformer/diffusion_pytorch_model-0000(…):   4%|4         | 204M/4.98G [00:02<00:40, 119MB/s]  transformer/diffusion_pytorch_model-0000(…):  18%|#7        | 881M/4.98G [00:02<00:06, 615MB/s]transformer/diffusion_pytorch_model-0000(…):  18%|#7        | 881M/4.98G [00:02<00:06, 615MB/s]transformer/diffusion_pytorch_model-0000(…):  20%|##        | 1.01G/4.98G [00:02<00:06, 622MB/s]transformer/diffusion_pytorch_model-0000(…):  20%|##        | 1.01G/4.98G [00:02<00:06, 622MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.15G/4.98G [00:02<00:05, 653MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.15G/4.98G [00:02<00:05, 653MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.98G [00:03<00:08, 449MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.98G [00:03<00:08, 449MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.98G [00:03<00:07, 468MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.98G [00:03<00:07, 468MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###7      | 1.88G/4.98G [00:04<00:03, 809MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###7      | 1.88G/4.98G [00:04<00:03, 809MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####1     | 2.09G/4.98G [00:04<00:03, 951MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####1     | 2.09G/4.98G [00:04<00:03, 951MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####5     | 2.29G/4.98G [00:04<00:03, 851MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####5     | 2.29G/4.98G [00:04<00:03, 851MB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####8     | 2.42G/4.98G [00:04<00:03, 839MB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####8     | 2.42G/4.98G [00:04<00:03, 839MB/s]transformer/diffusion_pytorch_model-0000(…):  51%|#####1    | 2.56G/4.98G [00:04<00:03, 683MB/s]transformer/diffusion_pytorch_model-0000(…):  51%|#####1    | 2.56G/4.98G [00:04<00:03, 683MB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####3    | 2.69G/4.98G [00:05<00:03, 653MB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####3    | 2.69G/4.98G [00:05<00:03, 653MB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####6    | 2.82G/4.98G [00:05<00:03, 689MB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####6    | 2.82G/4.98G [00:05<00:03, 689MB/s]transformer/diffusion_pytorch_model-0000(…):  59%|#####9    | 2.96G/4.98G [00:05<00:02, 743MB/s]transformer/diffusion_pytorch_model-0000(…):  59%|#####9    | 2.96G/4.98G [00:05<00:02, 743MB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######2   | 3.09G/4.98G [00:05<00:02, 800MB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######2   | 3.09G/4.98G [00:05<00:02, 800MB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######4   | 3.23G/4.98G [00:05<00:02, 797MB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######4   | 3.23G/4.98G [00:05<00:02, 797MB/s]transformer/diffusion_pytorch_model-0000(…):  67%|######7   | 3.36G/4.98G [00:05<00:02, 783MB/s]transformer/diffusion_pytorch_model-0000(…):  67%|######7   | 3.36G/4.98G [00:05<00:02, 783MB/s]transformer/diffusion_pytorch_model-0000(…):  69%|######9   | 3.45G/4.98G [00:06<00:02, 736MB/s]transformer/diffusion_pytorch_model-0000(…):  69%|######9   | 3.45G/4.98G [00:06<00:02, 736MB/s]transformer/diffusion_pytorch_model-0000(…):  73%|#######3  | 3.65G/4.98G [00:06<00:01, 907MB/s]transformer/diffusion_pytorch_model-0000(…):  73%|#######3  | 3.65G/4.98G [00:06<00:01, 907MB/s]transformer/diffusion_pytorch_model-0000(…):  77%|#######7  | 3.85G/4.98G [00:06<00:01, 1.03GB/s]transformer/diffusion_pytorch_model-0000(…):  77%|#######7  | 3.85G/4.98G [00:06<00:01, 1.03GB/s]transformer/diffusion_pytorch_model-0000(…):  80%|#######9  | 3.98G/4.98G [00:06<00:00, 1.08GB/s]transformer/diffusion_pytorch_model-0000(…):  80%|#######9  | 3.98G/4.98G [00:06<00:00, 1.08GB/s]transformer/diffusion_pytorch_model-0000(…):  83%|########2 | 4.12G/4.98G [00:06<00:00, 1.13GB/s]transformer/diffusion_pytorch_model-0000(…):  83%|########2 | 4.12G/4.98G [00:06<00:00, 1.13GB/s]transformer/diffusion_pytorch_model-0000(…):  87%|########6 | 4.32G/4.98G [00:06<00:00, 1.20GB/s]transformer/diffusion_pytorch_model-0000(…):  87%|########6 | 4.32G/4.98G [00:06<00:00, 1.20GB/s]transformer/diffusion_pytorch_model-0000(…):  91%|######### | 4.52G/4.98G [00:06<00:00, 1.22GB/s]transformer/diffusion_pytorch_model-0000(…):  91%|######### | 4.52G/4.98G [00:06<00:00, 1.22GB/s]transformer/diffusion_pytorch_model-0000(…):  93%|#########3| 4.65G/4.98G [00:07<00:00, 1.23GB/s]transformer/diffusion_pytorch_model-0000(…):  93%|#########3| 4.65G/4.98G [00:07<00:00, 1.23GB/s]transformer/diffusion_pytorch_model-0000(…):  96%|#########5| 4.78G/4.98G [00:07<00:00, 1.25GB/s]transformer/diffusion_pytorch_model-0000(…):  96%|#########5| 4.78G/4.98G [00:07<00:00, 1.25GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:07<00:00, 1.27GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:07<00:00, 1.27GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:07<00:00, 687MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:07<00:00, 687MB/s] 
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/1.17G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/1.17G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 581k/1.17G [00:01<40:47, 478kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 581k/1.17G [00:01<40:47, 478kB/s]transformer/diffusion_pytorch_model-0000(…):   6%|5         | 67.7M/1.17G [00:01<00:22, 49.1MB/s]transformer/diffusion_pytorch_model-0000(…):   6%|5         | 67.7M/1.17G [00:01<00:22, 49.1MB/s]transformer/diffusion_pytorch_model-0000(…):  14%|#4        | 165M/1.17G [00:01<00:07, 126MB/s]  transformer/diffusion_pytorch_model-0000(…):  14%|#4        | 165M/1.17G [00:01<00:07, 126MB/s]  transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 367M/1.17G [00:02<00:02, 334MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 367M/1.17G [00:02<00:02, 334MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####8     | 568M/1.17G [00:02<00:01, 556MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####8     | 568M/1.17G [00:02<00:01, 556MB/s]transformer/diffusion_pytorch_model-0000(…):  66%|######5   | 769M/1.17G [00:02<00:00, 772MB/s]transformer/diffusion_pytorch_model-0000(…):  66%|######5   | 769M/1.17G [00:02<00:00, 772MB/s]transformer/diffusion_pytorch_model-0000(…):  83%|########2 | 970M/1.17G [00:02<00:00, 926MB/s]transformer/diffusion_pytorch_model-0000(…):  83%|########2 | 970M/1.17G [00:02<00:00, 926MB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 1.17G/1.17G [00:02<00:00, 958MB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 1.17G/1.17G [00:02<00:00, 958MB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 1.17G/1.17G [00:02<00:00, 452MB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 1.17G/1.17G [00:02<00:00, 452MB/s]
+
+Loading checkpoint shards:   0%|          | 0/9 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/9 [00:00<?, ?it/s]Loading checkpoint shards:  56%|#####5    | 5/9 [00:00<00:00, 42.10it/s]Loading checkpoint shards:  56%|#####5    | 5/9 [00:00<00:00, 42.10it/s]Loading checkpoint shards: 100%|##########| 9/9 [00:00<00:00, 48.72it/s]Loading checkpoint shards: 100%|##########| 9/9 [00:00<00:00, 48.72it/s]
+
+Quantizing Transformer
+ - quantizing 60 transformer blocks
+  0%|          | 0/60 [00:00<?, ?it/s]  0%|          | 0/60 [00:00<?, ?it/s]  2%|1         | 1/60 [00:00<00:42,  1.39it/s]  2%|1         | 1/60 [00:00<00:42,  1.39it/s]  3%|3         | 2/60 [00:01<00:36,  1.61it/s]  3%|3         | 2/60 [00:01<00:36,  1.61it/s]  5%|5         | 3/60 [00:02<00:38,  1.48it/s]  5%|5         | 3/60 [00:02<00:38,  1.48it/s]  7%|6         | 4/60 [00:02<00:34,  1.62it/s]  7%|6         | 4/60 [00:02<00:34,  1.62it/s]  8%|8         | 5/60 [00:03<00:33,  1.63it/s]  8%|8         | 5/60 [00:03<00:33,  1.63it/s] 10%|#         | 6/60 [00:03<00:29,  1.86it/s] 10%|#         | 6/60 [00:03<00:29,  1.86it/s] 12%|#1        | 7/60 [00:04<00:30,  1.75it/s] 12%|#1        | 7/60 [00:04<00:30,  1.75it/s] 13%|#3        | 8/60 [00:04<00:26,  1.95it/s] 13%|#3        | 8/60 [00:04<00:26,  1.95it/s] 15%|#5        | 9/60 [00:04<00:23,  2.17it/s] 15%|#5        | 9/60 [00:04<00:23,  2.17it/s] 17%|#6        | 10/60 [00:05<00:21,  2.35it/s] 17%|#6        | 10/60 [00:05<00:21,  2.35it/s] 18%|#8        | 11/60 [00:05<00:19,  2.49it/s] 18%|#8        | 11/60 [00:05<00:19,  2.49it/s] 20%|##        | 12/60 [00:05<00:18,  2.59it/s] 20%|##        | 12/60 [00:05<00:18,  2.59it/s] 22%|##1       | 13/60 [00:06<00:21,  2.21it/s] 22%|##1       | 13/60 [00:06<00:21,  2.21it/s] 23%|##3       | 14/60 [00:07<00:22,  2.01it/s] 23%|##3       | 14/60 [00:07<00:22,  2.01it/s] 25%|##5       | 15/60 [00:07<00:25,  1.76it/s] 25%|##5       | 15/60 [00:07<00:25,  1.76it/s] 27%|##6       | 16/60 [00:08<00:22,  1.95it/s] 27%|##6       | 16/60 [00:08<00:22,  1.95it/s] 28%|##8       | 17/60 [00:08<00:20,  2.09it/s] 28%|##8       | 17/60 [00:08<00:20,  2.09it/s] 30%|###       | 18/60 [00:09<00:21,  1.92it/s] 30%|###       | 18/60 [00:09<00:21,  1.92it/s] 32%|###1      | 19/60 [00:09<00:19,  2.10it/s] 32%|###1      | 19/60 [00:09<00:19,  2.10it/s] 33%|###3      | 20/60 [00:10<00:17,  2.23it/s] 33%|###3      | 20/60 [00:10<00:17,  2.23it/s] 35%|###5      | 21/60 [00:10<00:16,  2.43it/s] 35%|###5      | 21/60 [00:10<00:16,  2.43it/s] 37%|###6      | 22/60 [00:10<00:17,  2.22it/s] 37%|###6      | 22/60 [00:10<00:17,  2.22it/s] 38%|###8      | 23/60 [00:11<00:15,  2.41it/s] 38%|###8      | 23/60 [00:11<00:15,  2.41it/s] 40%|####      | 24/60 [00:11<00:13,  2.58it/s] 40%|####      | 24/60 [00:11<00:13,  2.58it/s] 42%|####1     | 25/60 [00:11<00:13,  2.68it/s] 42%|####1     | 25/60 [00:11<00:13,  2.68it/s] 43%|####3     | 26/60 [00:12<00:12,  2.76it/s] 43%|####3     | 26/60 [00:12<00:12,  2.76it/s] 45%|####5     | 27/60 [00:12<00:11,  2.90it/s] 45%|####5     | 27/60 [00:12<00:11,  2.90it/s] 47%|####6     | 28/60 [00:12<00:10,  3.00it/s] 47%|####6     | 28/60 [00:12<00:10,  3.00it/s] 48%|####8     | 29/60 [00:13<00:10,  3.08it/s] 48%|####8     | 29/60 [00:13<00:10,  3.08it/s] 50%|#####     | 30/60 [00:13<00:11,  2.64it/s] 50%|#####     | 30/60 [00:13<00:11,  2.64it/s] 52%|#####1    | 31/60 [00:14<00:10,  2.75it/s] 52%|#####1    | 31/60 [00:14<00:10,  2.75it/s] 53%|#####3    | 32/60 [00:14<00:09,  2.85it/s] 53%|#####3    | 32/60 [00:14<00:09,  2.85it/s] 55%|#####5    | 33/60 [00:14<00:09,  2.91it/s] 55%|#####5    | 33/60 [00:14<00:09,  2.91it/s] 57%|#####6    | 34/60 [00:14<00:08,  2.92it/s] 57%|#####6    | 34/60 [00:14<00:08,  2.92it/s] 58%|#####8    | 35/60 [00:15<00:08,  2.95it/s] 58%|#####8    | 35/60 [00:15<00:08,  2.95it/s] 60%|######    | 36/60 [00:15<00:08,  2.93it/s] 60%|######    | 36/60 [00:15<00:08,  2.93it/s] 62%|######1   | 37/60 [00:16<00:09,  2.43it/s] 62%|######1   | 37/60 [00:16<00:09,  2.43it/s] 63%|######3   | 38/60 [00:16<00:09,  2.43it/s] 63%|######3   | 38/60 [00:16<00:09,  2.43it/s] 65%|######5   | 39/60 [00:17<00:08,  2.43it/s] 65%|######5   | 39/60 [00:17<00:08,  2.43it/s] 67%|######6   | 40/60 [00:17<00:07,  2.51it/s] 67%|######6   | 40/60 [00:17<00:07,  2.51it/s] 68%|######8   | 41/60 [00:17<00:07,  2.59it/s] 68%|######8   | 41/60 [00:17<00:07,  2.59it/s] 70%|#######   | 42/60 [00:18<00:06,  2.69it/s] 70%|#######   | 42/60 [00:18<00:06,  2.69it/s] 72%|#######1  | 43/60 [00:18<00:06,  2.79it/s] 72%|#######1  | 43/60 [00:18<00:06,  2.79it/s] 73%|#######3  | 44/60 [00:18<00:06,  2.50it/s] 73%|#######3  | 44/60 [00:18<00:06,  2.50it/s] 75%|#######5  | 45/60 [00:19<00:05,  2.61it/s] 75%|#######5  | 45/60 [00:19<00:05,  2.61it/s] 77%|#######6  | 46/60 [00:19<00:05,  2.72it/s] 77%|#######6  | 46/60 [00:19<00:05,  2.72it/s] 78%|#######8  | 47/60 [00:20<00:04,  2.68it/s] 78%|#######8  | 47/60 [00:20<00:04,  2.68it/s] 80%|########  | 48/60 [00:20<00:04,  2.65it/s] 80%|########  | 48/60 [00:20<00:04,  2.65it/s] 82%|########1 | 49/60 [00:20<00:04,  2.71it/s] 82%|########1 | 49/60 [00:20<00:04,  2.71it/s] 83%|########3 | 50/60 [00:21<00:03,  2.70it/s] 83%|########3 | 50/60 [00:21<00:03,  2.70it/s] 85%|########5 | 51/60 [00:21<00:03,  2.33it/s] 85%|########5 | 51/60 [00:21<00:03,  2.33it/s] 87%|########6 | 52/60 [00:22<00:03,  2.42it/s] 87%|########6 | 52/60 [00:22<00:03,  2.42it/s] 88%|########8 | 53/60 [00:22<00:02,  2.57it/s] 88%|########8 | 53/60 [00:22<00:02,  2.57it/s] 90%|######### | 54/60 [00:22<00:02,  2.76it/s] 90%|######### | 54/60 [00:22<00:02,  2.76it/s] 92%|#########1| 55/60 [00:23<00:01,  2.87it/s] 92%|#########1| 55/60 [00:23<00:01,  2.87it/s] 93%|#########3| 56/60 [00:23<00:01,  2.95it/s] 93%|#########3| 56/60 [00:23<00:01,  2.95it/s] 95%|#########5| 57/60 [00:23<00:00,  3.04it/s] 95%|#########5| 57/60 [00:23<00:00,  3.04it/s] 97%|#########6| 58/60 [00:23<00:00,  3.03it/s] 97%|#########6| 58/60 [00:23<00:00,  3.03it/s] 98%|#########8| 59/60 [00:24<00:00,  2.50it/s] 98%|#########8| 59/60 [00:24<00:00,  2.50it/s]100%|##########| 60/60 [00:24<00:00,  2.68it/s]100%|##########| 60/60 [00:24<00:00,  2.68it/s]100%|##########| 60/60 [00:24<00:00,  2.41it/s]100%|##########| 60/60 [00:24<00:00,  2.41it/s]
+
+ - quantizing extras
+Moving transformer to CPU
+Text Encoder
+tokenizer_config.json: 0.00B [00:00, ?B/s]tokenizer_config.json: 0.00B [00:00, ?B/s]tokenizer_config.json: 4.69kB [00:00, 26.4MB/s]tokenizer_config.json: 4.69kB [00:00, 26.4MB/s]
+
+vocab.json: 0.00B [00:00, ?B/s]vocab.json: 0.00B [00:00, ?B/s]vocab.json: 3.38MB [00:00, 138MB/s]vocab.json: 3.38MB [00:00, 138MB/s]
+
+merges.txt: 0.00B [00:00, ?B/s]merges.txt: 0.00B [00:00, ?B/s]merges.txt: 1.67MB [00:00, 189MB/s]merges.txt: 1.67MB [00:00, 189MB/s]
+
+added_tokens.json:   0%|          | 0.00/605 [00:00<?, ?B/s]added_tokens.json:   0%|          | 0.00/605 [00:00<?, ?B/s]added_tokens.json: 100%|##########| 605/605 [00:00<00:00, 3.64MB/s]added_tokens.json: 100%|##########| 605/605 [00:00<00:00, 3.64MB/s]
+
+special_tokens_map.json:   0%|          | 0.00/613 [00:00<?, ?B/s]special_tokens_map.json:   0%|          | 0.00/613 [00:00<?, ?B/s]special_tokens_map.json: 100%|##########| 613/613 [00:00<00:00, 5.64MB/s]special_tokens_map.json: 100%|##########| 613/613 [00:00<00:00, 5.64MB/s]
+
+chat_template.jinja: 0.00B [00:00, ?B/s]chat_template.jinja: 0.00B [00:00, ?B/s]chat_template.jinja: 2.43kB [00:00, 10.1MB/s]chat_template.jinja: 2.43kB [00:00, 10.1MB/s]
+
+config.json: 0.00B [00:00, ?B/s]config.json: 0.00B [00:00, ?B/s]config.json: 3.22kB [00:00, 21.1MB/s]config.json: 3.22kB [00:00, 21.1MB/s]
+
+model.safetensors.index.json: 0.00B [00:00, ?B/s]model.safetensors.index.json: 0.00B [00:00, ?B/s]model.safetensors.index.json: 57.7kB [00:00, 99.8MB/s]model.safetensors.index.json: 57.7kB [00:00, 99.8MB/s]
+
+text_encoder/model-00001-of-00004.safete(…):   0%|          | 0.00/4.97G [00:00<?, ?B/s]text_encoder/model-00001-of-00004.safete(…):   0%|          | 0.00/4.97G [00:00<?, ?B/s]text_encoder/model-00001-of-00004.safete(…):   0%|          | 667k/4.97G [00:01<2:37:16, 526kB/s]text_encoder/model-00001-of-00004.safete(…):   0%|          | 667k/4.97G [00:01<2:37:16, 526kB/s]text_encoder/model-00001-of-00004.safete(…):   0%|          | 2.00M/4.97G [00:01<1:03:41, 1.30MB/s]text_encoder/model-00001-of-00004.safete(…):   0%|          | 2.00M/4.97G [00:01<1:03:41, 1.30MB/s]text_encoder/model-00001-of-00004.safete(…):   4%|4         | 203M/4.97G [00:02<00:31, 150MB/s]    text_encoder/model-00001-of-00004.safete(…):   4%|4         | 203M/4.97G [00:02<00:31, 150MB/s]    text_encoder/model-00001-of-00004.safete(…):   8%|8         | 404M/4.97G [00:02<00:14, 320MB/s]text_encoder/model-00001-of-00004.safete(…):   8%|8         | 404M/4.97G [00:02<00:14, 320MB/s]text_encoder/model-00001-of-00004.safete(…):  11%|#         | 538M/4.97G [00:02<00:11, 378MB/s]text_encoder/model-00001-of-00004.safete(…):  11%|#         | 538M/4.97G [00:02<00:11, 378MB/s]text_encoder/model-00001-of-00004.safete(…):  14%|#3        | 673M/4.97G [00:02<00:11, 388MB/s]text_encoder/model-00001-of-00004.safete(…):  14%|#3        | 673M/4.97G [00:02<00:11, 388MB/s]text_encoder/model-00001-of-00004.safete(…):  16%|#6        | 809M/4.97G [00:02<00:08, 480MB/s]text_encoder/model-00001-of-00004.safete(…):  16%|#6        | 809M/4.97G [00:02<00:08, 480MB/s]text_encoder/model-00001-of-00004.safete(…):  19%|#8        | 943M/4.97G [00:03<00:06, 598MB/s]text_encoder/model-00001-of-00004.safete(…):  19%|#8        | 943M/4.97G [00:03<00:06, 598MB/s]text_encoder/model-00001-of-00004.safete(…):  22%|##1       | 1.08G/4.97G [00:03<00:05, 664MB/s]text_encoder/model-00001-of-00004.safete(…):  22%|##1       | 1.08G/4.97G [00:03<00:05, 664MB/s]text_encoder/model-00001-of-00004.safete(…):  24%|##4       | 1.22G/4.97G [00:03<00:05, 649MB/s]text_encoder/model-00001-of-00004.safete(…):  24%|##4       | 1.22G/4.97G [00:03<00:05, 649MB/s]text_encoder/model-00001-of-00004.safete(…):  27%|##7       | 1.35G/4.97G [00:03<00:05, 626MB/s]text_encoder/model-00001-of-00004.safete(…):  27%|##7       | 1.35G/4.97G [00:03<00:05, 626MB/s]text_encoder/model-00001-of-00004.safete(…):  30%|##9       | 1.48G/4.97G [00:04<00:10, 339MB/s]text_encoder/model-00001-of-00004.safete(…):  30%|##9       | 1.48G/4.97G [00:04<00:10, 339MB/s]text_encoder/model-00001-of-00004.safete(…):  31%|###1      | 1.55G/4.97G [00:04<00:09, 354MB/s]text_encoder/model-00001-of-00004.safete(…):  31%|###1      | 1.55G/4.97G [00:04<00:09, 354MB/s]text_encoder/model-00001-of-00004.safete(…):  34%|###3      | 1.68G/4.97G [00:04<00:07, 420MB/s]text_encoder/model-00001-of-00004.safete(…):  34%|###3      | 1.68G/4.97G [00:04<00:07, 420MB/s]text_encoder/model-00001-of-00004.safete(…):  37%|###6      | 1.82G/4.97G [00:05<00:06, 481MB/s]text_encoder/model-00001-of-00004.safete(…):  37%|###6      | 1.82G/4.97G [00:05<00:06, 481MB/s]text_encoder/model-00001-of-00004.safete(…):  38%|###7      | 1.89G/4.97G [00:05<00:06, 491MB/s]text_encoder/model-00001-of-00004.safete(…):  38%|###7      | 1.89G/4.97G [00:05<00:06, 491MB/s]text_encoder/model-00001-of-00004.safete(…):  41%|####      | 2.02G/4.97G [00:05<00:05, 566MB/s]text_encoder/model-00001-of-00004.safete(…):  41%|####      | 2.02G/4.97G [00:05<00:05, 566MB/s]text_encoder/model-00001-of-00004.safete(…):  45%|####4     | 2.22G/4.97G [00:05<00:03, 750MB/s]text_encoder/model-00001-of-00004.safete(…):  45%|####4     | 2.22G/4.97G [00:05<00:03, 750MB/s]text_encoder/model-00001-of-00004.safete(…):  47%|####7     | 2.35G/4.97G [00:05<00:03, 846MB/s]text_encoder/model-00001-of-00004.safete(…):  47%|####7     | 2.35G/4.97G [00:05<00:03, 846MB/s]text_encoder/model-00001-of-00004.safete(…):  50%|#####     | 2.49G/4.97G [00:05<00:03, 824MB/s]text_encoder/model-00001-of-00004.safete(…):  50%|#####     | 2.49G/4.97G [00:05<00:03, 824MB/s]text_encoder/model-00001-of-00004.safete(…):  53%|#####2    | 2.62G/4.97G [00:05<00:03, 781MB/s]text_encoder/model-00001-of-00004.safete(…):  53%|#####2    | 2.62G/4.97G [00:05<00:03, 781MB/s]text_encoder/model-00001-of-00004.safete(…):  55%|#####5    | 2.76G/4.97G [00:06<00:02, 775MB/s]text_encoder/model-00001-of-00004.safete(…):  55%|#####5    | 2.76G/4.97G [00:06<00:02, 775MB/s]text_encoder/model-00001-of-00004.safete(…):  58%|#####8    | 2.89G/4.97G [00:06<00:02, 872MB/s]text_encoder/model-00001-of-00004.safete(…):  58%|#####8    | 2.89G/4.97G [00:06<00:02, 872MB/s]text_encoder/model-00001-of-00004.safete(…):  62%|######2   | 3.09G/4.97G [00:06<00:01, 1.01GB/s]text_encoder/model-00001-of-00004.safete(…):  62%|######2   | 3.09G/4.97G [00:06<00:01, 1.01GB/s]text_encoder/model-00001-of-00004.safete(…):  66%|######6   | 3.29G/4.97G [00:06<00:01, 1.10GB/s]text_encoder/model-00001-of-00004.safete(…):  66%|######6   | 3.29G/4.97G [00:06<00:01, 1.10GB/s]text_encoder/model-00001-of-00004.safete(…):  70%|#######   | 3.49G/4.97G [00:06<00:01, 1.13GB/s]text_encoder/model-00001-of-00004.safete(…):  70%|#######   | 3.49G/4.97G [00:06<00:01, 1.13GB/s]text_encoder/model-00001-of-00004.safete(…):  74%|#######4  | 3.69G/4.97G [00:06<00:01, 1.20GB/s]text_encoder/model-00001-of-00004.safete(…):  74%|#######4  | 3.69G/4.97G [00:06<00:01, 1.20GB/s]text_encoder/model-00001-of-00004.safete(…):  78%|#######8  | 3.89G/4.97G [00:07<00:00, 1.28GB/s]text_encoder/model-00001-of-00004.safete(…):  78%|#######8  | 3.89G/4.97G [00:07<00:00, 1.28GB/s]text_encoder/model-00001-of-00004.safete(…):  82%|########2 | 4.09G/4.97G [00:07<00:00, 1.30GB/s]text_encoder/model-00001-of-00004.safete(…):  82%|########2 | 4.09G/4.97G [00:07<00:00, 1.30GB/s]text_encoder/model-00001-of-00004.safete(…):  86%|########6 | 4.30G/4.97G [00:07<00:00, 1.33GB/s]text_encoder/model-00001-of-00004.safete(…):  86%|########6 | 4.30G/4.97G [00:07<00:00, 1.33GB/s]text_encoder/model-00001-of-00004.safete(…):  91%|######### | 4.50G/4.97G [00:07<00:00, 1.23GB/s]text_encoder/model-00001-of-00004.safete(…):  91%|######### | 4.50G/4.97G [00:07<00:00, 1.23GB/s]text_encoder/model-00001-of-00004.safete(…):  93%|#########3| 4.63G/4.97G [00:07<00:00, 1.16GB/s]text_encoder/model-00001-of-00004.safete(…):  93%|#########3| 4.63G/4.97G [00:07<00:00, 1.16GB/s]text_encoder/model-00001-of-00004.safete(…):  96%|#########5| 4.77G/4.97G [00:07<00:00, 1.19GB/s]text_encoder/model-00001-of-00004.safete(…):  96%|#########5| 4.77G/4.97G [00:07<00:00, 1.19GB/s]text_encoder/model-00001-of-00004.safete(…): 100%|##########| 4.97G/4.97G [00:07<00:00, 1.25GB/s]text_encoder/model-00001-of-00004.safete(…): 100%|##########| 4.97G/4.97G [00:07<00:00, 1.25GB/s]text_encoder/model-00001-of-00004.safete(…): 100%|##########| 4.97G/4.97G [00:07<00:00, 630MB/s] text_encoder/model-00001-of-00004.safete(…): 100%|##########| 4.97G/4.97G [00:07<00:00, 630MB/s] 
+
+text_encoder/model-00002-of-00004.safete(…):   0%|          | 0.00/4.99G [00:00<?, ?B/s]text_encoder/model-00002-of-00004.safete(…):   0%|          | 0.00/4.99G [00:00<?, ?B/s]text_encoder/model-00002-of-00004.safete(…):   0%|          | 681k/4.99G [00:00<1:48:35, 766kB/s]text_encoder/model-00002-of-00004.safete(…):   0%|          | 681k/4.99G [00:00<1:48:35, 766kB/s]text_encoder/model-00002-of-00004.safete(…):   1%|1         | 67.7M/4.99G [00:01<01:16, 64.4MB/s]text_encoder/model-00002-of-00004.safete(…):   1%|1         | 67.7M/4.99G [00:01<01:16, 64.4MB/s]text_encoder/model-00002-of-00004.safete(…):   4%|4         | 202M/4.99G [00:01<00:22, 211MB/s]  text_encoder/model-00002-of-00004.safete(…):   4%|4         | 202M/4.99G [00:01<00:22, 211MB/s]  text_encoder/model-00002-of-00004.safete(…):   5%|5         | 269M/4.99G [00:01<00:24, 191MB/s]text_encoder/model-00002-of-00004.safete(…):   5%|5         | 269M/4.99G [00:01<00:24, 191MB/s]text_encoder/model-00002-of-00004.safete(…):  12%|#2        | 608M/4.99G [00:01<00:07, 565MB/s]text_encoder/model-00002-of-00004.safete(…):  12%|#2        | 608M/4.99G [00:01<00:07, 565MB/s]text_encoder/model-00002-of-00004.safete(…):  15%|#4        | 745M/4.99G [00:02<00:07, 535MB/s]text_encoder/model-00002-of-00004.safete(…):  15%|#4        | 745M/4.99G [00:02<00:07, 535MB/s]text_encoder/model-00002-of-00004.safete(…):  18%|#7        | 879M/4.99G [00:02<00:08, 467MB/s]text_encoder/model-00002-of-00004.safete(…):  18%|#7        | 879M/4.99G [00:02<00:08, 467MB/s]text_encoder/model-00002-of-00004.safete(…):  22%|##1       | 1.08G/4.99G [00:02<00:05, 657MB/s]text_encoder/model-00002-of-00004.safete(…):  22%|##1       | 1.08G/4.99G [00:02<00:05, 657MB/s]text_encoder/model-00002-of-00004.safete(…):  24%|##4       | 1.21G/4.99G [00:03<00:06, 579MB/s]text_encoder/model-00002-of-00004.safete(…):  24%|##4       | 1.21G/4.99G [00:03<00:06, 579MB/s]text_encoder/model-00002-of-00004.safete(…):  28%|##8       | 1.42G/4.99G [00:03<00:04, 721MB/s]text_encoder/model-00002-of-00004.safete(…):  28%|##8       | 1.42G/4.99G [00:03<00:04, 721MB/s]text_encoder/model-00002-of-00004.safete(…):  31%|###       | 1.55G/4.99G [00:03<00:05, 585MB/s]text_encoder/model-00002-of-00004.safete(…):  31%|###       | 1.55G/4.99G [00:03<00:05, 585MB/s]text_encoder/model-00002-of-00004.safete(…):  39%|###9      | 1.95G/4.99G [00:03<00:02, 1.04GB/s]text_encoder/model-00002-of-00004.safete(…):  39%|###9      | 1.95G/4.99G [00:03<00:02, 1.04GB/s]text_encoder/model-00002-of-00004.safete(…):  43%|####3     | 2.15G/4.99G [00:03<00:02, 1.17GB/s]text_encoder/model-00002-of-00004.safete(…):  43%|####3     | 2.15G/4.99G [00:03<00:02, 1.17GB/s]text_encoder/model-00002-of-00004.safete(…):  47%|####7     | 2.35G/4.99G [00:03<00:02, 1.28GB/s]text_encoder/model-00002-of-00004.safete(…):  47%|####7     | 2.35G/4.99G [00:03<00:02, 1.28GB/s]text_encoder/model-00002-of-00004.safete(…):  51%|#####1    | 2.55G/4.99G [00:04<00:01, 1.41GB/s]text_encoder/model-00002-of-00004.safete(…):  51%|#####1    | 2.55G/4.99G [00:04<00:01, 1.41GB/s]text_encoder/model-00002-of-00004.safete(…):  55%|#####5    | 2.75G/4.99G [00:04<00:01, 1.50GB/s]text_encoder/model-00002-of-00004.safete(…):  55%|#####5    | 2.75G/4.99G [00:04<00:01, 1.50GB/s]text_encoder/model-00002-of-00004.safete(…):  59%|#####9    | 2.95G/4.99G [00:04<00:01, 1.57GB/s]text_encoder/model-00002-of-00004.safete(…):  59%|#####9    | 2.95G/4.99G [00:04<00:01, 1.57GB/s]text_encoder/model-00002-of-00004.safete(…):  64%|######3   | 3.18G/4.99G [00:04<00:01, 1.40GB/s]text_encoder/model-00002-of-00004.safete(…):  64%|######3   | 3.18G/4.99G [00:04<00:01, 1.40GB/s]text_encoder/model-00002-of-00004.safete(…):  68%|######7   | 3.38G/4.99G [00:04<00:01, 1.33GB/s]text_encoder/model-00002-of-00004.safete(…):  68%|######7   | 3.38G/4.99G [00:04<00:01, 1.33GB/s]text_encoder/model-00002-of-00004.safete(…):  72%|#######1  | 3.59G/4.99G [00:04<00:01, 1.25GB/s]text_encoder/model-00002-of-00004.safete(…):  72%|#######1  | 3.59G/4.99G [00:04<00:01, 1.25GB/s]text_encoder/model-00002-of-00004.safete(…):  76%|#######5  | 3.79G/4.99G [00:04<00:00, 1.30GB/s]text_encoder/model-00002-of-00004.safete(…):  76%|#######5  | 3.79G/4.99G [00:04<00:00, 1.30GB/s]text_encoder/model-00002-of-00004.safete(…):  80%|#######9  | 3.99G/4.99G [00:05<00:00, 1.42GB/s]text_encoder/model-00002-of-00004.safete(…):  80%|#######9  | 3.99G/4.99G [00:05<00:00, 1.42GB/s]text_encoder/model-00002-of-00004.safete(…):  84%|########3 | 4.19G/4.99G [00:05<00:00, 1.20GB/s]text_encoder/model-00002-of-00004.safete(…):  84%|########3 | 4.19G/4.99G [00:05<00:00, 1.20GB/s]text_encoder/model-00002-of-00004.safete(…):  88%|########7 | 4.39G/4.99G [00:05<00:00, 1.31GB/s]text_encoder/model-00002-of-00004.safete(…):  88%|########7 | 4.39G/4.99G [00:05<00:00, 1.31GB/s]text_encoder/model-00002-of-00004.safete(…):  92%|#########1| 4.59G/4.99G [00:05<00:00, 1.37GB/s]text_encoder/model-00002-of-00004.safete(…):  92%|#########1| 4.59G/4.99G [00:05<00:00, 1.37GB/s]text_encoder/model-00002-of-00004.safete(…):  96%|#########5| 4.79G/4.99G [00:05<00:00, 1.26GB/s]text_encoder/model-00002-of-00004.safete(…):  96%|#########5| 4.79G/4.99G [00:05<00:00, 1.26GB/s]text_encoder/model-00002-of-00004.safete(…): 100%|##########| 4.99G/4.99G [00:05<00:00, 1.29GB/s]text_encoder/model-00002-of-00004.safete(…): 100%|##########| 4.99G/4.99G [00:05<00:00, 1.29GB/s]text_encoder/model-00002-of-00004.safete(…): 100%|##########| 4.99G/4.99G [00:05<00:00, 849MB/s] text_encoder/model-00002-of-00004.safete(…): 100%|##########| 4.99G/4.99G [00:05<00:00, 849MB/s] 
+
+text_encoder/model-00003-of-00004.safete(…):   0%|          | 0.00/4.93G [00:00<?, ?B/s]text_encoder/model-00003-of-00004.safete(…):   0%|          | 0.00/4.93G [00:00<?, ?B/s]text_encoder/model-00003-of-00004.safete(…):   0%|          | 911k/4.93G [00:00<1:03:27, 1.30MB/s]text_encoder/model-00003-of-00004.safete(…):   0%|          | 911k/4.93G [00:00<1:03:27, 1.30MB/s]text_encoder/model-00003-of-00004.safete(…):   0%|          | 2.65M/4.93G [00:01<29:14, 2.81MB/s] text_encoder/model-00003-of-00004.safete(…):   0%|          | 2.65M/4.93G [00:01<29:14, 2.81MB/s] text_encoder/model-00003-of-00004.safete(…):   3%|2         | 137M/4.93G [00:01<00:27, 174MB/s]  text_encoder/model-00003-of-00004.safete(…):   3%|2         | 137M/4.93G [00:01<00:27, 174MB/s]  text_encoder/model-00003-of-00004.safete(…):   4%|4         | 204M/4.93G [00:01<00:25, 188MB/s]text_encoder/model-00003-of-00004.safete(…):   4%|4         | 204M/4.93G [00:01<00:25, 188MB/s]text_encoder/model-00003-of-00004.safete(…):  11%|#         | 541M/4.93G [00:01<00:06, 633MB/s]text_encoder/model-00003-of-00004.safete(…):  11%|#         | 541M/4.93G [00:01<00:06, 633MB/s]text_encoder/model-00003-of-00004.safete(…):  14%|#3        | 676M/4.93G [00:01<00:06, 643MB/s]text_encoder/model-00003-of-00004.safete(…):  14%|#3        | 676M/4.93G [00:01<00:06, 643MB/s]text_encoder/model-00003-of-00004.safete(…):  16%|#6        | 810M/4.93G [00:02<00:05, 705MB/s]text_encoder/model-00003-of-00004.safete(…):  16%|#6        | 810M/4.93G [00:02<00:05, 705MB/s]text_encoder/model-00003-of-00004.safete(…):  19%|#9        | 944M/4.93G [00:02<00:05, 778MB/s]text_encoder/model-00003-of-00004.safete(…):  19%|#9        | 944M/4.93G [00:02<00:05, 778MB/s]text_encoder/model-00003-of-00004.safete(…):  22%|##1       | 1.08G/4.93G [00:02<00:06, 561MB/s]text_encoder/model-00003-of-00004.safete(…):  22%|##1       | 1.08G/4.93G [00:02<00:06, 561MB/s]text_encoder/model-00003-of-00004.safete(…):  25%|##4       | 1.21G/4.93G [00:03<00:09, 395MB/s]text_encoder/model-00003-of-00004.safete(…):  25%|##4       | 1.21G/4.93G [00:03<00:09, 395MB/s]text_encoder/model-00003-of-00004.safete(…):  27%|##7       | 1.35G/4.93G [00:03<00:07, 497MB/s]text_encoder/model-00003-of-00004.safete(…):  27%|##7       | 1.35G/4.93G [00:03<00:07, 497MB/s]text_encoder/model-00003-of-00004.safete(…):  30%|###       | 1.48G/4.93G [00:03<00:09, 373MB/s]text_encoder/model-00003-of-00004.safete(…):  30%|###       | 1.48G/4.93G [00:03<00:09, 373MB/s]text_encoder/model-00003-of-00004.safete(…):  41%|####      | 2.02G/4.93G [00:03<00:03, 898MB/s]text_encoder/model-00003-of-00004.safete(…):  41%|####      | 2.02G/4.93G [00:03<00:03, 898MB/s]text_encoder/model-00003-of-00004.safete(…):  45%|####5     | 2.22G/4.93G [00:04<00:02, 1.01GB/s]text_encoder/model-00003-of-00004.safete(…):  45%|####5     | 2.22G/4.93G [00:04<00:02, 1.01GB/s]text_encoder/model-00003-of-00004.safete(…):  49%|####9     | 2.42G/4.93G [00:04<00:02, 1.09GB/s]text_encoder/model-00003-of-00004.safete(…):  49%|####9     | 2.42G/4.93G [00:04<00:02, 1.09GB/s]text_encoder/model-00003-of-00004.safete(…):  53%|#####3    | 2.62G/4.93G [00:04<00:01, 1.23GB/s]text_encoder/model-00003-of-00004.safete(…):  53%|#####3    | 2.62G/4.93G [00:04<00:01, 1.23GB/s]text_encoder/model-00003-of-00004.safete(…):  57%|#####7    | 2.82G/4.93G [00:04<00:01, 1.32GB/s]text_encoder/model-00003-of-00004.safete(…):  57%|#####7    | 2.82G/4.93G [00:04<00:01, 1.32GB/s]text_encoder/model-00003-of-00004.safete(…):  61%|######1   | 3.02G/4.93G [00:04<00:01, 1.45GB/s]text_encoder/model-00003-of-00004.safete(…):  61%|######1   | 3.02G/4.93G [00:04<00:01, 1.45GB/s]text_encoder/model-00003-of-00004.safete(…):  65%|######5   | 3.22G/4.93G [00:04<00:01, 1.51GB/s]text_encoder/model-00003-of-00004.safete(…):  65%|######5   | 3.22G/4.93G [00:04<00:01, 1.51GB/s]text_encoder/model-00003-of-00004.safete(…):  69%|######9   | 3.42G/4.93G [00:04<00:01, 1.33GB/s]text_encoder/model-00003-of-00004.safete(…):  69%|######9   | 3.42G/4.93G [00:04<00:01, 1.33GB/s]text_encoder/model-00003-of-00004.safete(…):  73%|#######3  | 3.62G/4.93G [00:04<00:00, 1.42GB/s]text_encoder/model-00003-of-00004.safete(…):  73%|#######3  | 3.62G/4.93G [00:04<00:00, 1.42GB/s]text_encoder/model-00003-of-00004.safete(…):  78%|#######7  | 3.83G/4.93G [00:05<00:00, 1.44GB/s]text_encoder/model-00003-of-00004.safete(…):  78%|#######7  | 3.83G/4.93G [00:05<00:00, 1.44GB/s]text_encoder/model-00003-of-00004.safete(…):  82%|########1 | 4.03G/4.93G [00:05<00:00, 1.51GB/s]text_encoder/model-00003-of-00004.safete(…):  82%|########1 | 4.03G/4.93G [00:05<00:00, 1.51GB/s]text_encoder/model-00003-of-00004.safete(…):  86%|########5 | 4.22G/4.93G [00:05<00:00, 1.55GB/s]text_encoder/model-00003-of-00004.safete(…):  86%|########5 | 4.22G/4.93G [00:05<00:00, 1.55GB/s]text_encoder/model-00003-of-00004.safete(…):  89%|########9 | 4.40G/4.93G [00:05<00:00, 1.58GB/s]text_encoder/model-00003-of-00004.safete(…):  89%|########9 | 4.40G/4.93G [00:05<00:00, 1.58GB/s]text_encoder/model-00003-of-00004.safete(…):  93%|#########3| 4.60G/4.93G [00:05<00:00, 1.39GB/s]text_encoder/model-00003-of-00004.safete(…):  93%|#########3| 4.60G/4.93G [00:05<00:00, 1.39GB/s]text_encoder/model-00003-of-00004.safete(…):  97%|#########7| 4.80G/4.93G [00:05<00:00, 1.47GB/s]text_encoder/model-00003-of-00004.safete(…):  97%|#########7| 4.80G/4.93G [00:05<00:00, 1.47GB/s]text_encoder/model-00003-of-00004.safete(…): 100%|##########| 4.93G/4.93G [00:05<00:00, 846MB/s] text_encoder/model-00003-of-00004.safete(…): 100%|##########| 4.93G/4.93G [00:05<00:00, 846MB/s] 
+
+text_encoder/model-00004-of-00004.safete(…):   0%|          | 0.00/1.69G [00:00<?, ?B/s]text_encoder/model-00004-of-00004.safete(…):   0%|          | 0.00/1.69G [00:00<?, ?B/s]text_encoder/model-00004-of-00004.safete(…):   0%|          | 651k/1.69G [00:00<31:03, 908kB/s]text_encoder/model-00004-of-00004.safete(…):   0%|          | 651k/1.69G [00:00<31:03, 908kB/s]text_encoder/model-00004-of-00004.safete(…):   1%|          | 15.9M/1.69G [00:01<01:31, 18.3MB/s]text_encoder/model-00004-of-00004.safete(…):   1%|          | 15.9M/1.69G [00:01<01:31, 18.3MB/s]text_encoder/model-00004-of-00004.safete(…):   5%|4         | 83.0M/1.69G [00:01<00:15, 102MB/s] text_encoder/model-00004-of-00004.safete(…):   5%|4         | 83.0M/1.69G [00:01<00:15, 102MB/s] text_encoder/model-00004-of-00004.safete(…):   9%|8         | 150M/1.69G [00:01<00:08, 178MB/s] text_encoder/model-00004-of-00004.safete(…):   9%|8         | 150M/1.69G [00:01<00:08, 178MB/s] text_encoder/model-00004-of-00004.safete(…):  17%|#6        | 284M/1.69G [00:01<00:03, 372MB/s]text_encoder/model-00004-of-00004.safete(…):  17%|#6        | 284M/1.69G [00:01<00:03, 372MB/s]text_encoder/model-00004-of-00004.safete(…):  29%|##8       | 485M/1.69G [00:01<00:01, 653MB/s]text_encoder/model-00004-of-00004.safete(…):  29%|##8       | 485M/1.69G [00:01<00:01, 653MB/s]text_encoder/model-00004-of-00004.safete(…):  37%|###6      | 619M/1.69G [00:01<00:01, 788MB/s]text_encoder/model-00004-of-00004.safete(…):  37%|###6      | 619M/1.69G [00:01<00:01, 788MB/s]text_encoder/model-00004-of-00004.safete(…):  45%|####4     | 754M/1.69G [00:01<00:01, 881MB/s]text_encoder/model-00004-of-00004.safete(…):  45%|####4     | 754M/1.69G [00:01<00:01, 881MB/s]text_encoder/model-00004-of-00004.safete(…):  52%|#####2    | 888M/1.69G [00:01<00:00, 907MB/s]text_encoder/model-00004-of-00004.safete(…):  52%|#####2    | 888M/1.69G [00:01<00:00, 907MB/s]text_encoder/model-00004-of-00004.safete(…):  60%|######    | 1.02G/1.69G [00:02<00:00, 786MB/s]text_encoder/model-00004-of-00004.safete(…):  60%|######    | 1.02G/1.69G [00:02<00:00, 786MB/s]text_encoder/model-00004-of-00004.safete(…):  68%|######8   | 1.16G/1.69G [00:02<00:00, 881MB/s]text_encoder/model-00004-of-00004.safete(…):  68%|######8   | 1.16G/1.69G [00:02<00:00, 881MB/s]text_encoder/model-00004-of-00004.safete(…):  80%|########  | 1.36G/1.69G [00:02<00:00, 1.03GB/s]text_encoder/model-00004-of-00004.safete(…):  80%|########  | 1.36G/1.69G [00:02<00:00, 1.03GB/s]text_encoder/model-00004-of-00004.safete(…):  88%|########8 | 1.49G/1.69G [00:02<00:00, 953MB/s] text_encoder/model-00004-of-00004.safete(…):  88%|########8 | 1.49G/1.69G [00:02<00:00, 953MB/s] text_encoder/model-00004-of-00004.safete(…):  96%|#########6| 1.62G/1.69G [00:02<00:00, 959MB/s]text_encoder/model-00004-of-00004.safete(…):  96%|#########6| 1.62G/1.69G [00:02<00:00, 959MB/s]text_encoder/model-00004-of-00004.safete(…): 100%|##########| 1.69G/1.69G [00:02<00:00, 599MB/s]text_encoder/model-00004-of-00004.safete(…): 100%|##########| 1.69G/1.69G [00:02<00:00, 599MB/s]
+
+Loading checkpoint shards:   0%|          | 0/4 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/4 [00:00<?, ?it/s]Loading checkpoint shards:  50%|#####     | 2/4 [00:00<00:00, 18.68it/s]Loading checkpoint shards:  50%|#####     | 2/4 [00:00<00:00, 18.68it/s]Loading checkpoint shards: 100%|##########| 4/4 [00:00<00:00, 31.95it/s]Loading checkpoint shards: 100%|##########| 4/4 [00:00<00:00, 31.95it/s]
+
+generation_config.json:   0%|          | 0.00/244 [00:00<?, ?B/s]generation_config.json:   0%|          | 0.00/244 [00:00<?, ?B/s]generation_config.json: 100%|##########| 244/244 [00:00<00:00, 3.14MB/s]generation_config.json: 100%|##########| 244/244 [00:00<00:00, 3.14MB/s]
+
+Quantizing Text Encoder
+Loading VAE
+config.json:   0%|          | 0.00/730 [00:00<?, ?B/s]config.json:   0%|          | 0.00/730 [00:00<?, ?B/s]config.json: 100%|##########| 730/730 [00:00<00:00, 8.34MB/s]config.json: 100%|##########| 730/730 [00:00<00:00, 8.34MB/s]
+
+vae/diffusion_pytorch_model.safetensors:   0%|          | 0.00/254M [00:00<?, ?B/s]vae/diffusion_pytorch_model.safetensors:   0%|          | 0.00/254M [00:00<?, ?B/s]vae/diffusion_pytorch_model.safetensors:  21%|##        | 52.5M/254M [00:00<00:03, 62.1MB/s]vae/diffusion_pytorch_model.safetensors:  21%|##        | 52.5M/254M [00:00<00:03, 62.1MB/s]vae/diffusion_pytorch_model.safetensors:  47%|####7     | 120M/254M [00:00<00:00, 144MB/s]  vae/diffusion_pytorch_model.safetensors:  47%|####7     | 120M/254M [00:00<00:00, 144MB/s]  vae/diffusion_pytorch_model.safetensors: 100%|##########| 254M/254M [00:01<00:00, 310MB/s]vae/diffusion_pytorch_model.safetensors: 100%|##########| 254M/254M [00:01<00:00, 310MB/s]vae/diffusion_pytorch_model.safetensors: 100%|##########| 254M/254M [00:01<00:00, 223MB/s]vae/diffusion_pytorch_model.safetensors: 100%|##########| 254M/254M [00:01<00:00, 223MB/s]
+
+Making pipe
+Preparing Model
+Model Loaded
+create LoRA network. base dim (rank): 32, alpha: 32
+neuron dropout: p=None, rank dropout: p=None, module dropout: p=None
+apply LoRA to Conv2d with kernel size (3,3). dim (rank): 16, alpha: 16
+create LoRA for Text Encoder: 0 modules.
+create LoRA for U-Net: 840 modules.
+enable LoRA for U-Net
+Dataset: /app/ai-toolkit/datasets/mind
+  -  Preprocessing image dimensions
+  0%|          | 0/10 [00:00<?, ?it/s]  0%|          | 0/10 [00:00<?, ?it/s] 40%|####      | 4/10 [00:00<00:00, 31.62it/s] 40%|####      | 4/10 [00:00<00:00, 31.62it/s] 80%|########  | 8/10 [00:00<00:00, 34.11it/s] 80%|########  | 8/10 [00:00<00:00, 34.11it/s]100%|##########| 10/10 [00:00<00:00, 34.41it/s]100%|##########| 10/10 [00:00<00:00, 34.41it/s]
+
+  -  Found 10 images
+Bucket sizes for /app/ai-toolkit/datasets/mind:
+512x512: 10 files
+1 buckets made
+Dataset: /app/ai-toolkit/datasets/mind
+  -  Preprocessing image dimensions
+  0%|          | 0/10 [00:00<?, ?it/s]  0%|          | 0/10 [00:00<?, ?it/s]100%|##########| 10/10 [00:00<00:00, 39869.81it/s]100%|##########| 10/10 [00:00<00:00, 39869.81it/s]
+
+  -  Found 10 images
+Bucket sizes for /app/ai-toolkit/datasets/mind:
+768x768: 10 files
+1 buckets made
+Dataset: /app/ai-toolkit/datasets/mind
+  -  Preprocessing image dimensions
+  0%|          | 0/10 [00:00<?, ?it/s]  0%|          | 0/10 [00:00<?, ?it/s]100%|##########| 10/10 [00:00<00:00, 42886.54it/s]100%|##########| 10/10 [00:00<00:00, 42886.54it/s]
+
+  -  Found 10 images
+Bucket sizes for /app/ai-toolkit/datasets/mind:
+1024x1024: 10 files
+1 buckets made
+Generating baseline samples before training
+Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:  50%|#####     | 1/2 [01:25<01:25, 85.47s/it]Generating Images:  50%|#####     | 1/2 [01:25<01:25, 85.47s/it]Generating Images: 100%|##########| 2/2 [02:52<00:00, 86.10s/it]Generating Images: 100%|##########| 2/2 [02:52<00:00, 86.10s/it]                                                                                                                                mindexpander_qwen_v1:   0%|          | 0/3000 [00:00<?, ?it/s]mindexpander_qwen_v1:   0%|          | 0/3000 [00:00<?, ?it/s]mindexpander_qwen_v1:   0%|          | 0/3000 [00:06<?, ?it/s, lr: 1.0e-04 loss: 3.642e-02]mindexpander_qwen_v1:   0%|          | 0/3000 [00:06<?, ?it/s, lr: 1.0e-04 loss: 3.642e-02]mindexpander_qwen_v1:   0%|          | 0/3000 [00:06<?, ?it/s, lr: 1.0e-04 loss: 3.642e-02]mindexpander_qwen_v1:   0%|          | 0/3000 [00:06<?, ?it/s, lr: 1.0e-04 loss: 3.642e-02]mindexpander_qwen_v1:   0%|          | 0/3000 [00:08<?, ?it/s, lr: 1.0e-04 loss: 2.133e-01]mindexpander_qwen_v1:   0%|          | 0/3000 [00:08<?, ?it/s, lr: 1.0e-04 loss: 2.133e-01]mindexpander_qwen_v1:   0%|          | 1/3000 [00:08<2:02:53,  2.46s/it, lr: 1.0e-04 loss: 2.133e-01]mindexpander_qwen_v1:   0%|          | 1/3000 [00:08<2:02:53,  2.46s/it, lr: 1.0e-04 loss: 2.133e-01]mindexpander_qwen_v1:   0%|          | 1/3000 [00:12<2:02:53,  2.46s/it, lr: 1.0e-04 loss: 2.885e-02]mindexpander_qwen_v1:   0%|          | 1/3000 [00:12<2:02:53,  2.46s/it, lr: 1.0e-04 loss: 2.885e-02]mindexpander_qwen_v1:   0%|          | 2/3000 [00:12<2:40:11,  3.21s/it, lr: 1.0e-04 loss: 2.885e-02]mindexpander_qwen_v1:   0%|          | 2/3000 [00:12<2:40:11,  3.21s/it, lr: 1.0e-04 loss: 2.885e-02]mindexpander_qwen_v1:   0%|          | 2/3000 [00:18<2:40:11,  3.21s/it, lr: 1.0e-04 loss: 6.116e-02]mindexpander_qwen_v1:   0%|          | 2/3000 [00:18<2:40:11,  3.21s/it, lr: 1.0e-04 loss: 6.116e-02]mindexpander_qwen_v1:   0%|          | 3/3000 [00:18<3:38:13,  4.37s/it, lr: 1.0e-04 loss: 6.116e-02]mindexpander_qwen_v1:   0%|          | 3/3000 [00:18<3:38:13,  4.37s/it, lr: 1.0e-04 loss: 6.116e-02]mindexpander_qwen_v1:   0%|          | 3/3000 [00:24<3:38:13,  4.37s/it, lr: 1.0e-04 loss: 1.865e-01]mindexpander_qwen_v1:   0%|          | 3/3000 [00:24<3:38:13,  4.37s/it, lr: 1.0e-04 loss: 1.865e-01]mindexpander_qwen_v1:   0%|          | 4/3000 [00:24<4:08:05,  4.97s/it, lr: 1.0e-04 loss: 1.865e-01]mindexpander_qwen_v1:   0%|          | 4/3000 [00:24<4:08:05,  4.97s/it, lr: 1.0e-04 loss: 1.865e-01]mindexpander_qwen_v1:   0%|          | 4/3000 [00:29<4:08:05,  4.97s/it, lr: 1.0e-04 loss: 4.061e-02]mindexpander_qwen_v1:   0%|          | 4/3000 [00:29<4:08:05,  4.97s/it, lr: 1.0e-04 loss: 4.061e-02]mindexpander_qwen_v1:   0%|          | 5/3000 [00:29<4:21:51,  5.25s/it, lr: 1.0e-04 loss: 4.061e-02]mindexpander_qwen_v1:   0%|          | 5/3000 [00:29<4:21:51,  5.25s/it, lr: 1.0e-04 loss: 4.061e-02]mindexpander_qwen_v1:   0%|          | 5/3000 [00:33<4:21:51,  5.25s/it, lr: 1.0e-04 loss: 3.495e-02]mindexpander_qwen_v1:   0%|          | 5/3000 [00:33<4:21:51,  5.25s/it, lr: 1.0e-04 loss: 3.495e-02]mindexpander_qwen_v1:   0%|          | 6/3000 [00:33<3:56:10,  4.73s/it, lr: 1.0e-04 loss: 3.495e-02]mindexpander_qwen_v1:   0%|          | 6/3000 [00:33<3:56:10,  4.73s/it, lr: 1.0e-04 loss: 3.495e-02]mindexpander_qwen_v1:   0%|          | 6/3000 [00:35<3:56:10,  4.73s/it, lr: 1.0e-04 loss: 1.930e-02]mindexpander_qwen_v1:   0%|          | 6/3000 [00:35<3:56:10,  4.73s/it, lr: 1.0e-04 loss: 1.930e-02]mindexpander_qwen_v1:   0%|          | 7/3000 [00:35<3:18:45,  3.98s/it, lr: 1.0e-04 loss: 1.930e-02]mindexpander_qwen_v1:   0%|          | 7/3000 [00:35<3:18:45,  3.98s/it, lr: 1.0e-04 loss: 1.930e-02]mindexpander_qwen_v1:   0%|          | 7/3000 [00:39<3:18:45,  3.98s/it, lr: 1.0e-04 loss: 8.531e-02]mindexpander_qwen_v1:   0%|          | 7/3000 [00:39<3:18:45,  3.98s/it, lr: 1.0e-04 loss: 8.531e-02]mindexpander_qwen_v1:   0%|          | 8/3000 [00:39<3:17:10,  3.95s/it, lr: 1.0e-04 loss: 8.531e-02]mindexpander_qwen_v1:   0%|          | 8/3000 [00:39<3:17:10,  3.95s/it, lr: 1.0e-04 loss: 8.531e-02]mindexpander_qwen_v1:   0%|          | 8/3000 [00:42<3:17:10,  3.95s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:   0%|          | 8/3000 [00:42<3:17:10,  3.95s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:   0%|          | 9/3000 [00:42<2:53:54,  3.49s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:   0%|          | 9/3000 [00:42<2:53:54,  3.49s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:   0%|          | 9/3000 [00:44<2:53:54,  3.49s/it, lr: 1.0e-04 loss: 1.698e-01]mindexpander_qwen_v1:   0%|          | 9/3000 [00:44<2:53:54,  3.49s/it, lr: 1.0e-04 loss: 1.698e-01]mindexpander_qwen_v1:   0%|          | 10/3000 [00:48<2:53:50,  3.49s/it, lr: 1.0e-04 loss: 1.627e-01]mindexpander_qwen_v1:   0%|          | 10/3000 [00:48<2:53:50,  3.49s/it, lr: 1.0e-04 loss: 1.627e-01]mindexpander_qwen_v1:   0%|          | 11/3000 [00:48<2:15:35,  2.72s/it, lr: 1.0e-04 loss: 1.627e-01]mindexpander_qwen_v1:   0%|          | 11/3000 [00:48<2:15:35,  2.72s/it, lr: 1.0e-04 loss: 1.627e-01]mindexpander_qwen_v1:   0%|          | 11/3000 [00:51<2:15:35,  2.72s/it, lr: 1.0e-04 loss: 5.127e-02]mindexpander_qwen_v1:   0%|          | 11/3000 [00:51<2:15:35,  2.72s/it, lr: 1.0e-04 loss: 5.127e-02]mindexpander_qwen_v1:   0%|          | 12/3000 [00:51<2:14:19,  2.70s/it, lr: 1.0e-04 loss: 5.127e-02]mindexpander_qwen_v1:   0%|          | 12/3000 [00:51<2:14:19,  2.70s/it, lr: 1.0e-04 loss: 5.127e-02]mindexpander_qwen_v1:   0%|          | 12/3000 [00:53<2:14:19,  2.70s/it, lr: 1.0e-04 loss: 1.562e-01]mindexpander_qwen_v1:   0%|          | 12/3000 [00:53<2:14:19,  2.70s/it, lr: 1.0e-04 loss: 1.562e-01]mindexpander_qwen_v1:   0%|          | 13/3000 [00:53<2:10:55,  2.63s/it, lr: 1.0e-04 loss: 1.562e-01]mindexpander_qwen_v1:   0%|          | 13/3000 [00:53<2:10:55,  2.63s/it, lr: 1.0e-04 loss: 1.562e-01]mindexpander_qwen_v1:   0%|          | 13/3000 [00:57<2:10:55,  2.63s/it, lr: 1.0e-04 loss: 2.065e-02]mindexpander_qwen_v1:   0%|          | 13/3000 [00:57<2:10:55,  2.63s/it, lr: 1.0e-04 loss: 2.065e-02]mindexpander_qwen_v1:   0%|          | 14/3000 [00:57<2:25:59,  2.93s/it, lr: 1.0e-04 loss: 2.065e-02]mindexpander_qwen_v1:   0%|          | 14/3000 [00:57<2:25:59,  2.93s/it, lr: 1.0e-04 loss: 2.065e-02]mindexpander_qwen_v1:   0%|          | 14/3000 [01:03<2:25:59,  2.93s/it, lr: 1.0e-04 loss: 9.014e-03]mindexpander_qwen_v1:   0%|          | 14/3000 [01:03<2:25:59,  2.93s/it, lr: 1.0e-04 loss: 9.014e-03]mindexpander_qwen_v1:   0%|          | 15/3000 [01:03<3:05:23,  3.73s/it, lr: 1.0e-04 loss: 9.014e-03]mindexpander_qwen_v1:   0%|          | 15/3000 [01:03<3:05:23,  3.73s/it, lr: 1.0e-04 loss: 9.014e-03]mindexpander_qwen_v1:   0%|          | 15/3000 [01:05<3:05:23,  3.73s/it, lr: 1.0e-04 loss: 1.322e-01]mindexpander_qwen_v1:   0%|          | 15/3000 [01:05<3:05:23,  3.73s/it, lr: 1.0e-04 loss: 1.322e-01]mindexpander_qwen_v1:   1%|          | 16/3000 [01:05<2:49:52,  3.42s/it, lr: 1.0e-04 loss: 1.322e-01]mindexpander_qwen_v1:   1%|          | 16/3000 [01:05<2:49:52,  3.42s/it, lr: 1.0e-04 loss: 1.322e-01]mindexpander_qwen_v1:   1%|          | 16/3000 [01:11<2:49:52,  3.42s/it, lr: 1.0e-04 loss: 1.557e-03]mindexpander_qwen_v1:   1%|          | 16/3000 [01:11<2:49:52,  3.42s/it, lr: 1.0e-04 loss: 1.557e-03]mindexpander_qwen_v1:   1%|          | 17/3000 [01:11<3:23:30,  4.09s/it, lr: 1.0e-04 loss: 1.557e-03]mindexpander_qwen_v1:   1%|          | 17/3000 [01:11<3:23:30,  4.09s/it, lr: 1.0e-04 loss: 1.557e-03]mindexpander_qwen_v1:   1%|          | 17/3000 [01:17<3:23:30,  4.09s/it, lr: 1.0e-04 loss: 1.681e-01]mindexpander_qwen_v1:   1%|          | 17/3000 [01:17<3:23:30,  4.09s/it, lr: 1.0e-04 loss: 1.681e-01]mindexpander_qwen_v1:   1%|          | 18/3000 [01:17<3:47:34,  4.58s/it, lr: 1.0e-04 loss: 1.681e-01]mindexpander_qwen_v1:   1%|          | 18/3000 [01:17<3:47:34,  4.58s/it, lr: 1.0e-04 loss: 1.681e-01]mindexpander_qwen_v1:   1%|          | 18/3000 [01:21<3:47:34,  4.58s/it, lr: 1.0e-04 loss: 1.174e-02]mindexpander_qwen_v1:   1%|          | 18/3000 [01:21<3:47:34,  4.58s/it, lr: 1.0e-04 loss: 1.174e-02]mindexpander_qwen_v1:   1%|          | 19/3000 [01:21<3:37:30,  4.38s/it, lr: 1.0e-04 loss: 1.174e-02]mindexpander_qwen_v1:   1%|          | 19/3000 [01:21<3:37:30,  4.38s/it, lr: 1.0e-04 loss: 1.174e-02]mindexpander_qwen_v1:   1%|          | 19/3000 [01:23<3:37:30,  4.38s/it, lr: 1.0e-04 loss: 1.270e-01]mindexpander_qwen_v1:   1%|          | 19/3000 [01:23<3:37:30,  4.38s/it, lr: 1.0e-04 loss: 1.270e-01]mindexpander_qwen_v1:   1%|          | 20/3000 [01:26<3:37:26,  4.38s/it, lr: 1.0e-04 loss: 7.639e-02]mindexpander_qwen_v1:   1%|          | 20/3000 [01:26<3:37:26,  4.38s/it, lr: 1.0e-04 loss: 7.639e-02]mindexpander_qwen_v1:   1%|          | 21/3000 [01:26<2:25:42,  2.93s/it, lr: 1.0e-04 loss: 7.639e-02]mindexpander_qwen_v1:   1%|          | 21/3000 [01:26<2:25:42,  2.93s/it, lr: 1.0e-04 loss: 7.639e-02]mindexpander_qwen_v1:   1%|          | 21/3000 [01:29<2:25:42,  2.93s/it, lr: 1.0e-04 loss: 1.583e-01]mindexpander_qwen_v1:   1%|          | 21/3000 [01:29<2:25:42,  2.93s/it, lr: 1.0e-04 loss: 1.583e-01]mindexpander_qwen_v1:   1%|          | 22/3000 [01:29<2:35:24,  3.13s/it, lr: 1.0e-04 loss: 1.583e-01]mindexpander_qwen_v1:   1%|          | 22/3000 [01:29<2:35:24,  3.13s/it, lr: 1.0e-04 loss: 1.583e-01]mindexpander_qwen_v1:   1%|          | 22/3000 [01:33<2:35:24,  3.13s/it, lr: 1.0e-04 loss: 3.418e-02]mindexpander_qwen_v1:   1%|          | 22/3000 [01:33<2:35:24,  3.13s/it, lr: 1.0e-04 loss: 3.418e-02]mindexpander_qwen_v1:   1%|          | 23/3000 [01:33<2:45:24,  3.33s/it, lr: 1.0e-04 loss: 3.418e-02]mindexpander_qwen_v1:   1%|          | 23/3000 [01:33<2:45:24,  3.33s/it, lr: 1.0e-04 loss: 3.418e-02]mindexpander_qwen_v1:   1%|          | 23/3000 [01:39<2:45:24,  3.33s/it, lr: 1.0e-04 loss: 1.416e-01]mindexpander_qwen_v1:   1%|          | 23/3000 [01:39<2:45:24,  3.33s/it, lr: 1.0e-04 loss: 1.416e-01]mindexpander_qwen_v1:   1%|          | 24/3000 [01:39<3:18:01,  3.99s/it, lr: 1.0e-04 loss: 1.416e-01]mindexpander_qwen_v1:   1%|          | 24/3000 [01:39<3:18:01,  3.99s/it, lr: 1.0e-04 loss: 1.416e-01]mindexpander_qwen_v1:   1%|          | 24/3000 [01:41<3:18:01,  3.99s/it, lr: 1.0e-04 loss: 1.206e-01]mindexpander_qwen_v1:   1%|          | 24/3000 [01:41<3:18:01,  3.99s/it, lr: 1.0e-04 loss: 1.206e-01]mindexpander_qwen_v1:   1%|          | 25/3000 [01:41<2:56:34,  3.56s/it, lr: 1.0e-04 loss: 1.206e-01]mindexpander_qwen_v1:   1%|          | 25/3000 [01:41<2:56:34,  3.56s/it, lr: 1.0e-04 loss: 1.206e-01]mindexpander_qwen_v1:   1%|          | 25/3000 [01:45<2:56:34,  3.56s/it, lr: 1.0e-04 loss: 2.940e-02]mindexpander_qwen_v1:   1%|          | 25/3000 [01:45<2:56:34,  3.56s/it, lr: 1.0e-04 loss: 2.940e-02]mindexpander_qwen_v1:   1%|          | 26/3000 [01:45<2:59:05,  3.61s/it, lr: 1.0e-04 loss: 2.940e-02]mindexpander_qwen_v1:   1%|          | 26/3000 [01:45<2:59:05,  3.61s/it, lr: 1.0e-04 loss: 2.940e-02]mindexpander_qwen_v1:   1%|          | 26/3000 [01:49<2:59:05,  3.61s/it, lr: 1.0e-04 loss: 7.688e-02]mindexpander_qwen_v1:   1%|          | 26/3000 [01:49<2:59:05,  3.61s/it, lr: 1.0e-04 loss: 7.688e-02]mindexpander_qwen_v1:   1%|          | 27/3000 [01:49<3:03:00,  3.69s/it, lr: 1.0e-04 loss: 7.688e-02]mindexpander_qwen_v1:   1%|          | 27/3000 [01:49<3:03:00,  3.69s/it, lr: 1.0e-04 loss: 7.688e-02]mindexpander_qwen_v1:   1%|          | 27/3000 [01:55<3:03:00,  3.69s/it, lr: 1.0e-04 loss: 1.245e-01]mindexpander_qwen_v1:   1%|          | 27/3000 [01:55<3:03:00,  3.69s/it, lr: 1.0e-04 loss: 1.245e-01]mindexpander_qwen_v1:   1%|          | 28/3000 [01:55<3:32:49,  4.30s/it, lr: 1.0e-04 loss: 1.245e-01]mindexpander_qwen_v1:   1%|          | 28/3000 [01:55<3:32:49,  4.30s/it, lr: 1.0e-04 loss: 1.245e-01]mindexpander_qwen_v1:   1%|          | 28/3000 [02:00<3:32:49,  4.30s/it, lr: 1.0e-04 loss: 2.652e-02]mindexpander_qwen_v1:   1%|          | 28/3000 [02:00<3:32:49,  4.30s/it, lr: 1.0e-04 loss: 2.652e-02]mindexpander_qwen_v1:   1%|          | 29/3000 [02:00<3:54:00,  4.73s/it, lr: 1.0e-04 loss: 2.652e-02]mindexpander_qwen_v1:   1%|          | 29/3000 [02:00<3:54:00,  4.73s/it, lr: 1.0e-04 loss: 2.652e-02]mindexpander_qwen_v1:   1%|          | 29/3000 [02:07<3:54:00,  4.73s/it, lr: 1.0e-04 loss: 5.667e-02]mindexpander_qwen_v1:   1%|          | 29/3000 [02:07<3:54:00,  4.73s/it, lr: 1.0e-04 loss: 5.667e-02]mindexpander_qwen_v1:   1%|1         | 30/3000 [02:09<3:53:55,  4.73s/it, lr: 1.0e-04 loss: 3.976e-02]mindexpander_qwen_v1:   1%|1         | 30/3000 [02:09<3:53:55,  4.73s/it, lr: 1.0e-04 loss: 3.976e-02]mindexpander_qwen_v1:   1%|1         | 31/3000 [02:09<2:37:31,  3.18s/it, lr: 1.0e-04 loss: 3.976e-02]mindexpander_qwen_v1:   1%|1         | 31/3000 [02:09<2:37:31,  3.18s/it, lr: 1.0e-04 loss: 3.976e-02]mindexpander_qwen_v1:   1%|1         | 31/3000 [02:12<2:37:31,  3.18s/it, lr: 1.0e-04 loss: 3.698e-02]mindexpander_qwen_v1:   1%|1         | 31/3000 [02:12<2:37:31,  3.18s/it, lr: 1.0e-04 loss: 3.698e-02]mindexpander_qwen_v1:   1%|1         | 32/3000 [02:12<2:28:29,  3.00s/it, lr: 1.0e-04 loss: 3.698e-02]mindexpander_qwen_v1:   1%|1         | 32/3000 [02:12<2:28:29,  3.00s/it, lr: 1.0e-04 loss: 3.698e-02]mindexpander_qwen_v1:   1%|1         | 32/3000 [02:15<2:28:29,  3.00s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:   1%|1         | 32/3000 [02:15<2:28:29,  3.00s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:   1%|1         | 33/3000 [02:15<2:37:52,  3.19s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:   1%|1         | 33/3000 [02:15<2:37:52,  3.19s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:   1%|1         | 33/3000 [02:19<2:37:52,  3.19s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:   1%|1         | 33/3000 [02:19<2:37:52,  3.19s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:   1%|1         | 34/3000 [02:19<2:45:05,  3.34s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:   1%|1         | 34/3000 [02:19<2:45:05,  3.34s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:   1%|1         | 34/3000 [02:22<2:45:05,  3.34s/it, lr: 1.0e-04 loss: 2.055e-01]mindexpander_qwen_v1:   1%|1         | 34/3000 [02:22<2:45:05,  3.34s/it, lr: 1.0e-04 loss: 2.055e-01]mindexpander_qwen_v1:   1%|1         | 35/3000 [02:22<2:35:12,  3.14s/it, lr: 1.0e-04 loss: 2.055e-01]mindexpander_qwen_v1:   1%|1         | 35/3000 [02:22<2:35:12,  3.14s/it, lr: 1.0e-04 loss: 2.055e-01]mindexpander_qwen_v1:   1%|1         | 35/3000 [02:26<2:35:12,  3.14s/it, lr: 1.0e-04 loss: 1.888e-01]mindexpander_qwen_v1:   1%|1         | 35/3000 [02:26<2:35:12,  3.14s/it, lr: 1.0e-04 loss: 1.888e-01]mindexpander_qwen_v1:   1%|1         | 36/3000 [02:26<2:43:28,  3.31s/it, lr: 1.0e-04 loss: 1.888e-01]mindexpander_qwen_v1:   1%|1         | 36/3000 [02:26<2:43:28,  3.31s/it, lr: 1.0e-04 loss: 1.888e-01]mindexpander_qwen_v1:   1%|1         | 36/3000 [02:28<2:43:28,  3.31s/it, lr: 1.0e-04 loss: 1.088e-01]mindexpander_qwen_v1:   1%|1         | 36/3000 [02:28<2:43:28,  3.31s/it, lr: 1.0e-04 loss: 1.088e-01]mindexpander_qwen_v1:   1%|1         | 37/3000 [02:28<2:31:02,  3.06s/it, lr: 1.0e-04 loss: 1.088e-01]mindexpander_qwen_v1:   1%|1         | 37/3000 [02:28<2:31:02,  3.06s/it, lr: 1.0e-04 loss: 1.088e-01]mindexpander_qwen_v1:   1%|1         | 37/3000 [02:32<2:31:02,  3.06s/it, lr: 1.0e-04 loss: 2.354e-02]mindexpander_qwen_v1:   1%|1         | 37/3000 [02:32<2:31:02,  3.06s/it, lr: 1.0e-04 loss: 2.354e-02]mindexpander_qwen_v1:   1%|1         | 38/3000 [02:32<2:40:42,  3.26s/it, lr: 1.0e-04 loss: 2.354e-02]mindexpander_qwen_v1:   1%|1         | 38/3000 [02:32<2:40:42,  3.26s/it, lr: 1.0e-04 loss: 2.354e-02]mindexpander_qwen_v1:   1%|1         | 38/3000 [02:34<2:40:42,  3.26s/it, lr: 1.0e-04 loss: 1.697e-01]mindexpander_qwen_v1:   1%|1         | 38/3000 [02:34<2:40:42,  3.26s/it, lr: 1.0e-04 loss: 1.697e-01]mindexpander_qwen_v1:   1%|1         | 39/3000 [02:34<2:31:35,  3.07s/it, lr: 1.0e-04 loss: 1.697e-01]mindexpander_qwen_v1:   1%|1         | 39/3000 [02:34<2:31:35,  3.07s/it, lr: 1.0e-04 loss: 1.697e-01]mindexpander_qwen_v1:   1%|1         | 39/3000 [02:38<2:31:35,  3.07s/it, lr: 1.0e-04 loss: 1.967e-01]mindexpander_qwen_v1:   1%|1         | 39/3000 [02:38<2:31:35,  3.07s/it, lr: 1.0e-04 loss: 1.967e-01]mindexpander_qwen_v1:   1%|1         | 40/3000 [02:42<2:31:32,  3.07s/it, lr: 1.0e-04 loss: 1.321e-01]mindexpander_qwen_v1:   1%|1         | 40/3000 [02:42<2:31:32,  3.07s/it, lr: 1.0e-04 loss: 1.321e-01]mindexpander_qwen_v1:   1%|1         | 41/3000 [02:42<2:04:18,  2.52s/it, lr: 1.0e-04 loss: 1.321e-01]mindexpander_qwen_v1:   1%|1         | 41/3000 [02:42<2:04:18,  2.52s/it, lr: 1.0e-04 loss: 1.321e-01]mindexpander_qwen_v1:   1%|1         | 41/3000 [02:48<2:04:18,  2.52s/it, lr: 1.0e-04 loss: 8.170e-02]mindexpander_qwen_v1:   1%|1         | 41/3000 [02:48<2:04:18,  2.52s/it, lr: 1.0e-04 loss: 8.170e-02]mindexpander_qwen_v1:   1%|1         | 42/3000 [02:48<2:45:08,  3.35s/it, lr: 1.0e-04 loss: 8.170e-02]mindexpander_qwen_v1:   1%|1         | 42/3000 [02:48<2:45:08,  3.35s/it, lr: 1.0e-04 loss: 8.170e-02]mindexpander_qwen_v1:   1%|1         | 42/3000 [02:51<2:45:08,  3.35s/it, lr: 1.0e-04 loss: 5.938e-02]mindexpander_qwen_v1:   1%|1         | 42/3000 [02:51<2:45:08,  3.35s/it, lr: 1.0e-04 loss: 5.938e-02]mindexpander_qwen_v1:   1%|1         | 43/3000 [02:51<2:50:02,  3.45s/it, lr: 1.0e-04 loss: 5.938e-02]mindexpander_qwen_v1:   1%|1         | 43/3000 [02:51<2:50:02,  3.45s/it, lr: 1.0e-04 loss: 5.938e-02]mindexpander_qwen_v1:   1%|1         | 43/3000 [02:57<2:50:02,  3.45s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:   1%|1         | 43/3000 [02:57<2:50:02,  3.45s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:   1%|1         | 44/3000 [02:57<3:20:40,  4.07s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:   1%|1         | 44/3000 [02:57<3:20:40,  4.07s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:   1%|1         | 44/3000 [03:03<3:20:40,  4.07s/it, lr: 1.0e-04 loss: 4.179e-02]mindexpander_qwen_v1:   1%|1         | 44/3000 [03:03<3:20:40,  4.07s/it, lr: 1.0e-04 loss: 4.179e-02]mindexpander_qwen_v1:   2%|1         | 45/3000 [03:03<3:43:41,  4.54s/it, lr: 1.0e-04 loss: 4.179e-02]mindexpander_qwen_v1:   2%|1         | 45/3000 [03:03<3:43:41,  4.54s/it, lr: 1.0e-04 loss: 4.179e-02]mindexpander_qwen_v1:   2%|1         | 45/3000 [03:06<3:43:41,  4.54s/it, lr: 1.0e-04 loss: 1.782e-01]mindexpander_qwen_v1:   2%|1         | 45/3000 [03:06<3:43:41,  4.54s/it, lr: 1.0e-04 loss: 1.782e-01]mindexpander_qwen_v1:   2%|1         | 46/3000 [03:06<3:16:59,  4.00s/it, lr: 1.0e-04 loss: 1.782e-01]mindexpander_qwen_v1:   2%|1         | 46/3000 [03:06<3:16:59,  4.00s/it, lr: 1.0e-04 loss: 1.782e-01]mindexpander_qwen_v1:   2%|1         | 46/3000 [03:11<3:16:59,  4.00s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:   2%|1         | 46/3000 [03:11<3:16:59,  4.00s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:   2%|1         | 47/3000 [03:11<3:41:50,  4.51s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:   2%|1         | 47/3000 [03:11<3:41:50,  4.51s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:   2%|1         | 47/3000 [03:14<3:41:50,  4.51s/it, lr: 1.0e-04 loss: 1.941e-02]mindexpander_qwen_v1:   2%|1         | 47/3000 [03:14<3:41:50,  4.51s/it, lr: 1.0e-04 loss: 1.941e-02]mindexpander_qwen_v1:   2%|1         | 48/3000 [03:14<3:12:04,  3.90s/it, lr: 1.0e-04 loss: 1.941e-02]mindexpander_qwen_v1:   2%|1         | 48/3000 [03:14<3:12:04,  3.90s/it, lr: 1.0e-04 loss: 1.941e-02]mindexpander_qwen_v1:   2%|1         | 48/3000 [03:16<3:12:04,  3.90s/it, lr: 1.0e-04 loss: 5.665e-02]mindexpander_qwen_v1:   2%|1         | 48/3000 [03:16<3:12:04,  3.90s/it, lr: 1.0e-04 loss: 5.665e-02]mindexpander_qwen_v1:   2%|1         | 49/3000 [03:16<2:50:53,  3.47s/it, lr: 1.0e-04 loss: 5.665e-02]mindexpander_qwen_v1:   2%|1         | 49/3000 [03:16<2:50:53,  3.47s/it, lr: 1.0e-04 loss: 5.665e-02]mindexpander_qwen_v1:   2%|1         | 49/3000 [03:19<2:50:53,  3.47s/it, lr: 1.0e-04 loss: 2.655e-02]mindexpander_qwen_v1:   2%|1         | 49/3000 [03:19<2:50:53,  3.47s/it, lr: 1.0e-04 loss: 2.655e-02]mindexpander_qwen_v1:   2%|1         | 50/3000 [03:25<2:50:50,  3.47s/it, lr: 1.0e-04 loss: 3.961e-02]mindexpander_qwen_v1:   2%|1         | 50/3000 [03:25<2:50:50,  3.47s/it, lr: 1.0e-04 loss: 3.961e-02]mindexpander_qwen_v1:   2%|1         | 51/3000 [03:25<2:37:27,  3.20s/it, lr: 1.0e-04 loss: 3.961e-02]mindexpander_qwen_v1:   2%|1         | 51/3000 [03:25<2:37:27,  3.20s/it, lr: 1.0e-04 loss: 3.961e-02]mindexpander_qwen_v1:   2%|1         | 51/3000 [03:30<2:37:27,  3.20s/it, lr: 1.0e-04 loss: 5.562e-02]mindexpander_qwen_v1:   2%|1         | 51/3000 [03:30<2:37:27,  3.20s/it, lr: 1.0e-04 loss: 5.562e-02]mindexpander_qwen_v1:   2%|1         | 52/3000 [03:30<3:08:14,  3.83s/it, lr: 1.0e-04 loss: 5.562e-02]mindexpander_qwen_v1:   2%|1         | 52/3000 [03:30<3:08:14,  3.83s/it, lr: 1.0e-04 loss: 5.562e-02]mindexpander_qwen_v1:   2%|1         | 52/3000 [03:34<3:08:14,  3.83s/it, lr: 1.0e-04 loss: 2.095e-02]mindexpander_qwen_v1:   2%|1         | 52/3000 [03:34<3:08:14,  3.83s/it, lr: 1.0e-04 loss: 2.095e-02]mindexpander_qwen_v1:   2%|1         | 53/3000 [03:34<3:06:56,  3.81s/it, lr: 1.0e-04 loss: 2.095e-02]mindexpander_qwen_v1:   2%|1         | 53/3000 [03:34<3:06:56,  3.81s/it, lr: 1.0e-04 loss: 2.095e-02]mindexpander_qwen_v1:   2%|1         | 53/3000 [03:40<3:06:56,  3.81s/it, lr: 1.0e-04 loss: 1.327e-01]mindexpander_qwen_v1:   2%|1         | 53/3000 [03:40<3:06:56,  3.81s/it, lr: 1.0e-04 loss: 1.327e-01]mindexpander_qwen_v1:   2%|1         | 54/3000 [03:40<3:34:24,  4.37s/it, lr: 1.0e-04 loss: 1.327e-01]mindexpander_qwen_v1:   2%|1         | 54/3000 [03:40<3:34:24,  4.37s/it, lr: 1.0e-04 loss: 1.327e-01]mindexpander_qwen_v1:   2%|1         | 54/3000 [03:46<3:34:24,  4.37s/it, lr: 1.0e-04 loss: 5.082e-02]mindexpander_qwen_v1:   2%|1         | 54/3000 [03:46<3:34:24,  4.37s/it, lr: 1.0e-04 loss: 5.082e-02]mindexpander_qwen_v1:   2%|1         | 55/3000 [03:46<3:53:19,  4.75s/it, lr: 1.0e-04 loss: 5.082e-02]mindexpander_qwen_v1:   2%|1         | 55/3000 [03:46<3:53:19,  4.75s/it, lr: 1.0e-04 loss: 5.082e-02]mindexpander_qwen_v1:   2%|1         | 55/3000 [03:49<3:53:19,  4.75s/it, lr: 1.0e-04 loss: 5.674e-02]mindexpander_qwen_v1:   2%|1         | 55/3000 [03:49<3:53:19,  4.75s/it, lr: 1.0e-04 loss: 5.674e-02]mindexpander_qwen_v1:   2%|1         | 56/3000 [03:49<3:39:03,  4.46s/it, lr: 1.0e-04 loss: 5.674e-02]mindexpander_qwen_v1:   2%|1         | 56/3000 [03:49<3:39:03,  4.46s/it, lr: 1.0e-04 loss: 5.674e-02]mindexpander_qwen_v1:   2%|1         | 56/3000 [03:52<3:39:03,  4.46s/it, lr: 1.0e-04 loss: 9.355e-02]mindexpander_qwen_v1:   2%|1         | 56/3000 [03:52<3:39:03,  4.46s/it, lr: 1.0e-04 loss: 9.355e-02]mindexpander_qwen_v1:   2%|1         | 57/3000 [03:52<3:10:17,  3.88s/it, lr: 1.0e-04 loss: 9.355e-02]mindexpander_qwen_v1:   2%|1         | 57/3000 [03:52<3:10:17,  3.88s/it, lr: 1.0e-04 loss: 9.355e-02]mindexpander_qwen_v1:   2%|1         | 57/3000 [03:56<3:10:17,  3.88s/it, lr: 1.0e-04 loss: 2.010e-01]mindexpander_qwen_v1:   2%|1         | 57/3000 [03:56<3:10:17,  3.88s/it, lr: 1.0e-04 loss: 2.010e-01]mindexpander_qwen_v1:   2%|1         | 58/3000 [03:56<3:10:19,  3.88s/it, lr: 1.0e-04 loss: 2.010e-01]mindexpander_qwen_v1:   2%|1         | 58/3000 [03:56<3:10:19,  3.88s/it, lr: 1.0e-04 loss: 2.010e-01]mindexpander_qwen_v1:   2%|1         | 58/3000 [04:02<3:10:19,  3.88s/it, lr: 1.0e-04 loss: 5.968e-02]mindexpander_qwen_v1:   2%|1         | 58/3000 [04:02<3:10:19,  3.88s/it, lr: 1.0e-04 loss: 5.968e-02]mindexpander_qwen_v1:   2%|1         | 59/3000 [04:02<3:37:16,  4.43s/it, lr: 1.0e-04 loss: 5.968e-02]mindexpander_qwen_v1:   2%|1         | 59/3000 [04:02<3:37:16,  4.43s/it, lr: 1.0e-04 loss: 5.968e-02]mindexpander_qwen_v1:   2%|1         | 59/3000 [04:04<3:37:16,  4.43s/it, lr: 1.0e-04 loss: 1.213e-01]mindexpander_qwen_v1:   2%|1         | 59/3000 [04:04<3:37:16,  4.43s/it, lr: 1.0e-04 loss: 1.213e-01]mindexpander_qwen_v1:   2%|2         | 60/3000 [04:08<3:37:11,  4.43s/it, lr: 1.0e-04 loss: 5.036e-02]mindexpander_qwen_v1:   2%|2         | 60/3000 [04:08<3:37:11,  4.43s/it, lr: 1.0e-04 loss: 5.036e-02]mindexpander_qwen_v1:   2%|2         | 61/3000 [04:08<2:39:47,  3.26s/it, lr: 1.0e-04 loss: 5.036e-02]mindexpander_qwen_v1:   2%|2         | 61/3000 [04:08<2:39:47,  3.26s/it, lr: 1.0e-04 loss: 5.036e-02]mindexpander_qwen_v1:   2%|2         | 61/3000 [04:11<2:39:47,  3.26s/it, lr: 1.0e-04 loss: 3.326e-02]mindexpander_qwen_v1:   2%|2         | 61/3000 [04:11<2:39:47,  3.26s/it, lr: 1.0e-04 loss: 3.326e-02]mindexpander_qwen_v1:   2%|2         | 62/3000 [04:11<2:32:58,  3.12s/it, lr: 1.0e-04 loss: 3.326e-02]mindexpander_qwen_v1:   2%|2         | 62/3000 [04:11<2:32:58,  3.12s/it, lr: 1.0e-04 loss: 3.326e-02]mindexpander_qwen_v1:   2%|2         | 62/3000 [04:14<2:32:58,  3.12s/it, lr: 1.0e-04 loss: 1.099e-02]mindexpander_qwen_v1:   2%|2         | 62/3000 [04:14<2:32:58,  3.12s/it, lr: 1.0e-04 loss: 1.099e-02]mindexpander_qwen_v1:   2%|2         | 63/3000 [04:14<2:40:41,  3.28s/it, lr: 1.0e-04 loss: 1.099e-02]mindexpander_qwen_v1:   2%|2         | 63/3000 [04:14<2:40:41,  3.28s/it, lr: 1.0e-04 loss: 1.099e-02]mindexpander_qwen_v1:   2%|2         | 63/3000 [04:20<2:40:41,  3.28s/it, lr: 1.0e-04 loss: 1.104e-01]mindexpander_qwen_v1:   2%|2         | 63/3000 [04:20<2:40:41,  3.28s/it, lr: 1.0e-04 loss: 1.104e-01]mindexpander_qwen_v1:   2%|2         | 64/3000 [04:20<3:13:27,  3.95s/it, lr: 1.0e-04 loss: 1.104e-01]mindexpander_qwen_v1:   2%|2         | 64/3000 [04:20<3:13:27,  3.95s/it, lr: 1.0e-04 loss: 1.104e-01]mindexpander_qwen_v1:   2%|2         | 64/3000 [04:26<3:13:27,  3.95s/it, lr: 1.0e-04 loss: 1.629e-01]mindexpander_qwen_v1:   2%|2         | 64/3000 [04:26<3:13:27,  3.95s/it, lr: 1.0e-04 loss: 1.629e-01]mindexpander_qwen_v1:   2%|2         | 65/3000 [04:26<3:37:59,  4.46s/it, lr: 1.0e-04 loss: 1.629e-01]mindexpander_qwen_v1:   2%|2         | 65/3000 [04:26<3:37:59,  4.46s/it, lr: 1.0e-04 loss: 1.629e-01]mindexpander_qwen_v1:   2%|2         | 65/3000 [04:29<3:37:59,  4.46s/it, lr: 1.0e-04 loss: 1.258e-01]mindexpander_qwen_v1:   2%|2         | 65/3000 [04:29<3:37:59,  4.46s/it, lr: 1.0e-04 loss: 1.258e-01]mindexpander_qwen_v1:   2%|2         | 66/3000 [04:29<3:12:25,  3.94s/it, lr: 1.0e-04 loss: 1.258e-01]mindexpander_qwen_v1:   2%|2         | 66/3000 [04:29<3:12:25,  3.94s/it, lr: 1.0e-04 loss: 1.258e-01]mindexpander_qwen_v1:   2%|2         | 66/3000 [04:34<3:12:25,  3.94s/it, lr: 1.0e-04 loss: 2.464e-03]mindexpander_qwen_v1:   2%|2         | 66/3000 [04:34<3:12:25,  3.94s/it, lr: 1.0e-04 loss: 2.464e-03]mindexpander_qwen_v1:   2%|2         | 67/3000 [04:34<3:38:06,  4.46s/it, lr: 1.0e-04 loss: 2.464e-03]mindexpander_qwen_v1:   2%|2         | 67/3000 [04:34<3:38:06,  4.46s/it, lr: 1.0e-04 loss: 2.464e-03]mindexpander_qwen_v1:   2%|2         | 67/3000 [04:37<3:38:06,  4.46s/it, lr: 1.0e-04 loss: 8.004e-02]mindexpander_qwen_v1:   2%|2         | 67/3000 [04:37<3:38:06,  4.46s/it, lr: 1.0e-04 loss: 8.004e-02]mindexpander_qwen_v1:   2%|2         | 68/3000 [04:37<3:09:16,  3.87s/it, lr: 1.0e-04 loss: 8.004e-02]mindexpander_qwen_v1:   2%|2         | 68/3000 [04:37<3:09:16,  3.87s/it, lr: 1.0e-04 loss: 8.004e-02]mindexpander_qwen_v1:   2%|2         | 68/3000 [04:41<3:09:16,  3.87s/it, lr: 1.0e-04 loss: 1.866e-01]mindexpander_qwen_v1:   2%|2         | 68/3000 [04:41<3:09:16,  3.87s/it, lr: 1.0e-04 loss: 1.866e-01]mindexpander_qwen_v1:   2%|2         | 69/3000 [04:41<3:09:38,  3.88s/it, lr: 1.0e-04 loss: 1.866e-01]mindexpander_qwen_v1:   2%|2         | 69/3000 [04:41<3:09:38,  3.88s/it, lr: 1.0e-04 loss: 1.866e-01]mindexpander_qwen_v1:   2%|2         | 69/3000 [04:43<3:09:38,  3.88s/it, lr: 1.0e-04 loss: 6.323e-02]mindexpander_qwen_v1:   2%|2         | 69/3000 [04:43<3:09:38,  3.88s/it, lr: 1.0e-04 loss: 6.323e-02]mindexpander_qwen_v1:   2%|2         | 70/3000 [04:46<3:09:34,  3.88s/it, lr: 1.0e-04 loss: 1.866e-01]mindexpander_qwen_v1:   2%|2         | 70/3000 [04:46<3:09:34,  3.88s/it, lr: 1.0e-04 loss: 1.866e-01]mindexpander_qwen_v1:   2%|2         | 71/3000 [04:46<2:10:17,  2.67s/it, lr: 1.0e-04 loss: 1.866e-01]mindexpander_qwen_v1:   2%|2         | 71/3000 [04:46<2:10:17,  2.67s/it, lr: 1.0e-04 loss: 1.866e-01]mindexpander_qwen_v1:   2%|2         | 71/3000 [04:48<2:10:17,  2.67s/it, lr: 1.0e-04 loss: 1.868e-01]mindexpander_qwen_v1:   2%|2         | 71/3000 [04:48<2:10:17,  2.67s/it, lr: 1.0e-04 loss: 1.868e-01]mindexpander_qwen_v1:   2%|2         | 72/3000 [04:48<2:07:35,  2.61s/it, lr: 1.0e-04 loss: 1.868e-01]mindexpander_qwen_v1:   2%|2         | 72/3000 [04:48<2:07:35,  2.61s/it, lr: 1.0e-04 loss: 1.868e-01]mindexpander_qwen_v1:   2%|2         | 72/3000 [04:54<2:07:35,  2.61s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:   2%|2         | 72/3000 [04:54<2:07:35,  2.61s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:   2%|2         | 73/3000 [04:54<2:49:08,  3.47s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:   2%|2         | 73/3000 [04:54<2:49:08,  3.47s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:   2%|2         | 73/3000 [05:00<2:49:08,  3.47s/it, lr: 1.0e-04 loss: 8.433e-02]mindexpander_qwen_v1:   2%|2         | 73/3000 [05:00<2:49:08,  3.47s/it, lr: 1.0e-04 loss: 8.433e-02]mindexpander_qwen_v1:   2%|2         | 74/3000 [05:00<3:19:19,  4.09s/it, lr: 1.0e-04 loss: 8.433e-02]mindexpander_qwen_v1:   2%|2         | 74/3000 [05:00<3:19:19,  4.09s/it, lr: 1.0e-04 loss: 8.433e-02]mindexpander_qwen_v1:   2%|2         | 74/3000 [05:03<3:19:19,  4.09s/it, lr: 1.0e-04 loss: 1.037e-01]mindexpander_qwen_v1:   2%|2         | 74/3000 [05:03<3:19:19,  4.09s/it, lr: 1.0e-04 loss: 1.037e-01]mindexpander_qwen_v1:   2%|2         | 75/3000 [05:03<3:14:43,  3.99s/it, lr: 1.0e-04 loss: 1.037e-01]mindexpander_qwen_v1:   2%|2         | 75/3000 [05:03<3:14:43,  3.99s/it, lr: 1.0e-04 loss: 1.037e-01]mindexpander_qwen_v1:   2%|2         | 75/3000 [05:09<3:14:43,  3.99s/it, lr: 1.0e-04 loss: 1.606e-01]mindexpander_qwen_v1:   2%|2         | 75/3000 [05:09<3:14:43,  3.99s/it, lr: 1.0e-04 loss: 1.606e-01]mindexpander_qwen_v1:   3%|2         | 76/3000 [05:09<3:39:10,  4.50s/it, lr: 1.0e-04 loss: 1.606e-01]mindexpander_qwen_v1:   3%|2         | 76/3000 [05:09<3:39:10,  4.50s/it, lr: 1.0e-04 loss: 1.606e-01]mindexpander_qwen_v1:   3%|2         | 76/3000 [05:12<3:39:10,  4.50s/it, lr: 1.0e-04 loss: 1.529e-01]mindexpander_qwen_v1:   3%|2         | 76/3000 [05:12<3:39:10,  4.50s/it, lr: 1.0e-04 loss: 1.529e-01]mindexpander_qwen_v1:   3%|2         | 77/3000 [05:12<3:12:51,  3.96s/it, lr: 1.0e-04 loss: 1.529e-01]mindexpander_qwen_v1:   3%|2         | 77/3000 [05:12<3:12:51,  3.96s/it, lr: 1.0e-04 loss: 1.529e-01]mindexpander_qwen_v1:   3%|2         | 77/3000 [05:16<3:12:51,  3.96s/it, lr: 1.0e-04 loss: 1.150e-02]mindexpander_qwen_v1:   3%|2         | 77/3000 [05:16<3:12:51,  3.96s/it, lr: 1.0e-04 loss: 1.150e-02]mindexpander_qwen_v1:   3%|2         | 78/3000 [05:16<3:09:43,  3.90s/it, lr: 1.0e-04 loss: 1.150e-02]mindexpander_qwen_v1:   3%|2         | 78/3000 [05:16<3:09:43,  3.90s/it, lr: 1.0e-04 loss: 1.150e-02]mindexpander_qwen_v1:   3%|2         | 78/3000 [05:19<3:09:43,  3.90s/it, lr: 1.0e-04 loss: 1.490e-02]mindexpander_qwen_v1:   3%|2         | 78/3000 [05:19<3:09:43,  3.90s/it, lr: 1.0e-04 loss: 1.490e-02]mindexpander_qwen_v1:   3%|2         | 79/3000 [05:19<3:07:25,  3.85s/it, lr: 1.0e-04 loss: 1.490e-02]mindexpander_qwen_v1:   3%|2         | 79/3000 [05:19<3:07:25,  3.85s/it, lr: 1.0e-04 loss: 1.490e-02]mindexpander_qwen_v1:   3%|2         | 79/3000 [05:23<3:07:25,  3.85s/it, lr: 1.0e-04 loss: 7.537e-02]mindexpander_qwen_v1:   3%|2         | 79/3000 [05:23<3:07:25,  3.85s/it, lr: 1.0e-04 loss: 7.537e-02]mindexpander_qwen_v1:   3%|2         | 80/3000 [05:29<3:07:21,  3.85s/it, lr: 1.0e-04 loss: 1.415e-02]mindexpander_qwen_v1:   3%|2         | 80/3000 [05:29<3:07:21,  3.85s/it, lr: 1.0e-04 loss: 1.415e-02]mindexpander_qwen_v1:   3%|2         | 81/3000 [05:29<2:47:08,  3.44s/it, lr: 1.0e-04 loss: 1.415e-02]mindexpander_qwen_v1:   3%|2         | 81/3000 [05:29<2:47:08,  3.44s/it, lr: 1.0e-04 loss: 1.415e-02]mindexpander_qwen_v1:   3%|2         | 81/3000 [05:35<2:47:08,  3.44s/it, lr: 1.0e-04 loss: 2.295e-02]mindexpander_qwen_v1:   3%|2         | 81/3000 [05:35<2:47:08,  3.44s/it, lr: 1.0e-04 loss: 2.295e-02]mindexpander_qwen_v1:   3%|2         | 82/3000 [05:35<3:14:49,  4.01s/it, lr: 1.0e-04 loss: 2.295e-02]mindexpander_qwen_v1:   3%|2         | 82/3000 [05:35<3:14:49,  4.01s/it, lr: 1.0e-04 loss: 2.295e-02]mindexpander_qwen_v1:   3%|2         | 82/3000 [05:38<3:14:49,  4.01s/it, lr: 1.0e-04 loss: 1.989e-02]mindexpander_qwen_v1:   3%|2         | 82/3000 [05:38<3:14:49,  4.01s/it, lr: 1.0e-04 loss: 1.989e-02]mindexpander_qwen_v1:   3%|2         | 83/3000 [05:38<3:11:20,  3.94s/it, lr: 1.0e-04 loss: 1.989e-02]mindexpander_qwen_v1:   3%|2         | 83/3000 [05:38<3:11:20,  3.94s/it, lr: 1.0e-04 loss: 1.989e-02]mindexpander_qwen_v1:   3%|2         | 83/3000 [05:44<3:11:20,  3.94s/it, lr: 1.0e-04 loss: 7.313e-02]mindexpander_qwen_v1:   3%|2         | 83/3000 [05:44<3:11:20,  3.94s/it, lr: 1.0e-04 loss: 7.313e-02]mindexpander_qwen_v1:   3%|2         | 84/3000 [05:44<3:35:08,  4.43s/it, lr: 1.0e-04 loss: 7.313e-02]mindexpander_qwen_v1:   3%|2         | 84/3000 [05:44<3:35:08,  4.43s/it, lr: 1.0e-04 loss: 7.313e-02]mindexpander_qwen_v1:   3%|2         | 84/3000 [05:50<3:35:08,  4.43s/it, lr: 1.0e-04 loss: 6.267e-02]mindexpander_qwen_v1:   3%|2         | 84/3000 [05:50<3:35:08,  4.43s/it, lr: 1.0e-04 loss: 6.267e-02]mindexpander_qwen_v1:   3%|2         | 85/3000 [05:50<3:54:39,  4.83s/it, lr: 1.0e-04 loss: 6.267e-02]mindexpander_qwen_v1:   3%|2         | 85/3000 [05:50<3:54:39,  4.83s/it, lr: 1.0e-04 loss: 6.267e-02]mindexpander_qwen_v1:   3%|2         | 85/3000 [05:53<3:54:39,  4.83s/it, lr: 1.0e-04 loss: 7.921e-02]mindexpander_qwen_v1:   3%|2         | 85/3000 [05:53<3:54:39,  4.83s/it, lr: 1.0e-04 loss: 7.921e-02]mindexpander_qwen_v1:   3%|2         | 86/3000 [05:53<3:21:32,  4.15s/it, lr: 1.0e-04 loss: 7.921e-02]mindexpander_qwen_v1:   3%|2         | 86/3000 [05:53<3:21:32,  4.15s/it, lr: 1.0e-04 loss: 7.921e-02]mindexpander_qwen_v1:   3%|2         | 86/3000 [05:55<3:21:32,  4.15s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:   3%|2         | 86/3000 [05:55<3:21:32,  4.15s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:   3%|2         | 87/3000 [05:55<2:57:34,  3.66s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:   3%|2         | 87/3000 [05:55<2:57:34,  3.66s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:   3%|2         | 87/3000 [05:59<2:57:34,  3.66s/it, lr: 1.0e-04 loss: 4.574e-02]mindexpander_qwen_v1:   3%|2         | 87/3000 [05:59<2:57:34,  3.66s/it, lr: 1.0e-04 loss: 4.574e-02]mindexpander_qwen_v1:   3%|2         | 88/3000 [05:59<2:58:38,  3.68s/it, lr: 1.0e-04 loss: 4.574e-02]mindexpander_qwen_v1:   3%|2         | 88/3000 [05:59<2:58:38,  3.68s/it, lr: 1.0e-04 loss: 4.574e-02]mindexpander_qwen_v1:   3%|2         | 88/3000 [06:03<2:58:38,  3.68s/it, lr: 1.0e-04 loss: 2.564e-02]mindexpander_qwen_v1:   3%|2         | 88/3000 [06:03<2:58:38,  3.68s/it, lr: 1.0e-04 loss: 2.564e-02]mindexpander_qwen_v1:   3%|2         | 89/3000 [06:03<3:01:28,  3.74s/it, lr: 1.0e-04 loss: 2.564e-02]mindexpander_qwen_v1:   3%|2         | 89/3000 [06:03<3:01:28,  3.74s/it, lr: 1.0e-04 loss: 2.564e-02]mindexpander_qwen_v1:   3%|2         | 89/3000 [06:09<3:01:28,  3.74s/it, lr: 1.0e-04 loss: 4.794e-02]mindexpander_qwen_v1:   3%|2         | 89/3000 [06:09<3:01:28,  3.74s/it, lr: 1.0e-04 loss: 4.794e-02]mindexpander_qwen_v1:   3%|3         | 90/3000 [06:12<3:01:25,  3.74s/it, lr: 1.0e-04 loss: 1.843e-02]mindexpander_qwen_v1:   3%|3         | 90/3000 [06:12<3:01:25,  3.74s/it, lr: 1.0e-04 loss: 1.843e-02]mindexpander_qwen_v1:   3%|3         | 91/3000 [06:12<2:20:03,  2.89s/it, lr: 1.0e-04 loss: 1.843e-02]mindexpander_qwen_v1:   3%|3         | 91/3000 [06:12<2:20:03,  2.89s/it, lr: 1.0e-04 loss: 1.843e-02]mindexpander_qwen_v1:   3%|3         | 91/3000 [06:18<2:20:03,  2.89s/it, lr: 1.0e-04 loss: 2.654e-02]mindexpander_qwen_v1:   3%|3         | 91/3000 [06:18<2:20:03,  2.89s/it, lr: 1.0e-04 loss: 2.654e-02]mindexpander_qwen_v1:   3%|3         | 92/3000 [06:18<2:54:01,  3.59s/it, lr: 1.0e-04 loss: 2.654e-02]mindexpander_qwen_v1:   3%|3         | 92/3000 [06:18<2:54:01,  3.59s/it, lr: 1.0e-04 loss: 2.654e-02]mindexpander_qwen_v1:   3%|3         | 92/3000 [06:22<2:54:01,  3.59s/it, lr: 1.0e-04 loss: 1.091e-01]mindexpander_qwen_v1:   3%|3         | 92/3000 [06:22<2:54:01,  3.59s/it, lr: 1.0e-04 loss: 1.091e-01]mindexpander_qwen_v1:   3%|3         | 93/3000 [06:22<2:58:37,  3.69s/it, lr: 1.0e-04 loss: 1.091e-01]mindexpander_qwen_v1:   3%|3         | 93/3000 [06:22<2:58:37,  3.69s/it, lr: 1.0e-04 loss: 1.091e-01]mindexpander_qwen_v1:   3%|3         | 93/3000 [06:28<2:58:37,  3.69s/it, lr: 1.0e-04 loss: 2.672e-02]mindexpander_qwen_v1:   3%|3         | 93/3000 [06:28<2:58:37,  3.69s/it, lr: 1.0e-04 loss: 2.672e-02]mindexpander_qwen_v1:   3%|3         | 94/3000 [06:28<3:25:37,  4.25s/it, lr: 1.0e-04 loss: 2.672e-02]mindexpander_qwen_v1:   3%|3         | 94/3000 [06:28<3:25:37,  4.25s/it, lr: 1.0e-04 loss: 2.672e-02]mindexpander_qwen_v1:   3%|3         | 94/3000 [06:32<3:25:37,  4.25s/it, lr: 1.0e-04 loss: 7.965e-02]mindexpander_qwen_v1:   3%|3         | 94/3000 [06:32<3:25:37,  4.25s/it, lr: 1.0e-04 loss: 7.965e-02]mindexpander_qwen_v1:   3%|3         | 95/3000 [06:32<3:18:37,  4.10s/it, lr: 1.0e-04 loss: 7.965e-02]mindexpander_qwen_v1:   3%|3         | 95/3000 [06:32<3:18:37,  4.10s/it, lr: 1.0e-04 loss: 7.965e-02]mindexpander_qwen_v1:   3%|3         | 95/3000 [06:37<3:18:37,  4.10s/it, lr: 1.0e-04 loss: 1.123e-01]mindexpander_qwen_v1:   3%|3         | 95/3000 [06:37<3:18:37,  4.10s/it, lr: 1.0e-04 loss: 1.123e-01]mindexpander_qwen_v1:   3%|3         | 96/3000 [06:37<3:42:58,  4.61s/it, lr: 1.0e-04 loss: 1.123e-01]mindexpander_qwen_v1:   3%|3         | 96/3000 [06:37<3:42:58,  4.61s/it, lr: 1.0e-04 loss: 1.123e-01]mindexpander_qwen_v1:   3%|3         | 96/3000 [06:40<3:42:58,  4.61s/it, lr: 1.0e-04 loss: 1.889e-01]mindexpander_qwen_v1:   3%|3         | 96/3000 [06:40<3:42:58,  4.61s/it, lr: 1.0e-04 loss: 1.889e-01]mindexpander_qwen_v1:   3%|3         | 97/3000 [06:40<3:12:39,  3.98s/it, lr: 1.0e-04 loss: 1.889e-01]mindexpander_qwen_v1:   3%|3         | 97/3000 [06:40<3:12:39,  3.98s/it, lr: 1.0e-04 loss: 1.889e-01]mindexpander_qwen_v1:   3%|3         | 97/3000 [06:44<3:12:39,  3.98s/it, lr: 1.0e-04 loss: 1.435e-01]mindexpander_qwen_v1:   3%|3         | 97/3000 [06:44<3:12:39,  3.98s/it, lr: 1.0e-04 loss: 1.435e-01]mindexpander_qwen_v1:   3%|3         | 98/3000 [06:44<3:09:11,  3.91s/it, lr: 1.0e-04 loss: 1.435e-01]mindexpander_qwen_v1:   3%|3         | 98/3000 [06:44<3:09:11,  3.91s/it, lr: 1.0e-04 loss: 1.435e-01]mindexpander_qwen_v1:   3%|3         | 98/3000 [06:46<3:09:11,  3.91s/it, lr: 1.0e-04 loss: 1.863e-01]mindexpander_qwen_v1:   3%|3         | 98/3000 [06:46<3:09:11,  3.91s/it, lr: 1.0e-04 loss: 1.863e-01]mindexpander_qwen_v1:   3%|3         | 99/3000 [06:46<2:48:18,  3.48s/it, lr: 1.0e-04 loss: 1.863e-01]mindexpander_qwen_v1:   3%|3         | 99/3000 [06:46<2:48:18,  3.48s/it, lr: 1.0e-04 loss: 1.863e-01]mindexpander_qwen_v1:   3%|3         | 99/3000 [06:49<2:48:18,  3.48s/it, lr: 1.0e-04 loss: 1.496e-01]mindexpander_qwen_v1:   3%|3         | 99/3000 [06:49<2:48:18,  3.48s/it, lr: 1.0e-04 loss: 1.496e-01]mindexpander_qwen_v1:   3%|3         | 100/3000 [06:52<2:48:15,  3.48s/it, lr: 1.0e-04 loss: 9.196e-02]mindexpander_qwen_v1:   3%|3         | 100/3000 [06:52<2:48:15,  3.48s/it, lr: 1.0e-04 loss: 9.196e-02]mindexpander_qwen_v1:   3%|3         | 101/3000 [06:52<2:12:34,  2.74s/it, lr: 1.0e-04 loss: 9.196e-02]mindexpander_qwen_v1:   3%|3         | 101/3000 [06:52<2:12:34,  2.74s/it, lr: 1.0e-04 loss: 9.196e-02]mindexpander_qwen_v1:   3%|3         | 101/3000 [06:55<2:12:34,  2.74s/it, lr: 1.0e-04 loss: 1.538e-01]mindexpander_qwen_v1:   3%|3         | 101/3000 [06:55<2:12:34,  2.74s/it, lr: 1.0e-04 loss: 1.538e-01]mindexpander_qwen_v1:   3%|3         | 102/3000 [06:55<2:08:54,  2.67s/it, lr: 1.0e-04 loss: 1.538e-01]mindexpander_qwen_v1:   3%|3         | 102/3000 [06:55<2:08:54,  2.67s/it, lr: 1.0e-04 loss: 1.538e-01]mindexpander_qwen_v1:   3%|3         | 102/3000 [07:01<2:08:54,  2.67s/it, lr: 1.0e-04 loss: 1.819e-01]mindexpander_qwen_v1:   3%|3         | 102/3000 [07:01<2:08:54,  2.67s/it, lr: 1.0e-04 loss: 1.819e-01]mindexpander_qwen_v1:   3%|3         | 103/3000 [07:01<2:47:34,  3.47s/it, lr: 1.0e-04 loss: 1.819e-01]mindexpander_qwen_v1:   3%|3         | 103/3000 [07:01<2:47:34,  3.47s/it, lr: 1.0e-04 loss: 1.819e-01]mindexpander_qwen_v1:   3%|3         | 103/3000 [07:07<2:47:34,  3.47s/it, lr: 1.0e-04 loss: 3.296e-02]mindexpander_qwen_v1:   3%|3         | 103/3000 [07:07<2:47:34,  3.47s/it, lr: 1.0e-04 loss: 3.296e-02]mindexpander_qwen_v1:   3%|3         | 104/3000 [07:07<3:18:51,  4.12s/it, lr: 1.0e-04 loss: 3.296e-02]mindexpander_qwen_v1:   3%|3         | 104/3000 [07:07<3:18:51,  4.12s/it, lr: 1.0e-04 loss: 3.296e-02]mindexpander_qwen_v1:   3%|3         | 104/3000 [07:10<3:18:51,  4.12s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:   3%|3         | 104/3000 [07:10<3:18:51,  4.12s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:   4%|3         | 105/3000 [07:10<3:13:33,  4.01s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:   4%|3         | 105/3000 [07:10<3:13:33,  4.01s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:   4%|3         | 105/3000 [07:13<3:13:33,  4.01s/it, lr: 1.0e-04 loss: 1.573e-01]mindexpander_qwen_v1:   4%|3         | 105/3000 [07:13<3:13:33,  4.01s/it, lr: 1.0e-04 loss: 1.573e-01]mindexpander_qwen_v1:   4%|3         | 106/3000 [07:13<2:51:53,  3.56s/it, lr: 1.0e-04 loss: 1.573e-01]mindexpander_qwen_v1:   4%|3         | 106/3000 [07:13<2:51:53,  3.56s/it, lr: 1.0e-04 loss: 1.573e-01]mindexpander_qwen_v1:   4%|3         | 106/3000 [07:18<2:51:53,  3.56s/it, lr: 1.0e-04 loss: 5.763e-02]mindexpander_qwen_v1:   4%|3         | 106/3000 [07:18<2:51:53,  3.56s/it, lr: 1.0e-04 loss: 5.763e-02]mindexpander_qwen_v1:   4%|3         | 107/3000 [07:18<3:22:24,  4.20s/it, lr: 1.0e-04 loss: 5.763e-02]mindexpander_qwen_v1:   4%|3         | 107/3000 [07:18<3:22:24,  4.20s/it, lr: 1.0e-04 loss: 5.763e-02]mindexpander_qwen_v1:   4%|3         | 107/3000 [07:24<3:22:24,  4.20s/it, lr: 1.0e-04 loss: 1.659e-01]mindexpander_qwen_v1:   4%|3         | 107/3000 [07:24<3:22:24,  4.20s/it, lr: 1.0e-04 loss: 1.659e-01]mindexpander_qwen_v1:   4%|3         | 108/3000 [07:24<3:46:04,  4.69s/it, lr: 1.0e-04 loss: 1.659e-01]mindexpander_qwen_v1:   4%|3         | 108/3000 [07:24<3:46:04,  4.69s/it, lr: 1.0e-04 loss: 1.659e-01]mindexpander_qwen_v1:   4%|3         | 108/3000 [07:30<3:46:04,  4.69s/it, lr: 1.0e-04 loss: 1.728e-01]mindexpander_qwen_v1:   4%|3         | 108/3000 [07:30<3:46:04,  4.69s/it, lr: 1.0e-04 loss: 1.728e-01]mindexpander_qwen_v1:   4%|3         | 109/3000 [07:30<4:00:53,  5.00s/it, lr: 1.0e-04 loss: 1.728e-01]mindexpander_qwen_v1:   4%|3         | 109/3000 [07:30<4:00:53,  5.00s/it, lr: 1.0e-04 loss: 1.728e-01]mindexpander_qwen_v1:   4%|3         | 109/3000 [07:34<4:00:53,  5.00s/it, lr: 1.0e-04 loss: 2.269e-02]mindexpander_qwen_v1:   4%|3         | 109/3000 [07:34<4:00:53,  5.00s/it, lr: 1.0e-04 loss: 2.269e-02]mindexpander_qwen_v1:   4%|3         | 110/3000 [07:36<4:00:48,  5.00s/it, lr: 1.0e-04 loss: 1.651e-01]mindexpander_qwen_v1:   4%|3         | 110/3000 [07:36<4:00:48,  5.00s/it, lr: 1.0e-04 loss: 1.651e-01]mindexpander_qwen_v1:   4%|3         | 111/3000 [07:36<2:37:33,  3.27s/it, lr: 1.0e-04 loss: 1.651e-01]mindexpander_qwen_v1:   4%|3         | 111/3000 [07:36<2:37:33,  3.27s/it, lr: 1.0e-04 loss: 1.651e-01]mindexpander_qwen_v1:   4%|3         | 111/3000 [07:39<2:37:33,  3.27s/it, lr: 1.0e-04 loss: 1.247e-01]mindexpander_qwen_v1:   4%|3         | 111/3000 [07:39<2:37:33,  3.27s/it, lr: 1.0e-04 loss: 1.247e-01]mindexpander_qwen_v1:   4%|3         | 112/3000 [07:39<2:29:41,  3.11s/it, lr: 1.0e-04 loss: 1.247e-01]mindexpander_qwen_v1:   4%|3         | 112/3000 [07:39<2:29:41,  3.11s/it, lr: 1.0e-04 loss: 1.247e-01]mindexpander_qwen_v1:   4%|3         | 112/3000 [07:41<2:29:41,  3.11s/it, lr: 1.0e-04 loss: 5.561e-02]mindexpander_qwen_v1:   4%|3         | 112/3000 [07:41<2:29:41,  3.11s/it, lr: 1.0e-04 loss: 5.561e-02]mindexpander_qwen_v1:   4%|3         | 113/3000 [07:41<2:21:06,  2.93s/it, lr: 1.0e-04 loss: 5.561e-02]mindexpander_qwen_v1:   4%|3         | 113/3000 [07:41<2:21:06,  2.93s/it, lr: 1.0e-04 loss: 5.561e-02]mindexpander_qwen_v1:   4%|3         | 113/3000 [07:45<2:21:06,  2.93s/it, lr: 1.0e-04 loss: 1.949e-01]mindexpander_qwen_v1:   4%|3         | 113/3000 [07:45<2:21:06,  2.93s/it, lr: 1.0e-04 loss: 1.949e-01]mindexpander_qwen_v1:   4%|3         | 114/3000 [07:45<2:31:31,  3.15s/it, lr: 1.0e-04 loss: 1.949e-01]mindexpander_qwen_v1:   4%|3         | 114/3000 [07:45<2:31:31,  3.15s/it, lr: 1.0e-04 loss: 1.949e-01]mindexpander_qwen_v1:   4%|3         | 114/3000 [07:49<2:31:31,  3.15s/it, lr: 1.0e-04 loss: 1.455e-01]mindexpander_qwen_v1:   4%|3         | 114/3000 [07:49<2:31:31,  3.15s/it, lr: 1.0e-04 loss: 1.455e-01]mindexpander_qwen_v1:   4%|3         | 115/3000 [07:49<2:39:13,  3.31s/it, lr: 1.0e-04 loss: 1.455e-01]mindexpander_qwen_v1:   4%|3         | 115/3000 [07:49<2:39:13,  3.31s/it, lr: 1.0e-04 loss: 1.455e-01]mindexpander_qwen_v1:   4%|3         | 115/3000 [07:53<2:39:13,  3.31s/it, lr: 1.0e-04 loss: 4.799e-02]mindexpander_qwen_v1:   4%|3         | 115/3000 [07:53<2:39:13,  3.31s/it, lr: 1.0e-04 loss: 4.799e-02]mindexpander_qwen_v1:   4%|3         | 116/3000 [07:53<2:46:48,  3.47s/it, lr: 1.0e-04 loss: 4.799e-02]mindexpander_qwen_v1:   4%|3         | 116/3000 [07:53<2:46:48,  3.47s/it, lr: 1.0e-04 loss: 4.799e-02]mindexpander_qwen_v1:   4%|3         | 116/3000 [07:55<2:46:48,  3.47s/it, lr: 1.0e-04 loss: 1.796e-01]mindexpander_qwen_v1:   4%|3         | 116/3000 [07:55<2:46:48,  3.47s/it, lr: 1.0e-04 loss: 1.796e-01]mindexpander_qwen_v1:   4%|3         | 117/3000 [07:55<2:32:17,  3.17s/it, lr: 1.0e-04 loss: 1.796e-01]mindexpander_qwen_v1:   4%|3         | 117/3000 [07:55<2:32:17,  3.17s/it, lr: 1.0e-04 loss: 1.796e-01]mindexpander_qwen_v1:   4%|3         | 117/3000 [07:58<2:32:17,  3.17s/it, lr: 1.0e-04 loss: 7.390e-02]mindexpander_qwen_v1:   4%|3         | 117/3000 [07:58<2:32:17,  3.17s/it, lr: 1.0e-04 loss: 7.390e-02]mindexpander_qwen_v1:   4%|3         | 118/3000 [07:58<2:21:55,  2.95s/it, lr: 1.0e-04 loss: 7.390e-02]mindexpander_qwen_v1:   4%|3         | 118/3000 [07:58<2:21:55,  2.95s/it, lr: 1.0e-04 loss: 7.390e-02]mindexpander_qwen_v1:   4%|3         | 118/3000 [08:03<2:21:55,  2.95s/it, lr: 1.0e-04 loss: 9.201e-02]mindexpander_qwen_v1:   4%|3         | 118/3000 [08:03<2:21:55,  2.95s/it, lr: 1.0e-04 loss: 9.201e-02]mindexpander_qwen_v1:   4%|3         | 119/3000 [08:03<3:01:18,  3.78s/it, lr: 1.0e-04 loss: 9.201e-02]mindexpander_qwen_v1:   4%|3         | 119/3000 [08:03<3:01:18,  3.78s/it, lr: 1.0e-04 loss: 9.201e-02]mindexpander_qwen_v1:   4%|3         | 119/3000 [08:06<3:01:18,  3.78s/it, lr: 1.0e-04 loss: 2.415e-02]mindexpander_qwen_v1:   4%|3         | 119/3000 [08:06<3:01:18,  3.78s/it, lr: 1.0e-04 loss: 2.415e-02]mindexpander_qwen_v1:   4%|4         | 120/3000 [08:09<3:01:14,  3.78s/it, lr: 1.0e-04 loss: 1.911e-01]mindexpander_qwen_v1:   4%|4         | 120/3000 [08:09<3:01:14,  3.78s/it, lr: 1.0e-04 loss: 1.911e-01]mindexpander_qwen_v1:   4%|4         | 121/3000 [08:09<2:05:02,  2.61s/it, lr: 1.0e-04 loss: 1.911e-01]mindexpander_qwen_v1:   4%|4         | 121/3000 [08:09<2:05:02,  2.61s/it, lr: 1.0e-04 loss: 1.911e-01]mindexpander_qwen_v1:   4%|4         | 121/3000 [08:14<2:05:02,  2.61s/it, lr: 1.0e-04 loss: 1.881e-01]mindexpander_qwen_v1:   4%|4         | 121/3000 [08:14<2:05:02,  2.61s/it, lr: 1.0e-04 loss: 1.881e-01]mindexpander_qwen_v1:   4%|4         | 122/3000 [08:14<2:42:04,  3.38s/it, lr: 1.0e-04 loss: 1.881e-01]mindexpander_qwen_v1:   4%|4         | 122/3000 [08:14<2:42:04,  3.38s/it, lr: 1.0e-04 loss: 1.881e-01]mindexpander_qwen_v1:   4%|4         | 122/3000 [08:20<2:42:04,  3.38s/it, lr: 1.0e-04 loss: 1.122e-01]mindexpander_qwen_v1:   4%|4         | 122/3000 [08:20<2:42:04,  3.38s/it, lr: 1.0e-04 loss: 1.122e-01]mindexpander_qwen_v1:   4%|4         | 123/3000 [08:20<3:13:02,  4.03s/it, lr: 1.0e-04 loss: 1.122e-01]mindexpander_qwen_v1:   4%|4         | 123/3000 [08:20<3:13:02,  4.03s/it, lr: 1.0e-04 loss: 1.122e-01]mindexpander_qwen_v1:   4%|4         | 123/3000 [08:24<3:13:02,  4.03s/it, lr: 1.0e-04 loss: 9.176e-02]mindexpander_qwen_v1:   4%|4         | 123/3000 [08:24<3:13:02,  4.03s/it, lr: 1.0e-04 loss: 9.176e-02]mindexpander_qwen_v1:   4%|4         | 124/3000 [08:24<3:09:15,  3.95s/it, lr: 1.0e-04 loss: 9.176e-02]mindexpander_qwen_v1:   4%|4         | 124/3000 [08:24<3:09:15,  3.95s/it, lr: 1.0e-04 loss: 9.176e-02]mindexpander_qwen_v1:   4%|4         | 124/3000 [08:30<3:09:15,  3.95s/it, lr: 1.0e-04 loss: 5.408e-02]mindexpander_qwen_v1:   4%|4         | 124/3000 [08:30<3:09:15,  3.95s/it, lr: 1.0e-04 loss: 5.408e-02]mindexpander_qwen_v1:   4%|4         | 125/3000 [08:30<3:33:21,  4.45s/it, lr: 1.0e-04 loss: 5.408e-02]mindexpander_qwen_v1:   4%|4         | 125/3000 [08:30<3:33:21,  4.45s/it, lr: 1.0e-04 loss: 5.408e-02]mindexpander_qwen_v1:   4%|4         | 125/3000 [08:32<3:33:21,  4.45s/it, lr: 1.0e-04 loss: 1.454e-01]mindexpander_qwen_v1:   4%|4         | 125/3000 [08:32<3:33:21,  4.45s/it, lr: 1.0e-04 loss: 1.454e-01]mindexpander_qwen_v1:   4%|4         | 126/3000 [08:32<3:05:53,  3.88s/it, lr: 1.0e-04 loss: 1.454e-01]mindexpander_qwen_v1:   4%|4         | 126/3000 [08:32<3:05:53,  3.88s/it, lr: 1.0e-04 loss: 1.454e-01]mindexpander_qwen_v1:   4%|4         | 126/3000 [08:36<3:05:53,  3.88s/it, lr: 1.0e-04 loss: 1.561e-02]mindexpander_qwen_v1:   4%|4         | 126/3000 [08:36<3:05:53,  3.88s/it, lr: 1.0e-04 loss: 1.561e-02]mindexpander_qwen_v1:   4%|4         | 127/3000 [08:36<3:06:18,  3.89s/it, lr: 1.0e-04 loss: 1.561e-02]mindexpander_qwen_v1:   4%|4         | 127/3000 [08:36<3:06:18,  3.89s/it, lr: 1.0e-04 loss: 1.561e-02]mindexpander_qwen_v1:   4%|4         | 127/3000 [08:39<3:06:18,  3.89s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:   4%|4         | 127/3000 [08:39<3:06:18,  3.89s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:   4%|4         | 128/3000 [08:39<2:46:05,  3.47s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:   4%|4         | 128/3000 [08:39<2:46:05,  3.47s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:   4%|4         | 128/3000 [08:42<2:46:05,  3.47s/it, lr: 1.0e-04 loss: 1.449e-02]mindexpander_qwen_v1:   4%|4         | 128/3000 [08:42<2:46:05,  3.47s/it, lr: 1.0e-04 loss: 1.449e-02]mindexpander_qwen_v1:   4%|4         | 129/3000 [08:42<2:49:49,  3.55s/it, lr: 1.0e-04 loss: 1.449e-02]mindexpander_qwen_v1:   4%|4         | 129/3000 [08:42<2:49:49,  3.55s/it, lr: 1.0e-04 loss: 1.449e-02]mindexpander_qwen_v1:   4%|4         | 129/3000 [08:48<2:49:49,  3.55s/it, lr: 1.0e-04 loss: 1.638e-01]mindexpander_qwen_v1:   4%|4         | 129/3000 [08:48<2:49:49,  3.55s/it, lr: 1.0e-04 loss: 1.638e-01]mindexpander_qwen_v1:   4%|4         | 130/3000 [08:54<2:49:45,  3.55s/it, lr: 1.0e-04 loss: 1.682e-02]mindexpander_qwen_v1:   4%|4         | 130/3000 [08:54<2:49:45,  3.55s/it, lr: 1.0e-04 loss: 1.682e-02]mindexpander_qwen_v1:   4%|4         | 131/3000 [08:54<2:36:20,  3.27s/it, lr: 1.0e-04 loss: 1.682e-02]mindexpander_qwen_v1:   4%|4         | 131/3000 [08:54<2:36:20,  3.27s/it, lr: 1.0e-04 loss: 1.682e-02]mindexpander_qwen_v1:   4%|4         | 131/3000 [08:58<2:36:20,  3.27s/it, lr: 1.0e-04 loss: 3.671e-03]mindexpander_qwen_v1:   4%|4         | 131/3000 [08:58<2:36:20,  3.27s/it, lr: 1.0e-04 loss: 3.671e-03]mindexpander_qwen_v1:   4%|4         | 132/3000 [08:58<2:41:44,  3.38s/it, lr: 1.0e-04 loss: 3.671e-03]mindexpander_qwen_v1:   4%|4         | 132/3000 [08:58<2:41:44,  3.38s/it, lr: 1.0e-04 loss: 3.671e-03]mindexpander_qwen_v1:   4%|4         | 132/3000 [09:00<2:41:44,  3.38s/it, lr: 1.0e-04 loss: 1.678e-01]mindexpander_qwen_v1:   4%|4         | 132/3000 [09:00<2:41:44,  3.38s/it, lr: 1.0e-04 loss: 1.678e-01]mindexpander_qwen_v1:   4%|4         | 133/3000 [09:00<2:30:04,  3.14s/it, lr: 1.0e-04 loss: 1.678e-01]mindexpander_qwen_v1:   4%|4         | 133/3000 [09:00<2:30:04,  3.14s/it, lr: 1.0e-04 loss: 1.678e-01]mindexpander_qwen_v1:   4%|4         | 133/3000 [09:03<2:30:04,  3.14s/it, lr: 1.0e-04 loss: 1.591e-02]mindexpander_qwen_v1:   4%|4         | 133/3000 [09:03<2:30:04,  3.14s/it, lr: 1.0e-04 loss: 1.591e-02]mindexpander_qwen_v1:   4%|4         | 134/3000 [09:03<2:21:21,  2.96s/it, lr: 1.0e-04 loss: 1.591e-02]mindexpander_qwen_v1:   4%|4         | 134/3000 [09:03<2:21:21,  2.96s/it, lr: 1.0e-04 loss: 1.591e-02]mindexpander_qwen_v1:   4%|4         | 134/3000 [09:05<2:21:21,  2.96s/it, lr: 1.0e-04 loss: 2.008e-01]mindexpander_qwen_v1:   4%|4         | 134/3000 [09:05<2:21:21,  2.96s/it, lr: 1.0e-04 loss: 2.008e-01]mindexpander_qwen_v1:   4%|4         | 135/3000 [09:05<2:17:23,  2.88s/it, lr: 1.0e-04 loss: 2.008e-01]mindexpander_qwen_v1:   4%|4         | 135/3000 [09:05<2:17:23,  2.88s/it, lr: 1.0e-04 loss: 2.008e-01]mindexpander_qwen_v1:   4%|4         | 135/3000 [09:09<2:17:23,  2.88s/it, lr: 1.0e-04 loss: 5.391e-02]mindexpander_qwen_v1:   4%|4         | 135/3000 [09:09<2:17:23,  2.88s/it, lr: 1.0e-04 loss: 5.391e-02]mindexpander_qwen_v1:   5%|4         | 136/3000 [09:09<2:29:25,  3.13s/it, lr: 1.0e-04 loss: 5.391e-02]mindexpander_qwen_v1:   5%|4         | 136/3000 [09:09<2:29:25,  3.13s/it, lr: 1.0e-04 loss: 5.391e-02]mindexpander_qwen_v1:   5%|4         | 136/3000 [09:13<2:29:25,  3.13s/it, lr: 1.0e-04 loss: 4.918e-02]mindexpander_qwen_v1:   5%|4         | 136/3000 [09:13<2:29:25,  3.13s/it, lr: 1.0e-04 loss: 4.918e-02]mindexpander_qwen_v1:   5%|4         | 137/3000 [09:13<2:37:47,  3.31s/it, lr: 1.0e-04 loss: 4.918e-02]mindexpander_qwen_v1:   5%|4         | 137/3000 [09:13<2:37:47,  3.31s/it, lr: 1.0e-04 loss: 4.918e-02]mindexpander_qwen_v1:   5%|4         | 137/3000 [09:15<2:37:47,  3.31s/it, lr: 1.0e-04 loss: 7.209e-02]mindexpander_qwen_v1:   5%|4         | 137/3000 [09:15<2:37:47,  3.31s/it, lr: 1.0e-04 loss: 7.209e-02]mindexpander_qwen_v1:   5%|4         | 138/3000 [09:15<2:25:46,  3.06s/it, lr: 1.0e-04 loss: 7.209e-02]mindexpander_qwen_v1:   5%|4         | 138/3000 [09:15<2:25:46,  3.06s/it, lr: 1.0e-04 loss: 7.209e-02]mindexpander_qwen_v1:   5%|4         | 138/3000 [09:21<2:25:46,  3.06s/it, lr: 1.0e-04 loss: 7.458e-02]mindexpander_qwen_v1:   5%|4         | 138/3000 [09:21<2:25:46,  3.06s/it, lr: 1.0e-04 loss: 7.458e-02]mindexpander_qwen_v1:   5%|4         | 139/3000 [09:21<3:05:10,  3.88s/it, lr: 1.0e-04 loss: 7.458e-02]mindexpander_qwen_v1:   5%|4         | 139/3000 [09:21<3:05:10,  3.88s/it, lr: 1.0e-04 loss: 7.458e-02]mindexpander_qwen_v1:   5%|4         | 139/3000 [09:25<3:05:10,  3.88s/it, lr: 1.0e-04 loss: 1.182e-01]mindexpander_qwen_v1:   5%|4         | 139/3000 [09:25<3:05:10,  3.88s/it, lr: 1.0e-04 loss: 1.182e-01]mindexpander_qwen_v1:   5%|4         | 140/3000 [09:27<3:05:06,  3.88s/it, lr: 1.0e-04 loss: 2.063e-02]mindexpander_qwen_v1:   5%|4         | 140/3000 [09:27<3:05:06,  3.88s/it, lr: 1.0e-04 loss: 2.063e-02]mindexpander_qwen_v1:   5%|4         | 141/3000 [09:27<2:07:06,  2.67s/it, lr: 1.0e-04 loss: 2.063e-02]mindexpander_qwen_v1:   5%|4         | 141/3000 [09:27<2:07:06,  2.67s/it, lr: 1.0e-04 loss: 2.063e-02]mindexpander_qwen_v1:   5%|4         | 141/3000 [09:33<2:07:06,  2.67s/it, lr: 1.0e-04 loss: 2.253e-02]mindexpander_qwen_v1:   5%|4         | 141/3000 [09:33<2:07:06,  2.67s/it, lr: 1.0e-04 loss: 2.253e-02]mindexpander_qwen_v1:   5%|4         | 142/3000 [09:33<2:43:16,  3.43s/it, lr: 1.0e-04 loss: 2.253e-02]mindexpander_qwen_v1:   5%|4         | 142/3000 [09:33<2:43:16,  3.43s/it, lr: 1.0e-04 loss: 2.253e-02]mindexpander_qwen_v1:   5%|4         | 142/3000 [09:37<2:43:16,  3.43s/it, lr: 1.0e-04 loss: 2.910e-02]mindexpander_qwen_v1:   5%|4         | 142/3000 [09:37<2:43:16,  3.43s/it, lr: 1.0e-04 loss: 2.910e-02]mindexpander_qwen_v1:   5%|4         | 143/3000 [09:37<2:48:57,  3.55s/it, lr: 1.0e-04 loss: 2.910e-02]mindexpander_qwen_v1:   5%|4         | 143/3000 [09:37<2:48:57,  3.55s/it, lr: 1.0e-04 loss: 2.910e-02]mindexpander_qwen_v1:   5%|4         | 143/3000 [09:41<2:48:57,  3.55s/it, lr: 1.0e-04 loss: 1.673e-01]mindexpander_qwen_v1:   5%|4         | 143/3000 [09:41<2:48:57,  3.55s/it, lr: 1.0e-04 loss: 1.673e-01]mindexpander_qwen_v1:   5%|4         | 144/3000 [09:41<2:51:25,  3.60s/it, lr: 1.0e-04 loss: 1.673e-01]mindexpander_qwen_v1:   5%|4         | 144/3000 [09:41<2:51:25,  3.60s/it, lr: 1.0e-04 loss: 1.673e-01]mindexpander_qwen_v1:   5%|4         | 144/3000 [09:46<2:51:25,  3.60s/it, lr: 1.0e-04 loss: 2.480e-02]mindexpander_qwen_v1:   5%|4         | 144/3000 [09:46<2:51:25,  3.60s/it, lr: 1.0e-04 loss: 2.480e-02]mindexpander_qwen_v1:   5%|4         | 145/3000 [09:46<3:19:58,  4.20s/it, lr: 1.0e-04 loss: 2.480e-02]mindexpander_qwen_v1:   5%|4         | 145/3000 [09:46<3:19:58,  4.20s/it, lr: 1.0e-04 loss: 2.480e-02]mindexpander_qwen_v1:   5%|4         | 145/3000 [09:50<3:19:58,  4.20s/it, lr: 1.0e-04 loss: 5.350e-02]mindexpander_qwen_v1:   5%|4         | 145/3000 [09:50<3:19:58,  4.20s/it, lr: 1.0e-04 loss: 5.350e-02]mindexpander_qwen_v1:   5%|4         | 146/3000 [09:50<3:13:38,  4.07s/it, lr: 1.0e-04 loss: 5.350e-02]mindexpander_qwen_v1:   5%|4         | 146/3000 [09:50<3:13:38,  4.07s/it, lr: 1.0e-04 loss: 5.350e-02]mindexpander_qwen_v1:   5%|4         | 146/3000 [09:56<3:13:38,  4.07s/it, lr: 1.0e-04 loss: 6.501e-02]mindexpander_qwen_v1:   5%|4         | 146/3000 [09:56<3:13:38,  4.07s/it, lr: 1.0e-04 loss: 6.501e-02]mindexpander_qwen_v1:   5%|4         | 147/3000 [09:56<3:38:16,  4.59s/it, lr: 1.0e-04 loss: 6.501e-02]mindexpander_qwen_v1:   5%|4         | 147/3000 [09:56<3:38:16,  4.59s/it, lr: 1.0e-04 loss: 6.501e-02]mindexpander_qwen_v1:   5%|4         | 147/3000 [09:58<3:38:16,  4.59s/it, lr: 1.0e-04 loss: 7.401e-02]mindexpander_qwen_v1:   5%|4         | 147/3000 [09:58<3:38:16,  4.59s/it, lr: 1.0e-04 loss: 7.401e-02]mindexpander_qwen_v1:   5%|4         | 148/3000 [09:58<3:08:16,  3.96s/it, lr: 1.0e-04 loss: 7.401e-02]mindexpander_qwen_v1:   5%|4         | 148/3000 [09:58<3:08:16,  3.96s/it, lr: 1.0e-04 loss: 7.401e-02]mindexpander_qwen_v1:   5%|4         | 148/3000 [10:04<3:08:16,  3.96s/it, lr: 1.0e-04 loss: 1.691e-01]mindexpander_qwen_v1:   5%|4         | 148/3000 [10:04<3:08:16,  3.96s/it, lr: 1.0e-04 loss: 1.691e-01]mindexpander_qwen_v1:   5%|4         | 149/3000 [10:04<3:33:18,  4.49s/it, lr: 1.0e-04 loss: 1.691e-01]mindexpander_qwen_v1:   5%|4         | 149/3000 [10:04<3:33:18,  4.49s/it, lr: 1.0e-04 loss: 1.691e-01]mindexpander_qwen_v1:   5%|4         | 149/3000 [10:07<3:33:18,  4.49s/it, lr: 1.0e-04 loss: 9.730e-02]mindexpander_qwen_v1:   5%|4         | 149/3000 [10:07<3:33:18,  4.49s/it, lr: 1.0e-04 loss: 9.730e-02]mindexpander_qwen_v1:   5%|5         | 150/3000 [10:10<3:33:14,  4.49s/it, lr: 1.0e-04 loss: 1.611e-01]mindexpander_qwen_v1:   5%|5         | 150/3000 [10:10<3:33:14,  4.49s/it, lr: 1.0e-04 loss: 1.611e-01]mindexpander_qwen_v1:   5%|5         | 151/3000 [10:10<2:22:18,  3.00s/it, lr: 1.0e-04 loss: 1.611e-01]mindexpander_qwen_v1:   5%|5         | 151/3000 [10:10<2:22:18,  3.00s/it, lr: 1.0e-04 loss: 1.611e-01]mindexpander_qwen_v1:   5%|5         | 151/3000 [10:12<2:22:18,  3.00s/it, lr: 1.0e-04 loss: 1.385e-01]mindexpander_qwen_v1:   5%|5         | 151/3000 [10:12<2:22:18,  3.00s/it, lr: 1.0e-04 loss: 1.385e-01]mindexpander_qwen_v1:   5%|5         | 152/3000 [10:12<2:15:52,  2.86s/it, lr: 1.0e-04 loss: 1.385e-01]mindexpander_qwen_v1:   5%|5         | 152/3000 [10:12<2:15:52,  2.86s/it, lr: 1.0e-04 loss: 1.385e-01]mindexpander_qwen_v1:   5%|5         | 152/3000 [10:16<2:15:52,  2.86s/it, lr: 1.0e-04 loss: 1.004e-01]mindexpander_qwen_v1:   5%|5         | 152/3000 [10:16<2:15:52,  2.86s/it, lr: 1.0e-04 loss: 1.004e-01]mindexpander_qwen_v1:   5%|5         | 153/3000 [10:16<2:26:33,  3.09s/it, lr: 1.0e-04 loss: 1.004e-01]mindexpander_qwen_v1:   5%|5         | 153/3000 [10:16<2:26:33,  3.09s/it, lr: 1.0e-04 loss: 1.004e-01]mindexpander_qwen_v1:   5%|5         | 153/3000 [10:22<2:26:33,  3.09s/it, lr: 1.0e-04 loss: 1.808e-02]mindexpander_qwen_v1:   5%|5         | 153/3000 [10:22<2:26:33,  3.09s/it, lr: 1.0e-04 loss: 1.808e-02]mindexpander_qwen_v1:   5%|5         | 154/3000 [10:22<3:02:43,  3.85s/it, lr: 1.0e-04 loss: 1.808e-02]mindexpander_qwen_v1:   5%|5         | 154/3000 [10:22<3:02:43,  3.85s/it, lr: 1.0e-04 loss: 1.808e-02]mindexpander_qwen_v1:   5%|5         | 154/3000 [10:24<3:02:43,  3.85s/it, lr: 1.0e-04 loss: 6.591e-02]mindexpander_qwen_v1:   5%|5         | 154/3000 [10:24<3:02:43,  3.85s/it, lr: 1.0e-04 loss: 6.591e-02]mindexpander_qwen_v1:   5%|5         | 155/3000 [10:24<2:44:02,  3.46s/it, lr: 1.0e-04 loss: 6.591e-02]mindexpander_qwen_v1:   5%|5         | 155/3000 [10:24<2:44:02,  3.46s/it, lr: 1.0e-04 loss: 6.591e-02]mindexpander_qwen_v1:   5%|5         | 155/3000 [10:27<2:44:02,  3.46s/it, lr: 1.0e-04 loss: 3.963e-02]mindexpander_qwen_v1:   5%|5         | 155/3000 [10:27<2:44:02,  3.46s/it, lr: 1.0e-04 loss: 3.963e-02]mindexpander_qwen_v1:   5%|5         | 156/3000 [10:27<2:30:25,  3.17s/it, lr: 1.0e-04 loss: 3.963e-02]mindexpander_qwen_v1:   5%|5         | 156/3000 [10:27<2:30:25,  3.17s/it, lr: 1.0e-04 loss: 3.963e-02]mindexpander_qwen_v1:   5%|5         | 156/3000 [10:32<2:30:25,  3.17s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:   5%|5         | 156/3000 [10:32<2:30:25,  3.17s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:   5%|5         | 157/3000 [10:32<3:05:49,  3.92s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:   5%|5         | 157/3000 [10:32<3:05:49,  3.92s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:   5%|5         | 157/3000 [10:38<3:05:49,  3.92s/it, lr: 1.0e-04 loss: 1.545e-01]mindexpander_qwen_v1:   5%|5         | 157/3000 [10:38<3:05:49,  3.92s/it, lr: 1.0e-04 loss: 1.545e-01]mindexpander_qwen_v1:   5%|5         | 158/3000 [10:38<3:33:02,  4.50s/it, lr: 1.0e-04 loss: 1.545e-01]mindexpander_qwen_v1:   5%|5         | 158/3000 [10:38<3:33:02,  4.50s/it, lr: 1.0e-04 loss: 1.545e-01]mindexpander_qwen_v1:   5%|5         | 158/3000 [10:44<3:33:02,  4.50s/it, lr: 1.0e-04 loss: 7.266e-02]mindexpander_qwen_v1:   5%|5         | 158/3000 [10:44<3:33:02,  4.50s/it, lr: 1.0e-04 loss: 7.266e-02]mindexpander_qwen_v1:   5%|5         | 159/3000 [10:44<3:50:36,  4.87s/it, lr: 1.0e-04 loss: 7.266e-02]mindexpander_qwen_v1:   5%|5         | 159/3000 [10:44<3:50:36,  4.87s/it, lr: 1.0e-04 loss: 7.266e-02]mindexpander_qwen_v1:   5%|5         | 159/3000 [10:48<3:50:36,  4.87s/it, lr: 1.0e-04 loss: 1.989e-01]mindexpander_qwen_v1:   5%|5         | 159/3000 [10:48<3:50:36,  4.87s/it, lr: 1.0e-04 loss: 1.989e-01]mindexpander_qwen_v1:   5%|5         | 160/3000 [10:52<3:50:31,  4.87s/it, lr: 1.0e-04 loss: 1.364e-01]mindexpander_qwen_v1:   5%|5         | 160/3000 [10:52<3:50:31,  4.87s/it, lr: 1.0e-04 loss: 1.364e-01]mindexpander_qwen_v1:   5%|5         | 161/3000 [10:52<2:45:34,  3.50s/it, lr: 1.0e-04 loss: 1.364e-01]mindexpander_qwen_v1:   5%|5         | 161/3000 [10:52<2:45:34,  3.50s/it, lr: 1.0e-04 loss: 1.364e-01]mindexpander_qwen_v1:   5%|5         | 161/3000 [10:56<2:45:34,  3.50s/it, lr: 1.0e-04 loss: 9.263e-02]mindexpander_qwen_v1:   5%|5         | 161/3000 [10:56<2:45:34,  3.50s/it, lr: 1.0e-04 loss: 9.263e-02]mindexpander_qwen_v1:   5%|5         | 162/3000 [10:56<2:50:17,  3.60s/it, lr: 1.0e-04 loss: 9.263e-02]mindexpander_qwen_v1:   5%|5         | 162/3000 [10:56<2:50:17,  3.60s/it, lr: 1.0e-04 loss: 9.263e-02]mindexpander_qwen_v1:   5%|5         | 162/3000 [11:01<2:50:17,  3.60s/it, lr: 1.0e-04 loss: 1.860e-01]mindexpander_qwen_v1:   5%|5         | 162/3000 [11:01<2:50:17,  3.60s/it, lr: 1.0e-04 loss: 1.860e-01]mindexpander_qwen_v1:   5%|5         | 163/3000 [11:01<3:16:45,  4.16s/it, lr: 1.0e-04 loss: 1.860e-01]mindexpander_qwen_v1:   5%|5         | 163/3000 [11:01<3:16:45,  4.16s/it, lr: 1.0e-04 loss: 1.860e-01]mindexpander_qwen_v1:   5%|5         | 163/3000 [11:05<3:16:45,  4.16s/it, lr: 1.0e-04 loss: 5.030e-02]mindexpander_qwen_v1:   5%|5         | 163/3000 [11:05<3:16:45,  4.16s/it, lr: 1.0e-04 loss: 5.030e-02]mindexpander_qwen_v1:   5%|5         | 164/3000 [11:05<3:11:16,  4.05s/it, lr: 1.0e-04 loss: 5.030e-02]mindexpander_qwen_v1:   5%|5         | 164/3000 [11:05<3:11:16,  4.05s/it, lr: 1.0e-04 loss: 5.030e-02]mindexpander_qwen_v1:   5%|5         | 164/3000 [11:07<3:11:16,  4.05s/it, lr: 1.0e-04 loss: 6.214e-02]mindexpander_qwen_v1:   5%|5         | 164/3000 [11:07<3:11:16,  4.05s/it, lr: 1.0e-04 loss: 6.214e-02]mindexpander_qwen_v1:   6%|5         | 165/3000 [11:07<2:50:09,  3.60s/it, lr: 1.0e-04 loss: 6.214e-02]mindexpander_qwen_v1:   6%|5         | 165/3000 [11:07<2:50:09,  3.60s/it, lr: 1.0e-04 loss: 6.214e-02]mindexpander_qwen_v1:   6%|5         | 165/3000 [11:13<2:50:09,  3.60s/it, lr: 1.0e-04 loss: 4.168e-02]mindexpander_qwen_v1:   6%|5         | 165/3000 [11:13<2:50:09,  3.60s/it, lr: 1.0e-04 loss: 4.168e-02]mindexpander_qwen_v1:   6%|5         | 166/3000 [11:13<3:20:50,  4.25s/it, lr: 1.0e-04 loss: 4.168e-02]mindexpander_qwen_v1:   6%|5         | 166/3000 [11:13<3:20:50,  4.25s/it, lr: 1.0e-04 loss: 4.168e-02]mindexpander_qwen_v1:   6%|5         | 166/3000 [11:17<3:20:50,  4.25s/it, lr: 1.0e-04 loss: 4.442e-02]mindexpander_qwen_v1:   6%|5         | 166/3000 [11:17<3:20:50,  4.25s/it, lr: 1.0e-04 loss: 4.442e-02]mindexpander_qwen_v1:   6%|5         | 167/3000 [11:17<3:13:45,  4.10s/it, lr: 1.0e-04 loss: 4.442e-02]mindexpander_qwen_v1:   6%|5         | 167/3000 [11:17<3:13:45,  4.10s/it, lr: 1.0e-04 loss: 4.442e-02]mindexpander_qwen_v1:   6%|5         | 167/3000 [11:20<3:13:45,  4.10s/it, lr: 1.0e-04 loss: 7.032e-02]mindexpander_qwen_v1:   6%|5         | 167/3000 [11:20<3:13:45,  4.10s/it, lr: 1.0e-04 loss: 7.032e-02]mindexpander_qwen_v1:   6%|5         | 168/3000 [11:20<2:50:49,  3.62s/it, lr: 1.0e-04 loss: 7.032e-02]mindexpander_qwen_v1:   6%|5         | 168/3000 [11:20<2:50:49,  3.62s/it, lr: 1.0e-04 loss: 7.032e-02]mindexpander_qwen_v1:   6%|5         | 168/3000 [11:25<2:50:49,  3.62s/it, lr: 1.0e-04 loss: 9.751e-02]mindexpander_qwen_v1:   6%|5         | 168/3000 [11:25<2:50:49,  3.62s/it, lr: 1.0e-04 loss: 9.751e-02]mindexpander_qwen_v1:   6%|5         | 169/3000 [11:25<3:20:33,  4.25s/it, lr: 1.0e-04 loss: 9.751e-02]mindexpander_qwen_v1:   6%|5         | 169/3000 [11:25<3:20:33,  4.25s/it, lr: 1.0e-04 loss: 9.751e-02]mindexpander_qwen_v1:   6%|5         | 169/3000 [11:31<3:20:33,  4.25s/it, lr: 1.0e-04 loss: 1.195e-01]mindexpander_qwen_v1:   6%|5         | 169/3000 [11:31<3:20:33,  4.25s/it, lr: 1.0e-04 loss: 1.195e-01]mindexpander_qwen_v1:   6%|5         | 170/3000 [11:35<3:20:29,  4.25s/it, lr: 1.0e-04 loss: 1.768e-01]mindexpander_qwen_v1:   6%|5         | 170/3000 [11:35<3:20:29,  4.25s/it, lr: 1.0e-04 loss: 1.768e-01]mindexpander_qwen_v1:   6%|5         | 171/3000 [11:35<2:28:59,  3.16s/it, lr: 1.0e-04 loss: 1.768e-01]mindexpander_qwen_v1:   6%|5         | 171/3000 [11:35<2:28:59,  3.16s/it, lr: 1.0e-04 loss: 1.768e-01]mindexpander_qwen_v1:   6%|5         | 171/3000 [11:37<2:28:59,  3.16s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:   6%|5         | 171/3000 [11:37<2:28:59,  3.16s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:   6%|5         | 172/3000 [11:37<2:20:43,  2.99s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:   6%|5         | 172/3000 [11:37<2:20:43,  2.99s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:   6%|5         | 172/3000 [11:41<2:20:43,  2.99s/it, lr: 1.0e-04 loss: 1.847e-01]mindexpander_qwen_v1:   6%|5         | 172/3000 [11:41<2:20:43,  2.99s/it, lr: 1.0e-04 loss: 1.847e-01]mindexpander_qwen_v1:   6%|5         | 173/3000 [11:41<2:29:49,  3.18s/it, lr: 1.0e-04 loss: 1.847e-01]mindexpander_qwen_v1:   6%|5         | 173/3000 [11:41<2:29:49,  3.18s/it, lr: 1.0e-04 loss: 1.847e-01]mindexpander_qwen_v1:   6%|5         | 173/3000 [11:45<2:29:49,  3.18s/it, lr: 1.0e-04 loss: 1.203e-01]mindexpander_qwen_v1:   6%|5         | 173/3000 [11:45<2:29:49,  3.18s/it, lr: 1.0e-04 loss: 1.203e-01]mindexpander_qwen_v1:   6%|5         | 174/3000 [11:45<2:38:59,  3.38s/it, lr: 1.0e-04 loss: 1.203e-01]mindexpander_qwen_v1:   6%|5         | 174/3000 [11:45<2:38:59,  3.38s/it, lr: 1.0e-04 loss: 1.203e-01]mindexpander_qwen_v1:   6%|5         | 174/3000 [11:51<2:38:59,  3.38s/it, lr: 1.0e-04 loss: 1.168e-01]mindexpander_qwen_v1:   6%|5         | 174/3000 [11:51<2:38:59,  3.38s/it, lr: 1.0e-04 loss: 1.168e-01]mindexpander_qwen_v1:   6%|5         | 175/3000 [11:51<3:10:14,  4.04s/it, lr: 1.0e-04 loss: 1.168e-01]mindexpander_qwen_v1:   6%|5         | 175/3000 [11:51<3:10:14,  4.04s/it, lr: 1.0e-04 loss: 1.168e-01]mindexpander_qwen_v1:   6%|5         | 175/3000 [11:53<3:10:14,  4.04s/it, lr: 1.0e-04 loss: 6.483e-02]mindexpander_qwen_v1:   6%|5         | 175/3000 [11:53<3:10:14,  4.04s/it, lr: 1.0e-04 loss: 6.483e-02]mindexpander_qwen_v1:   6%|5         | 176/3000 [11:53<2:48:50,  3.59s/it, lr: 1.0e-04 loss: 6.483e-02]mindexpander_qwen_v1:   6%|5         | 176/3000 [11:53<2:48:50,  3.59s/it, lr: 1.0e-04 loss: 6.483e-02]mindexpander_qwen_v1:   6%|5         | 176/3000 [11:59<2:48:50,  3.59s/it, lr: 1.0e-04 loss: 4.353e-02]mindexpander_qwen_v1:   6%|5         | 176/3000 [11:59<2:48:50,  3.59s/it, lr: 1.0e-04 loss: 4.353e-02]mindexpander_qwen_v1:   6%|5         | 177/3000 [11:59<3:19:45,  4.25s/it, lr: 1.0e-04 loss: 4.353e-02]mindexpander_qwen_v1:   6%|5         | 177/3000 [11:59<3:19:45,  4.25s/it, lr: 1.0e-04 loss: 4.353e-02]mindexpander_qwen_v1:   6%|5         | 177/3000 [12:03<3:19:45,  4.25s/it, lr: 1.0e-04 loss: 1.447e-01]mindexpander_qwen_v1:   6%|5         | 177/3000 [12:03<3:19:45,  4.25s/it, lr: 1.0e-04 loss: 1.447e-01]mindexpander_qwen_v1:   6%|5         | 178/3000 [12:03<3:12:40,  4.10s/it, lr: 1.0e-04 loss: 1.447e-01]mindexpander_qwen_v1:   6%|5         | 178/3000 [12:03<3:12:40,  4.10s/it, lr: 1.0e-04 loss: 1.447e-01]mindexpander_qwen_v1:   6%|5         | 178/3000 [12:05<3:12:40,  4.10s/it, lr: 1.0e-04 loss: 1.025e-01]mindexpander_qwen_v1:   6%|5         | 178/3000 [12:05<3:12:40,  4.10s/it, lr: 1.0e-04 loss: 1.025e-01]mindexpander_qwen_v1:   6%|5         | 179/3000 [12:05<2:49:43,  3.61s/it, lr: 1.0e-04 loss: 1.025e-01]mindexpander_qwen_v1:   6%|5         | 179/3000 [12:05<2:49:43,  3.61s/it, lr: 1.0e-04 loss: 1.025e-01]mindexpander_qwen_v1:   6%|5         | 179/3000 [12:09<2:49:43,  3.61s/it, lr: 1.0e-04 loss: 7.441e-02]mindexpander_qwen_v1:   6%|5         | 179/3000 [12:09<2:49:43,  3.61s/it, lr: 1.0e-04 loss: 7.441e-02]mindexpander_qwen_v1:   6%|6         | 180/3000 [12:15<2:49:39,  3.61s/it, lr: 1.0e-04 loss: 1.226e-01]mindexpander_qwen_v1:   6%|6         | 180/3000 [12:15<2:49:39,  3.61s/it, lr: 1.0e-04 loss: 1.226e-01]mindexpander_qwen_v1:   6%|6         | 181/3000 [12:15<2:35:57,  3.32s/it, lr: 1.0e-04 loss: 1.226e-01]mindexpander_qwen_v1:   6%|6         | 181/3000 [12:15<2:35:57,  3.32s/it, lr: 1.0e-04 loss: 1.226e-01]mindexpander_qwen_v1:   6%|6         | 181/3000 [12:18<2:35:57,  3.32s/it, lr: 1.0e-04 loss: 5.965e-02]mindexpander_qwen_v1:   6%|6         | 181/3000 [12:18<2:35:57,  3.32s/it, lr: 1.0e-04 loss: 5.965e-02]mindexpander_qwen_v1:   6%|6         | 182/3000 [12:18<2:25:54,  3.11s/it, lr: 1.0e-04 loss: 5.965e-02]mindexpander_qwen_v1:   6%|6         | 182/3000 [12:18<2:25:54,  3.11s/it, lr: 1.0e-04 loss: 5.965e-02]mindexpander_qwen_v1:   6%|6         | 182/3000 [12:21<2:25:54,  3.11s/it, lr: 1.0e-04 loss: 1.907e-02]mindexpander_qwen_v1:   6%|6         | 182/3000 [12:21<2:25:54,  3.11s/it, lr: 1.0e-04 loss: 1.907e-02]mindexpander_qwen_v1:   6%|6         | 183/3000 [12:21<2:33:28,  3.27s/it, lr: 1.0e-04 loss: 1.907e-02]mindexpander_qwen_v1:   6%|6         | 183/3000 [12:21<2:33:28,  3.27s/it, lr: 1.0e-04 loss: 1.907e-02]mindexpander_qwen_v1:   6%|6         | 183/3000 [12:27<2:33:28,  3.27s/it, lr: 1.0e-04 loss: 1.136e-01]mindexpander_qwen_v1:   6%|6         | 183/3000 [12:27<2:33:28,  3.27s/it, lr: 1.0e-04 loss: 1.136e-01]mindexpander_qwen_v1:   6%|6         | 184/3000 [12:27<3:05:04,  3.94s/it, lr: 1.0e-04 loss: 1.136e-01]mindexpander_qwen_v1:   6%|6         | 184/3000 [12:27<3:05:04,  3.94s/it, lr: 1.0e-04 loss: 1.136e-01]mindexpander_qwen_v1:   6%|6         | 184/3000 [12:30<3:05:04,  3.94s/it, lr: 1.0e-04 loss: 1.120e-01]mindexpander_qwen_v1:   6%|6         | 184/3000 [12:30<3:05:04,  3.94s/it, lr: 1.0e-04 loss: 1.120e-01]mindexpander_qwen_v1:   6%|6         | 185/3000 [12:30<2:47:56,  3.58s/it, lr: 1.0e-04 loss: 1.120e-01]mindexpander_qwen_v1:   6%|6         | 185/3000 [12:30<2:47:56,  3.58s/it, lr: 1.0e-04 loss: 1.120e-01]mindexpander_qwen_v1:   6%|6         | 185/3000 [12:32<2:47:56,  3.58s/it, lr: 1.0e-04 loss: 2.088e-01]mindexpander_qwen_v1:   6%|6         | 185/3000 [12:32<2:47:56,  3.58s/it, lr: 1.0e-04 loss: 2.088e-01]mindexpander_qwen_v1:   6%|6         | 186/3000 [12:32<2:32:43,  3.26s/it, lr: 1.0e-04 loss: 2.088e-01]mindexpander_qwen_v1:   6%|6         | 186/3000 [12:32<2:32:43,  3.26s/it, lr: 1.0e-04 loss: 2.088e-01]mindexpander_qwen_v1:   6%|6         | 186/3000 [12:35<2:32:43,  3.26s/it, lr: 1.0e-04 loss: 3.908e-02]mindexpander_qwen_v1:   6%|6         | 186/3000 [12:35<2:32:43,  3.26s/it, lr: 1.0e-04 loss: 3.908e-02]mindexpander_qwen_v1:   6%|6         | 187/3000 [12:35<2:21:42,  3.02s/it, lr: 1.0e-04 loss: 3.908e-02]mindexpander_qwen_v1:   6%|6         | 187/3000 [12:35<2:21:42,  3.02s/it, lr: 1.0e-04 loss: 3.908e-02]mindexpander_qwen_v1:   6%|6         | 187/3000 [12:40<2:21:42,  3.02s/it, lr: 1.0e-04 loss: 1.842e-01]mindexpander_qwen_v1:   6%|6         | 187/3000 [12:40<2:21:42,  3.02s/it, lr: 1.0e-04 loss: 1.842e-01]mindexpander_qwen_v1:   6%|6         | 188/3000 [12:40<2:59:04,  3.82s/it, lr: 1.0e-04 loss: 1.842e-01]mindexpander_qwen_v1:   6%|6         | 188/3000 [12:40<2:59:04,  3.82s/it, lr: 1.0e-04 loss: 1.842e-01]mindexpander_qwen_v1:   6%|6         | 188/3000 [12:44<2:59:04,  3.82s/it, lr: 1.0e-04 loss: 1.256e-01]mindexpander_qwen_v1:   6%|6         | 188/3000 [12:44<2:59:04,  3.82s/it, lr: 1.0e-04 loss: 1.256e-01]mindexpander_qwen_v1:   6%|6         | 189/3000 [12:44<3:00:08,  3.85s/it, lr: 1.0e-04 loss: 1.256e-01]mindexpander_qwen_v1:   6%|6         | 189/3000 [12:44<3:00:08,  3.85s/it, lr: 1.0e-04 loss: 1.256e-01]mindexpander_qwen_v1:   6%|6         | 189/3000 [12:47<3:00:08,  3.85s/it, lr: 1.0e-04 loss: 1.740e-01]mindexpander_qwen_v1:   6%|6         | 189/3000 [12:47<3:00:08,  3.85s/it, lr: 1.0e-04 loss: 1.740e-01]mindexpander_qwen_v1:   6%|6         | 190/3000 [12:53<3:00:04,  3.85s/it, lr: 1.0e-04 loss: 3.198e-02]mindexpander_qwen_v1:   6%|6         | 190/3000 [12:53<3:00:04,  3.85s/it, lr: 1.0e-04 loss: 3.198e-02]mindexpander_qwen_v1:   6%|6         | 191/3000 [12:53<2:39:21,  3.40s/it, lr: 1.0e-04 loss: 3.198e-02]mindexpander_qwen_v1:   6%|6         | 191/3000 [12:53<2:39:21,  3.40s/it, lr: 1.0e-04 loss: 3.198e-02]mindexpander_qwen_v1:   6%|6         | 191/3000 [12:56<2:39:21,  3.40s/it, lr: 1.0e-04 loss: 8.667e-02]mindexpander_qwen_v1:   6%|6         | 191/3000 [12:56<2:39:21,  3.40s/it, lr: 1.0e-04 loss: 8.667e-02]mindexpander_qwen_v1:   6%|6         | 192/3000 [12:56<2:43:13,  3.49s/it, lr: 1.0e-04 loss: 8.667e-02]mindexpander_qwen_v1:   6%|6         | 192/3000 [12:56<2:43:13,  3.49s/it, lr: 1.0e-04 loss: 8.667e-02]mindexpander_qwen_v1:   6%|6         | 192/3000 [12:59<2:43:13,  3.49s/it, lr: 1.0e-04 loss: 4.295e-02]mindexpander_qwen_v1:   6%|6         | 192/3000 [12:59<2:43:13,  3.49s/it, lr: 1.0e-04 loss: 4.295e-02]mindexpander_qwen_v1:   6%|6         | 193/3000 [12:59<2:32:43,  3.26s/it, lr: 1.0e-04 loss: 4.295e-02]mindexpander_qwen_v1:   6%|6         | 193/3000 [12:59<2:32:43,  3.26s/it, lr: 1.0e-04 loss: 4.295e-02]mindexpander_qwen_v1:   6%|6         | 193/3000 [13:05<2:32:43,  3.26s/it, lr: 1.0e-04 loss: 1.742e-02]mindexpander_qwen_v1:   6%|6         | 193/3000 [13:05<2:32:43,  3.26s/it, lr: 1.0e-04 loss: 1.742e-02]mindexpander_qwen_v1:   6%|6         | 194/3000 [13:05<3:04:17,  3.94s/it, lr: 1.0e-04 loss: 1.742e-02]mindexpander_qwen_v1:   6%|6         | 194/3000 [13:05<3:04:17,  3.94s/it, lr: 1.0e-04 loss: 1.742e-02]mindexpander_qwen_v1:   6%|6         | 194/3000 [13:10<3:04:17,  3.94s/it, lr: 1.0e-04 loss: 1.554e-01]mindexpander_qwen_v1:   6%|6         | 194/3000 [13:10<3:04:17,  3.94s/it, lr: 1.0e-04 loss: 1.554e-01]mindexpander_qwen_v1:   6%|6         | 195/3000 [13:10<3:27:56,  4.45s/it, lr: 1.0e-04 loss: 1.554e-01]mindexpander_qwen_v1:   6%|6         | 195/3000 [13:10<3:27:56,  4.45s/it, lr: 1.0e-04 loss: 1.554e-01]mindexpander_qwen_v1:   6%|6         | 195/3000 [13:14<3:27:56,  4.45s/it, lr: 1.0e-04 loss: 1.434e-02]mindexpander_qwen_v1:   6%|6         | 195/3000 [13:14<3:27:56,  4.45s/it, lr: 1.0e-04 loss: 1.434e-02]mindexpander_qwen_v1:   7%|6         | 196/3000 [13:14<3:18:28,  4.25s/it, lr: 1.0e-04 loss: 1.434e-02]mindexpander_qwen_v1:   7%|6         | 196/3000 [13:14<3:18:28,  4.25s/it, lr: 1.0e-04 loss: 1.434e-02]mindexpander_qwen_v1:   7%|6         | 196/3000 [13:20<3:18:28,  4.25s/it, lr: 1.0e-04 loss: 3.718e-02]mindexpander_qwen_v1:   7%|6         | 196/3000 [13:20<3:18:28,  4.25s/it, lr: 1.0e-04 loss: 3.718e-02]mindexpander_qwen_v1:   7%|6         | 197/3000 [13:20<3:40:13,  4.71s/it, lr: 1.0e-04 loss: 3.718e-02]mindexpander_qwen_v1:   7%|6         | 197/3000 [13:20<3:40:13,  4.71s/it, lr: 1.0e-04 loss: 3.718e-02]mindexpander_qwen_v1:   7%|6         | 197/3000 [13:24<3:40:13,  4.71s/it, lr: 1.0e-04 loss: 6.355e-03]mindexpander_qwen_v1:   7%|6         | 197/3000 [13:24<3:40:13,  4.71s/it, lr: 1.0e-04 loss: 6.355e-03]mindexpander_qwen_v1:   7%|6         | 198/3000 [13:24<3:26:52,  4.43s/it, lr: 1.0e-04 loss: 6.355e-03]mindexpander_qwen_v1:   7%|6         | 198/3000 [13:24<3:26:52,  4.43s/it, lr: 1.0e-04 loss: 6.355e-03]mindexpander_qwen_v1:   7%|6         | 198/3000 [13:26<3:26:52,  4.43s/it, lr: 1.0e-04 loss: 7.656e-02]mindexpander_qwen_v1:   7%|6         | 198/3000 [13:26<3:26:52,  4.43s/it, lr: 1.0e-04 loss: 7.656e-02]mindexpander_qwen_v1:   7%|6         | 199/3000 [13:26<2:59:32,  3.85s/it, lr: 1.0e-04 loss: 7.656e-02]mindexpander_qwen_v1:   7%|6         | 199/3000 [13:26<2:59:32,  3.85s/it, lr: 1.0e-04 loss: 7.656e-02]mindexpander_qwen_v1:   7%|6         | 199/3000 [13:32<2:59:32,  3.85s/it, lr: 1.0e-04 loss: 1.213e-01]mindexpander_qwen_v1:   7%|6         | 199/3000 [13:32<2:59:32,  3.85s/it, lr: 1.0e-04 loss: 1.213e-01]mindexpander_qwen_v1:   7%|6         | 200/3000 [13:35<2:59:28,  3.85s/it, lr: 1.0e-04 loss: 1.042e-01]mindexpander_qwen_v1:   7%|6         | 200/3000 [13:35<2:59:28,  3.85s/it, lr: 1.0e-04 loss: 1.042e-01]mindexpander_qwen_v1:   7%|6         | 201/3000 [13:35<2:05:33,  2.69s/it, lr: 1.0e-04 loss: 1.042e-01]mindexpander_qwen_v1:   7%|6         | 201/3000 [13:35<2:05:33,  2.69s/it, lr: 1.0e-04 loss: 1.042e-01]mindexpander_qwen_v1:   7%|6         | 201/3000 [13:38<2:05:33,  2.69s/it, lr: 1.0e-04 loss: 4.196e-02]mindexpander_qwen_v1:   7%|6         | 201/3000 [13:38<2:05:33,  2.69s/it, lr: 1.0e-04 loss: 4.196e-02]mindexpander_qwen_v1:   7%|6         | 202/3000 [13:38<2:17:30,  2.95s/it, lr: 1.0e-04 loss: 4.196e-02]mindexpander_qwen_v1:   7%|6         | 202/3000 [13:38<2:17:30,  2.95s/it, lr: 1.0e-04 loss: 4.196e-02]mindexpander_qwen_v1:   7%|6         | 202/3000 [13:42<2:17:30,  2.95s/it, lr: 1.0e-04 loss: 3.322e-02]mindexpander_qwen_v1:   7%|6         | 202/3000 [13:42<2:17:30,  2.95s/it, lr: 1.0e-04 loss: 3.322e-02]mindexpander_qwen_v1:   7%|6         | 203/3000 [13:42<2:26:58,  3.15s/it, lr: 1.0e-04 loss: 3.322e-02]mindexpander_qwen_v1:   7%|6         | 203/3000 [13:42<2:26:58,  3.15s/it, lr: 1.0e-04 loss: 3.322e-02]mindexpander_qwen_v1:   7%|6         | 203/3000 [13:48<2:26:58,  3.15s/it, lr: 1.0e-04 loss: 3.185e-02]mindexpander_qwen_v1:   7%|6         | 203/3000 [13:48<2:26:58,  3.15s/it, lr: 1.0e-04 loss: 3.185e-02]mindexpander_qwen_v1:   7%|6         | 204/3000 [13:48<3:01:19,  3.89s/it, lr: 1.0e-04 loss: 3.185e-02]mindexpander_qwen_v1:   7%|6         | 204/3000 [13:48<3:01:19,  3.89s/it, lr: 1.0e-04 loss: 3.185e-02]mindexpander_qwen_v1:   7%|6         | 204/3000 [13:52<3:01:19,  3.89s/it, lr: 1.0e-04 loss: 2.598e-03]mindexpander_qwen_v1:   7%|6         | 204/3000 [13:52<3:01:19,  3.89s/it, lr: 1.0e-04 loss: 2.598e-03]mindexpander_qwen_v1:   7%|6         | 205/3000 [13:52<2:59:12,  3.85s/it, lr: 1.0e-04 loss: 2.598e-03]mindexpander_qwen_v1:   7%|6         | 205/3000 [13:52<2:59:12,  3.85s/it, lr: 1.0e-04 loss: 2.598e-03]mindexpander_qwen_v1:   7%|6         | 205/3000 [13:57<2:59:12,  3.85s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:   7%|6         | 205/3000 [13:57<2:59:12,  3.85s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:   7%|6         | 206/3000 [13:57<3:24:23,  4.39s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:   7%|6         | 206/3000 [13:57<3:24:23,  4.39s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:   7%|6         | 206/3000 [14:00<3:24:23,  4.39s/it, lr: 1.0e-04 loss: 4.313e-02]mindexpander_qwen_v1:   7%|6         | 206/3000 [14:00<3:24:23,  4.39s/it, lr: 1.0e-04 loss: 4.313e-02]mindexpander_qwen_v1:   7%|6         | 207/3000 [14:00<2:58:07,  3.83s/it, lr: 1.0e-04 loss: 4.313e-02]mindexpander_qwen_v1:   7%|6         | 207/3000 [14:00<2:58:07,  3.83s/it, lr: 1.0e-04 loss: 4.313e-02]mindexpander_qwen_v1:   7%|6         | 207/3000 [14:03<2:58:07,  3.83s/it, lr: 1.0e-04 loss: 8.409e-02]mindexpander_qwen_v1:   7%|6         | 207/3000 [14:03<2:58:07,  3.83s/it, lr: 1.0e-04 loss: 8.409e-02]mindexpander_qwen_v1:   7%|6         | 208/3000 [14:03<2:42:03,  3.48s/it, lr: 1.0e-04 loss: 8.409e-02]mindexpander_qwen_v1:   7%|6         | 208/3000 [14:03<2:42:03,  3.48s/it, lr: 1.0e-04 loss: 8.409e-02]mindexpander_qwen_v1:   7%|6         | 208/3000 [14:06<2:42:03,  3.48s/it, lr: 1.0e-04 loss: 1.587e-01]mindexpander_qwen_v1:   7%|6         | 208/3000 [14:06<2:42:03,  3.48s/it, lr: 1.0e-04 loss: 1.587e-01]mindexpander_qwen_v1:   7%|6         | 209/3000 [14:06<2:45:38,  3.56s/it, lr: 1.0e-04 loss: 1.587e-01]mindexpander_qwen_v1:   7%|6         | 209/3000 [14:06<2:45:38,  3.56s/it, lr: 1.0e-04 loss: 1.587e-01]mindexpander_qwen_v1:   7%|6         | 209/3000 [14:09<2:45:38,  3.56s/it, lr: 1.0e-04 loss: 1.969e-01]mindexpander_qwen_v1:   7%|6         | 209/3000 [14:09<2:45:38,  3.56s/it, lr: 1.0e-04 loss: 1.969e-01]mindexpander_qwen_v1:   7%|7         | 210/3000 [14:15<2:45:35,  3.56s/it, lr: 1.0e-04 loss: 2.261e-02]mindexpander_qwen_v1:   7%|7         | 210/3000 [14:15<2:45:35,  3.56s/it, lr: 1.0e-04 loss: 2.261e-02]mindexpander_qwen_v1:   7%|7         | 211/3000 [14:15<2:31:09,  3.25s/it, lr: 1.0e-04 loss: 2.261e-02]mindexpander_qwen_v1:   7%|7         | 211/3000 [14:15<2:31:09,  3.25s/it, lr: 1.0e-04 loss: 2.261e-02]mindexpander_qwen_v1:   7%|7         | 211/3000 [14:21<2:31:09,  3.25s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:   7%|7         | 211/3000 [14:21<2:31:09,  3.25s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:   7%|7         | 212/3000 [14:21<3:01:56,  3.92s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:   7%|7         | 212/3000 [14:21<3:01:56,  3.92s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:   7%|7         | 212/3000 [14:23<3:01:56,  3.92s/it, lr: 1.0e-04 loss: 5.883e-02]mindexpander_qwen_v1:   7%|7         | 212/3000 [14:23<3:01:56,  3.92s/it, lr: 1.0e-04 loss: 5.883e-02]mindexpander_qwen_v1:   7%|7         | 213/3000 [14:23<2:44:08,  3.53s/it, lr: 1.0e-04 loss: 5.883e-02]mindexpander_qwen_v1:   7%|7         | 213/3000 [14:23<2:44:08,  3.53s/it, lr: 1.0e-04 loss: 5.883e-02]mindexpander_qwen_v1:   7%|7         | 213/3000 [14:26<2:44:08,  3.53s/it, lr: 1.0e-04 loss: 3.981e-02]mindexpander_qwen_v1:   7%|7         | 213/3000 [14:26<2:44:08,  3.53s/it, lr: 1.0e-04 loss: 3.981e-02]mindexpander_qwen_v1:   7%|7         | 214/3000 [14:26<2:30:26,  3.24s/it, lr: 1.0e-04 loss: 3.981e-02]mindexpander_qwen_v1:   7%|7         | 214/3000 [14:26<2:30:26,  3.24s/it, lr: 1.0e-04 loss: 3.981e-02]mindexpander_qwen_v1:   7%|7         | 214/3000 [14:29<2:30:26,  3.24s/it, lr: 1.0e-04 loss: 4.806e-02]mindexpander_qwen_v1:   7%|7         | 214/3000 [14:29<2:30:26,  3.24s/it, lr: 1.0e-04 loss: 4.806e-02]mindexpander_qwen_v1:   7%|7         | 215/3000 [14:29<2:36:56,  3.38s/it, lr: 1.0e-04 loss: 4.806e-02]mindexpander_qwen_v1:   7%|7         | 215/3000 [14:29<2:36:56,  3.38s/it, lr: 1.0e-04 loss: 4.806e-02]mindexpander_qwen_v1:   7%|7         | 215/3000 [14:32<2:36:56,  3.38s/it, lr: 1.0e-04 loss: 1.228e-01]mindexpander_qwen_v1:   7%|7         | 215/3000 [14:32<2:36:56,  3.38s/it, lr: 1.0e-04 loss: 1.228e-01]mindexpander_qwen_v1:   7%|7         | 216/3000 [14:32<2:27:07,  3.17s/it, lr: 1.0e-04 loss: 1.228e-01]mindexpander_qwen_v1:   7%|7         | 216/3000 [14:32<2:27:07,  3.17s/it, lr: 1.0e-04 loss: 1.228e-01]mindexpander_qwen_v1:   7%|7         | 216/3000 [14:36<2:27:07,  3.17s/it, lr: 1.0e-04 loss: 8.213e-02]mindexpander_qwen_v1:   7%|7         | 216/3000 [14:36<2:27:07,  3.17s/it, lr: 1.0e-04 loss: 8.213e-02]mindexpander_qwen_v1:   7%|7         | 217/3000 [14:36<2:34:44,  3.34s/it, lr: 1.0e-04 loss: 8.213e-02]mindexpander_qwen_v1:   7%|7         | 217/3000 [14:36<2:34:44,  3.34s/it, lr: 1.0e-04 loss: 8.213e-02]mindexpander_qwen_v1:   7%|7         | 217/3000 [14:40<2:34:44,  3.34s/it, lr: 1.0e-04 loss: 6.221e-02]mindexpander_qwen_v1:   7%|7         | 217/3000 [14:40<2:34:44,  3.34s/it, lr: 1.0e-04 loss: 6.221e-02]mindexpander_qwen_v1:   7%|7         | 218/3000 [14:40<2:40:08,  3.45s/it, lr: 1.0e-04 loss: 6.221e-02]mindexpander_qwen_v1:   7%|7         | 218/3000 [14:40<2:40:08,  3.45s/it, lr: 1.0e-04 loss: 6.221e-02]mindexpander_qwen_v1:   7%|7         | 218/3000 [14:45<2:40:08,  3.45s/it, lr: 1.0e-04 loss: 1.464e-01]mindexpander_qwen_v1:   7%|7         | 218/3000 [14:45<2:40:08,  3.45s/it, lr: 1.0e-04 loss: 1.464e-01]mindexpander_qwen_v1:   7%|7         | 219/3000 [14:45<3:11:34,  4.13s/it, lr: 1.0e-04 loss: 1.464e-01]mindexpander_qwen_v1:   7%|7         | 219/3000 [14:45<3:11:34,  4.13s/it, lr: 1.0e-04 loss: 1.464e-01]mindexpander_qwen_v1:   7%|7         | 219/3000 [14:51<3:11:34,  4.13s/it, lr: 1.0e-04 loss: 6.542e-02]mindexpander_qwen_v1:   7%|7         | 219/3000 [14:51<3:11:34,  4.13s/it, lr: 1.0e-04 loss: 6.542e-02]mindexpander_qwen_v1:   7%|7         | 220/3000 [14:57<3:11:30,  4.13s/it, lr: 1.0e-04 loss: 6.260e-02]mindexpander_qwen_v1:   7%|7         | 220/3000 [14:57<3:11:30,  4.13s/it, lr: 1.0e-04 loss: 6.260e-02]mindexpander_qwen_v1:   7%|7         | 221/3000 [14:57<2:44:57,  3.56s/it, lr: 1.0e-04 loss: 6.260e-02]mindexpander_qwen_v1:   7%|7         | 221/3000 [14:57<2:44:57,  3.56s/it, lr: 1.0e-04 loss: 6.260e-02]mindexpander_qwen_v1:   7%|7         | 221/3000 [15:03<2:44:57,  3.56s/it, lr: 1.0e-04 loss: 1.720e-02]mindexpander_qwen_v1:   7%|7         | 221/3000 [15:03<2:44:57,  3.56s/it, lr: 1.0e-04 loss: 1.720e-02]mindexpander_qwen_v1:   7%|7         | 222/3000 [15:03<3:10:04,  4.11s/it, lr: 1.0e-04 loss: 1.720e-02]mindexpander_qwen_v1:   7%|7         | 222/3000 [15:03<3:10:04,  4.11s/it, lr: 1.0e-04 loss: 1.720e-02]mindexpander_qwen_v1:   7%|7         | 222/3000 [15:05<3:10:04,  4.11s/it, lr: 1.0e-04 loss: 1.884e-01]mindexpander_qwen_v1:   7%|7         | 222/3000 [15:05<3:10:04,  4.11s/it, lr: 1.0e-04 loss: 1.884e-01]mindexpander_qwen_v1:   7%|7         | 223/3000 [15:05<2:50:03,  3.67s/it, lr: 1.0e-04 loss: 1.884e-01]mindexpander_qwen_v1:   7%|7         | 223/3000 [15:05<2:50:03,  3.67s/it, lr: 1.0e-04 loss: 1.884e-01]mindexpander_qwen_v1:   7%|7         | 223/3000 [15:09<2:50:03,  3.67s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:   7%|7         | 223/3000 [15:09<2:50:03,  3.67s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:   7%|7         | 224/3000 [15:09<2:52:48,  3.73s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:   7%|7         | 224/3000 [15:09<2:52:48,  3.73s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:   7%|7         | 224/3000 [15:13<2:52:48,  3.73s/it, lr: 1.0e-04 loss: 3.941e-02]mindexpander_qwen_v1:   7%|7         | 224/3000 [15:13<2:52:48,  3.73s/it, lr: 1.0e-04 loss: 3.941e-02]mindexpander_qwen_v1:   8%|7         | 225/3000 [15:13<2:52:51,  3.74s/it, lr: 1.0e-04 loss: 3.941e-02]mindexpander_qwen_v1:   8%|7         | 225/3000 [15:13<2:52:51,  3.74s/it, lr: 1.0e-04 loss: 3.941e-02]mindexpander_qwen_v1:   8%|7         | 225/3000 [15:17<2:52:51,  3.74s/it, lr: 1.0e-04 loss: 1.858e-01]mindexpander_qwen_v1:   8%|7         | 225/3000 [15:17<2:52:51,  3.74s/it, lr: 1.0e-04 loss: 1.858e-01]mindexpander_qwen_v1:   8%|7         | 226/3000 [15:17<2:52:53,  3.74s/it, lr: 1.0e-04 loss: 1.858e-01]mindexpander_qwen_v1:   8%|7         | 226/3000 [15:17<2:52:53,  3.74s/it, lr: 1.0e-04 loss: 1.858e-01]mindexpander_qwen_v1:   8%|7         | 226/3000 [15:22<2:52:53,  3.74s/it, lr: 1.0e-04 loss: 2.118e-02]mindexpander_qwen_v1:   8%|7         | 226/3000 [15:22<2:52:53,  3.74s/it, lr: 1.0e-04 loss: 2.118e-02]mindexpander_qwen_v1:   8%|7         | 227/3000 [15:22<3:19:54,  4.33s/it, lr: 1.0e-04 loss: 2.118e-02]mindexpander_qwen_v1:   8%|7         | 227/3000 [15:22<3:19:54,  4.33s/it, lr: 1.0e-04 loss: 2.118e-02]mindexpander_qwen_v1:   8%|7         | 227/3000 [15:25<3:19:54,  4.33s/it, lr: 1.0e-04 loss: 1.708e-01]mindexpander_qwen_v1:   8%|7         | 227/3000 [15:25<3:19:54,  4.33s/it, lr: 1.0e-04 loss: 1.708e-01]mindexpander_qwen_v1:   8%|7         | 228/3000 [15:25<2:56:56,  3.83s/it, lr: 1.0e-04 loss: 1.708e-01]mindexpander_qwen_v1:   8%|7         | 228/3000 [15:25<2:56:56,  3.83s/it, lr: 1.0e-04 loss: 1.708e-01]mindexpander_qwen_v1:   8%|7         | 228/3000 [15:31<2:56:56,  3.83s/it, lr: 1.0e-04 loss: 4.295e-02]mindexpander_qwen_v1:   8%|7         | 228/3000 [15:31<2:56:56,  3.83s/it, lr: 1.0e-04 loss: 4.295e-02]mindexpander_qwen_v1:   8%|7         | 229/3000 [15:31<3:23:03,  4.40s/it, lr: 1.0e-04 loss: 4.295e-02]mindexpander_qwen_v1:   8%|7         | 229/3000 [15:31<3:23:03,  4.40s/it, lr: 1.0e-04 loss: 4.295e-02]mindexpander_qwen_v1:   8%|7         | 229/3000 [15:34<3:23:03,  4.40s/it, lr: 1.0e-04 loss: 5.146e-02]mindexpander_qwen_v1:   8%|7         | 229/3000 [15:34<3:23:03,  4.40s/it, lr: 1.0e-04 loss: 5.146e-02]mindexpander_qwen_v1:   8%|7         | 230/3000 [15:37<3:22:59,  4.40s/it, lr: 1.0e-04 loss: 1.992e-01]mindexpander_qwen_v1:   8%|7         | 230/3000 [15:37<3:22:59,  4.40s/it, lr: 1.0e-04 loss: 1.992e-01]mindexpander_qwen_v1:   8%|7         | 231/3000 [15:37<2:17:48,  2.99s/it, lr: 1.0e-04 loss: 1.992e-01]mindexpander_qwen_v1:   8%|7         | 231/3000 [15:37<2:17:48,  2.99s/it, lr: 1.0e-04 loss: 1.992e-01]mindexpander_qwen_v1:   8%|7         | 231/3000 [15:41<2:17:48,  2.99s/it, lr: 1.0e-04 loss: 1.244e-01]mindexpander_qwen_v1:   8%|7         | 231/3000 [15:41<2:17:48,  2.99s/it, lr: 1.0e-04 loss: 1.244e-01]mindexpander_qwen_v1:   8%|7         | 232/3000 [15:41<2:26:13,  3.17s/it, lr: 1.0e-04 loss: 1.244e-01]mindexpander_qwen_v1:   8%|7         | 232/3000 [15:41<2:26:13,  3.17s/it, lr: 1.0e-04 loss: 1.244e-01]mindexpander_qwen_v1:   8%|7         | 232/3000 [15:45<2:26:13,  3.17s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:   8%|7         | 232/3000 [15:45<2:26:13,  3.17s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:   8%|7         | 233/3000 [15:45<2:32:56,  3.32s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:   8%|7         | 233/3000 [15:45<2:32:56,  3.32s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:   8%|7         | 233/3000 [15:47<2:32:56,  3.32s/it, lr: 1.0e-04 loss: 7.985e-02]mindexpander_qwen_v1:   8%|7         | 233/3000 [15:47<2:32:56,  3.32s/it, lr: 1.0e-04 loss: 7.985e-02]mindexpander_qwen_v1:   8%|7         | 234/3000 [15:47<2:21:57,  3.08s/it, lr: 1.0e-04 loss: 7.985e-02]mindexpander_qwen_v1:   8%|7         | 234/3000 [15:47<2:21:57,  3.08s/it, lr: 1.0e-04 loss: 7.985e-02]mindexpander_qwen_v1:   8%|7         | 234/3000 [15:53<2:21:57,  3.08s/it, lr: 1.0e-04 loss: 3.147e-02]mindexpander_qwen_v1:   8%|7         | 234/3000 [15:53<2:21:57,  3.08s/it, lr: 1.0e-04 loss: 3.147e-02]mindexpander_qwen_v1:   8%|7         | 235/3000 [15:53<2:57:59,  3.86s/it, lr: 1.0e-04 loss: 3.147e-02]mindexpander_qwen_v1:   8%|7         | 235/3000 [15:53<2:57:59,  3.86s/it, lr: 1.0e-04 loss: 3.147e-02]mindexpander_qwen_v1:   8%|7         | 235/3000 [15:57<2:57:59,  3.86s/it, lr: 1.0e-04 loss: 1.119e-01]mindexpander_qwen_v1:   8%|7         | 235/3000 [15:57<2:57:59,  3.86s/it, lr: 1.0e-04 loss: 1.119e-01]mindexpander_qwen_v1:   8%|7         | 236/3000 [15:57<2:56:14,  3.83s/it, lr: 1.0e-04 loss: 1.119e-01]mindexpander_qwen_v1:   8%|7         | 236/3000 [15:57<2:56:14,  3.83s/it, lr: 1.0e-04 loss: 1.119e-01]mindexpander_qwen_v1:   8%|7         | 236/3000 [15:59<2:56:14,  3.83s/it, lr: 1.0e-04 loss: 3.666e-02]mindexpander_qwen_v1:   8%|7         | 236/3000 [15:59<2:56:14,  3.83s/it, lr: 1.0e-04 loss: 3.666e-02]mindexpander_qwen_v1:   8%|7         | 237/3000 [15:59<2:37:46,  3.43s/it, lr: 1.0e-04 loss: 3.666e-02]mindexpander_qwen_v1:   8%|7         | 237/3000 [15:59<2:37:46,  3.43s/it, lr: 1.0e-04 loss: 3.666e-02]mindexpander_qwen_v1:   8%|7         | 237/3000 [16:01<2:37:46,  3.43s/it, lr: 1.0e-04 loss: 6.610e-02]mindexpander_qwen_v1:   8%|7         | 237/3000 [16:01<2:37:46,  3.43s/it, lr: 1.0e-04 loss: 6.610e-02]mindexpander_qwen_v1:   8%|7         | 238/3000 [16:01<2:24:24,  3.14s/it, lr: 1.0e-04 loss: 6.610e-02]mindexpander_qwen_v1:   8%|7         | 238/3000 [16:01<2:24:24,  3.14s/it, lr: 1.0e-04 loss: 6.610e-02]mindexpander_qwen_v1:   8%|7         | 238/3000 [16:07<2:24:24,  3.14s/it, lr: 1.0e-04 loss: 1.724e-01]mindexpander_qwen_v1:   8%|7         | 238/3000 [16:07<2:24:24,  3.14s/it, lr: 1.0e-04 loss: 1.724e-01]mindexpander_qwen_v1:   8%|7         | 239/3000 [16:07<3:01:33,  3.95s/it, lr: 1.0e-04 loss: 1.724e-01]mindexpander_qwen_v1:   8%|7         | 239/3000 [16:07<3:01:33,  3.95s/it, lr: 1.0e-04 loss: 1.724e-01]mindexpander_qwen_v1:   8%|7         | 239/3000 [16:13<3:01:33,  3.95s/it, lr: 1.0e-04 loss: 2.075e-02]mindexpander_qwen_v1:   8%|7         | 239/3000 [16:13<3:01:33,  3.95s/it, lr: 1.0e-04 loss: 2.075e-02]mindexpander_qwen_v1:   8%|8         | 240/3000 [16:17<3:01:29,  3.95s/it, lr: 1.0e-04 loss: 8.865e-02]mindexpander_qwen_v1:   8%|8         | 240/3000 [16:17<3:01:29,  3.95s/it, lr: 1.0e-04 loss: 8.865e-02]mindexpander_qwen_v1:   8%|8         | 241/3000 [16:17<2:17:47,  3.00s/it, lr: 1.0e-04 loss: 8.865e-02]mindexpander_qwen_v1:   8%|8         | 241/3000 [16:17<2:17:47,  3.00s/it, lr: 1.0e-04 loss: 8.865e-02]mindexpander_qwen_v1:   8%|8         | 241/3000 [16:20<2:17:47,  3.00s/it, lr: 1.0e-04 loss: 7.500e-02]mindexpander_qwen_v1:   8%|8         | 241/3000 [16:20<2:17:47,  3.00s/it, lr: 1.0e-04 loss: 7.500e-02]mindexpander_qwen_v1:   8%|8         | 242/3000 [16:20<2:11:31,  2.86s/it, lr: 1.0e-04 loss: 7.500e-02]mindexpander_qwen_v1:   8%|8         | 242/3000 [16:20<2:11:31,  2.86s/it, lr: 1.0e-04 loss: 7.500e-02]mindexpander_qwen_v1:   8%|8         | 242/3000 [16:26<2:11:31,  2.86s/it, lr: 1.0e-04 loss: 6.700e-02]mindexpander_qwen_v1:   8%|8         | 242/3000 [16:26<2:11:31,  2.86s/it, lr: 1.0e-04 loss: 6.700e-02]mindexpander_qwen_v1:   8%|8         | 243/3000 [16:26<2:48:22,  3.66s/it, lr: 1.0e-04 loss: 6.700e-02]mindexpander_qwen_v1:   8%|8         | 243/3000 [16:26<2:48:22,  3.66s/it, lr: 1.0e-04 loss: 6.700e-02]mindexpander_qwen_v1:   8%|8         | 243/3000 [16:28<2:48:22,  3.66s/it, lr: 1.0e-04 loss: 7.459e-02]mindexpander_qwen_v1:   8%|8         | 243/3000 [16:28<2:48:22,  3.66s/it, lr: 1.0e-04 loss: 7.459e-02]mindexpander_qwen_v1:   8%|8         | 244/3000 [16:28<2:33:03,  3.33s/it, lr: 1.0e-04 loss: 7.459e-02]mindexpander_qwen_v1:   8%|8         | 244/3000 [16:28<2:33:03,  3.33s/it, lr: 1.0e-04 loss: 7.459e-02]mindexpander_qwen_v1:   8%|8         | 244/3000 [16:34<2:33:03,  3.33s/it, lr: 1.0e-04 loss: 4.695e-02]mindexpander_qwen_v1:   8%|8         | 244/3000 [16:34<2:33:03,  3.33s/it, lr: 1.0e-04 loss: 4.695e-02]mindexpander_qwen_v1:   8%|8         | 245/3000 [16:34<3:03:59,  4.01s/it, lr: 1.0e-04 loss: 4.695e-02]mindexpander_qwen_v1:   8%|8         | 245/3000 [16:34<3:03:59,  4.01s/it, lr: 1.0e-04 loss: 4.695e-02]mindexpander_qwen_v1:   8%|8         | 245/3000 [16:39<3:03:59,  4.01s/it, lr: 1.0e-04 loss: 1.876e-01]mindexpander_qwen_v1:   8%|8         | 245/3000 [16:39<3:03:59,  4.01s/it, lr: 1.0e-04 loss: 1.876e-01]mindexpander_qwen_v1:   8%|8         | 246/3000 [16:39<3:26:47,  4.51s/it, lr: 1.0e-04 loss: 1.876e-01]mindexpander_qwen_v1:   8%|8         | 246/3000 [16:39<3:26:47,  4.51s/it, lr: 1.0e-04 loss: 1.876e-01]mindexpander_qwen_v1:   8%|8         | 246/3000 [16:42<3:26:47,  4.51s/it, lr: 1.0e-04 loss: 1.534e-01]mindexpander_qwen_v1:   8%|8         | 246/3000 [16:42<3:26:47,  4.51s/it, lr: 1.0e-04 loss: 1.534e-01]mindexpander_qwen_v1:   8%|8         | 247/3000 [16:42<3:01:36,  3.96s/it, lr: 1.0e-04 loss: 1.534e-01]mindexpander_qwen_v1:   8%|8         | 247/3000 [16:42<3:01:36,  3.96s/it, lr: 1.0e-04 loss: 1.534e-01]mindexpander_qwen_v1:   8%|8         | 247/3000 [16:48<3:01:36,  3.96s/it, lr: 1.0e-04 loss: 4.411e-02]mindexpander_qwen_v1:   8%|8         | 247/3000 [16:48<3:01:36,  3.96s/it, lr: 1.0e-04 loss: 4.411e-02]mindexpander_qwen_v1:   8%|8         | 248/3000 [16:48<3:25:38,  4.48s/it, lr: 1.0e-04 loss: 4.411e-02]mindexpander_qwen_v1:   8%|8         | 248/3000 [16:48<3:25:38,  4.48s/it, lr: 1.0e-04 loss: 4.411e-02]mindexpander_qwen_v1:   8%|8         | 248/3000 [16:52<3:25:38,  4.48s/it, lr: 1.0e-04 loss: 7.757e-02]mindexpander_qwen_v1:   8%|8         | 248/3000 [16:52<3:25:38,  4.48s/it, lr: 1.0e-04 loss: 7.757e-02]mindexpander_qwen_v1:   8%|8         | 249/3000 [16:52<3:15:28,  4.26s/it, lr: 1.0e-04 loss: 7.757e-02]mindexpander_qwen_v1:   8%|8         | 249/3000 [16:52<3:15:28,  4.26s/it, lr: 1.0e-04 loss: 7.757e-02]mindexpander_qwen_v1:   8%|8         | 249/3000 [16:57<3:15:28,  4.26s/it, lr: 1.0e-04 loss: 1.861e-01]mindexpander_qwen_v1:   8%|8         | 249/3000 [16:57<3:15:28,  4.26s/it, lr: 1.0e-04 loss: 1.861e-01]
+Saving at step 250
+Saved checkpoint to /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000000250.safetensors
+Saved optimizer to /app/ai-toolkit/output/mindexpander_qwen_v1/optimizer.pt
+
+
+Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:   0%|          | 0/2 [00:00<?, ?it/s][A[A
+
+Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.66s/it]Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.66s/it][A[A
+
+Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.82s/it]Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.82s/it][A[A
+
+                                                                                                                                [A[Amindexpander_qwen_v1:   8%|8         | 250/3000 [17:01<3:15:23,  4.26s/it, lr: 1.0e-04 loss: 1.843e-01]mindexpander_qwen_v1:   8%|8         | 250/3000 [17:01<3:15:23,  4.26s/it, lr: 1.0e-04 loss: 1.843e-01]mindexpander_qwen_v1:   8%|8         | 251/3000 [17:01<2:27:16,  3.21s/it, lr: 1.0e-04 loss: 1.843e-01]mindexpander_qwen_v1:   8%|8         | 251/3000 [17:01<2:27:16,  3.21s/it, lr: 1.0e-04 loss: 1.843e-01]mindexpander_qwen_v1:   8%|8         | 251/3000 [17:04<2:27:16,  3.21s/it, lr: 1.0e-04 loss: 6.008e-02]mindexpander_qwen_v1:   8%|8         | 251/3000 [17:04<2:27:16,  3.21s/it, lr: 1.0e-04 loss: 6.008e-02]mindexpander_qwen_v1:   8%|8         | 252/3000 [17:04<2:18:37,  3.03s/it, lr: 1.0e-04 loss: 6.008e-02]mindexpander_qwen_v1:   8%|8         | 252/3000 [17:04<2:18:37,  3.03s/it, lr: 1.0e-04 loss: 6.008e-02]mindexpander_qwen_v1:   8%|8         | 252/3000 [17:07<2:18:37,  3.03s/it, lr: 1.0e-04 loss: 4.837e-02]mindexpander_qwen_v1:   8%|8         | 252/3000 [17:07<2:18:37,  3.03s/it, lr: 1.0e-04 loss: 4.837e-02]mindexpander_qwen_v1:   8%|8         | 253/3000 [17:07<2:27:02,  3.21s/it, lr: 1.0e-04 loss: 4.837e-02]mindexpander_qwen_v1:   8%|8         | 253/3000 [17:07<2:27:02,  3.21s/it, lr: 1.0e-04 loss: 4.837e-02]mindexpander_qwen_v1:   8%|8         | 253/3000 [17:10<2:27:02,  3.21s/it, lr: 1.0e-04 loss: 3.261e-02]mindexpander_qwen_v1:   8%|8         | 253/3000 [17:10<2:27:02,  3.21s/it, lr: 1.0e-04 loss: 3.261e-02]mindexpander_qwen_v1:   8%|8         | 254/3000 [17:10<2:20:04,  3.06s/it, lr: 1.0e-04 loss: 3.261e-02]mindexpander_qwen_v1:   8%|8         | 254/3000 [17:10<2:20:04,  3.06s/it, lr: 1.0e-04 loss: 3.261e-02]mindexpander_qwen_v1:   8%|8         | 254/3000 [17:14<2:20:04,  3.06s/it, lr: 1.0e-04 loss: 8.248e-02]mindexpander_qwen_v1:   8%|8         | 254/3000 [17:14<2:20:04,  3.06s/it, lr: 1.0e-04 loss: 8.248e-02]mindexpander_qwen_v1:   8%|8         | 255/3000 [17:14<2:28:38,  3.25s/it, lr: 1.0e-04 loss: 8.248e-02]mindexpander_qwen_v1:   8%|8         | 255/3000 [17:14<2:28:38,  3.25s/it, lr: 1.0e-04 loss: 8.248e-02]mindexpander_qwen_v1:   8%|8         | 255/3000 [17:18<2:28:38,  3.25s/it, lr: 1.0e-04 loss: 1.280e-01]mindexpander_qwen_v1:   8%|8         | 255/3000 [17:18<2:28:38,  3.25s/it, lr: 1.0e-04 loss: 1.280e-01]mindexpander_qwen_v1:   9%|8         | 256/3000 [17:18<2:34:59,  3.39s/it, lr: 1.0e-04 loss: 1.280e-01]mindexpander_qwen_v1:   9%|8         | 256/3000 [17:18<2:34:59,  3.39s/it, lr: 1.0e-04 loss: 1.280e-01]mindexpander_qwen_v1:   9%|8         | 256/3000 [17:23<2:34:59,  3.39s/it, lr: 1.0e-04 loss: 1.365e-01]mindexpander_qwen_v1:   9%|8         | 256/3000 [17:23<2:34:59,  3.39s/it, lr: 1.0e-04 loss: 1.365e-01]mindexpander_qwen_v1:   9%|8         | 257/3000 [17:23<3:05:52,  4.07s/it, lr: 1.0e-04 loss: 1.365e-01]mindexpander_qwen_v1:   9%|8         | 257/3000 [17:23<3:05:52,  4.07s/it, lr: 1.0e-04 loss: 1.365e-01]mindexpander_qwen_v1:   9%|8         | 257/3000 [17:27<3:05:52,  4.07s/it, lr: 1.0e-04 loss: 1.169e-01]mindexpander_qwen_v1:   9%|8         | 257/3000 [17:27<3:05:52,  4.07s/it, lr: 1.0e-04 loss: 1.169e-01]mindexpander_qwen_v1:   9%|8         | 258/3000 [17:27<3:03:38,  4.02s/it, lr: 1.0e-04 loss: 1.169e-01]mindexpander_qwen_v1:   9%|8         | 258/3000 [17:27<3:03:38,  4.02s/it, lr: 1.0e-04 loss: 1.169e-01]mindexpander_qwen_v1:   9%|8         | 258/3000 [17:30<3:03:38,  4.02s/it, lr: 1.0e-04 loss: 7.578e-02]mindexpander_qwen_v1:   9%|8         | 258/3000 [17:30<3:03:38,  4.02s/it, lr: 1.0e-04 loss: 7.578e-02]mindexpander_qwen_v1:   9%|8         | 259/3000 [17:30<2:42:24,  3.56s/it, lr: 1.0e-04 loss: 7.578e-02]mindexpander_qwen_v1:   9%|8         | 259/3000 [17:30<2:42:24,  3.56s/it, lr: 1.0e-04 loss: 7.578e-02]mindexpander_qwen_v1:   9%|8         | 259/3000 [17:35<2:42:24,  3.56s/it, lr: 1.0e-04 loss: 1.880e-01]mindexpander_qwen_v1:   9%|8         | 259/3000 [17:35<2:42:24,  3.56s/it, lr: 1.0e-04 loss: 1.880e-01]mindexpander_qwen_v1:   9%|8         | 260/3000 [17:38<2:42:21,  3.56s/it, lr: 1.0e-04 loss: 1.035e-01]mindexpander_qwen_v1:   9%|8         | 260/3000 [17:38<2:42:21,  3.56s/it, lr: 1.0e-04 loss: 1.035e-01]mindexpander_qwen_v1:   9%|8         | 261/3000 [17:38<1:53:42,  2.49s/it, lr: 1.0e-04 loss: 1.035e-01]mindexpander_qwen_v1:   9%|8         | 261/3000 [17:38<1:53:42,  2.49s/it, lr: 1.0e-04 loss: 1.035e-01]mindexpander_qwen_v1:   9%|8         | 261/3000 [17:42<1:53:42,  2.49s/it, lr: 1.0e-04 loss: 2.211e-02]mindexpander_qwen_v1:   9%|8         | 261/3000 [17:42<1:53:42,  2.49s/it, lr: 1.0e-04 loss: 2.211e-02]mindexpander_qwen_v1:   9%|8         | 262/3000 [17:42<2:09:59,  2.85s/it, lr: 1.0e-04 loss: 2.211e-02]mindexpander_qwen_v1:   9%|8         | 262/3000 [17:42<2:09:59,  2.85s/it, lr: 1.0e-04 loss: 2.211e-02]mindexpander_qwen_v1:   9%|8         | 262/3000 [17:46<2:09:59,  2.85s/it, lr: 1.0e-04 loss: 5.575e-02]mindexpander_qwen_v1:   9%|8         | 262/3000 [17:46<2:09:59,  2.85s/it, lr: 1.0e-04 loss: 5.575e-02]mindexpander_qwen_v1:   9%|8         | 263/3000 [17:46<2:20:31,  3.08s/it, lr: 1.0e-04 loss: 5.575e-02]mindexpander_qwen_v1:   9%|8         | 263/3000 [17:46<2:20:31,  3.08s/it, lr: 1.0e-04 loss: 5.575e-02]mindexpander_qwen_v1:   9%|8         | 263/3000 [17:51<2:20:31,  3.08s/it, lr: 1.0e-04 loss: 1.746e-01]mindexpander_qwen_v1:   9%|8         | 263/3000 [17:51<2:20:31,  3.08s/it, lr: 1.0e-04 loss: 1.746e-01]mindexpander_qwen_v1:   9%|8         | 264/3000 [17:51<2:53:35,  3.81s/it, lr: 1.0e-04 loss: 1.746e-01]mindexpander_qwen_v1:   9%|8         | 264/3000 [17:51<2:53:35,  3.81s/it, lr: 1.0e-04 loss: 1.746e-01]mindexpander_qwen_v1:   9%|8         | 264/3000 [17:54<2:53:35,  3.81s/it, lr: 1.0e-04 loss: 3.417e-02]mindexpander_qwen_v1:   9%|8         | 264/3000 [17:54<2:53:35,  3.81s/it, lr: 1.0e-04 loss: 3.417e-02]mindexpander_qwen_v1:   9%|8         | 265/3000 [17:54<2:36:29,  3.43s/it, lr: 1.0e-04 loss: 3.417e-02]mindexpander_qwen_v1:   9%|8         | 265/3000 [17:54<2:36:29,  3.43s/it, lr: 1.0e-04 loss: 3.417e-02]mindexpander_qwen_v1:   9%|8         | 265/3000 [17:56<2:36:29,  3.43s/it, lr: 1.0e-04 loss: 9.403e-02]mindexpander_qwen_v1:   9%|8         | 265/3000 [17:56<2:36:29,  3.43s/it, lr: 1.0e-04 loss: 9.403e-02]mindexpander_qwen_v1:   9%|8         | 266/3000 [17:56<2:26:23,  3.21s/it, lr: 1.0e-04 loss: 9.403e-02]mindexpander_qwen_v1:   9%|8         | 266/3000 [17:56<2:26:23,  3.21s/it, lr: 1.0e-04 loss: 9.403e-02]mindexpander_qwen_v1:   9%|8         | 266/3000 [18:02<2:26:23,  3.21s/it, lr: 1.0e-04 loss: 7.076e-02]mindexpander_qwen_v1:   9%|8         | 266/3000 [18:02<2:26:23,  3.21s/it, lr: 1.0e-04 loss: 7.076e-02]mindexpander_qwen_v1:   9%|8         | 267/3000 [18:02<2:59:48,  3.95s/it, lr: 1.0e-04 loss: 7.076e-02]mindexpander_qwen_v1:   9%|8         | 267/3000 [18:02<2:59:48,  3.95s/it, lr: 1.0e-04 loss: 7.076e-02]mindexpander_qwen_v1:   9%|8         | 267/3000 [18:05<2:59:48,  3.95s/it, lr: 1.0e-04 loss: 1.851e-01]mindexpander_qwen_v1:   9%|8         | 267/3000 [18:05<2:59:48,  3.95s/it, lr: 1.0e-04 loss: 1.851e-01]mindexpander_qwen_v1:   9%|8         | 268/3000 [18:05<2:39:51,  3.51s/it, lr: 1.0e-04 loss: 1.851e-01]mindexpander_qwen_v1:   9%|8         | 268/3000 [18:05<2:39:51,  3.51s/it, lr: 1.0e-04 loss: 1.851e-01]mindexpander_qwen_v1:   9%|8         | 268/3000 [18:08<2:39:51,  3.51s/it, lr: 1.0e-04 loss: 1.876e-02]mindexpander_qwen_v1:   9%|8         | 268/3000 [18:08<2:39:51,  3.51s/it, lr: 1.0e-04 loss: 1.876e-02]mindexpander_qwen_v1:   9%|8         | 269/3000 [18:08<2:42:54,  3.58s/it, lr: 1.0e-04 loss: 1.876e-02]mindexpander_qwen_v1:   9%|8         | 269/3000 [18:08<2:42:54,  3.58s/it, lr: 1.0e-04 loss: 1.876e-02]mindexpander_qwen_v1:   9%|8         | 269/3000 [18:11<2:42:54,  3.58s/it, lr: 1.0e-04 loss: 5.606e-02]mindexpander_qwen_v1:   9%|8         | 269/3000 [18:11<2:42:54,  3.58s/it, lr: 1.0e-04 loss: 5.606e-02]mindexpander_qwen_v1:   9%|9         | 270/3000 [18:15<2:42:51,  3.58s/it, lr: 1.0e-04 loss: 4.470e-02]mindexpander_qwen_v1:   9%|9         | 270/3000 [18:15<2:42:51,  3.58s/it, lr: 1.0e-04 loss: 4.470e-02]mindexpander_qwen_v1:   9%|9         | 271/3000 [18:15<2:07:11,  2.80s/it, lr: 1.0e-04 loss: 4.470e-02]mindexpander_qwen_v1:   9%|9         | 271/3000 [18:15<2:07:11,  2.80s/it, lr: 1.0e-04 loss: 4.470e-02]mindexpander_qwen_v1:   9%|9         | 271/3000 [18:19<2:07:11,  2.80s/it, lr: 1.0e-04 loss: 7.309e-02]mindexpander_qwen_v1:   9%|9         | 271/3000 [18:19<2:07:11,  2.80s/it, lr: 1.0e-04 loss: 7.309e-02]mindexpander_qwen_v1:   9%|9         | 272/3000 [18:19<2:17:37,  3.03s/it, lr: 1.0e-04 loss: 7.309e-02]mindexpander_qwen_v1:   9%|9         | 272/3000 [18:19<2:17:37,  3.03s/it, lr: 1.0e-04 loss: 7.309e-02]mindexpander_qwen_v1:   9%|9         | 272/3000 [18:21<2:17:37,  3.03s/it, lr: 1.0e-04 loss: 7.297e-02]mindexpander_qwen_v1:   9%|9         | 272/3000 [18:21<2:17:37,  3.03s/it, lr: 1.0e-04 loss: 7.297e-02]mindexpander_qwen_v1:   9%|9         | 273/3000 [18:21<2:10:46,  2.88s/it, lr: 1.0e-04 loss: 7.297e-02]mindexpander_qwen_v1:   9%|9         | 273/3000 [18:21<2:10:46,  2.88s/it, lr: 1.0e-04 loss: 7.297e-02]mindexpander_qwen_v1:   9%|9         | 273/3000 [18:24<2:10:46,  2.88s/it, lr: 1.0e-04 loss: 1.967e-01]mindexpander_qwen_v1:   9%|9         | 273/3000 [18:24<2:10:46,  2.88s/it, lr: 1.0e-04 loss: 1.967e-01]mindexpander_qwen_v1:   9%|9         | 274/3000 [18:24<2:07:44,  2.81s/it, lr: 1.0e-04 loss: 1.967e-01]mindexpander_qwen_v1:   9%|9         | 274/3000 [18:24<2:07:44,  2.81s/it, lr: 1.0e-04 loss: 1.967e-01]mindexpander_qwen_v1:   9%|9         | 274/3000 [18:26<2:07:44,  2.81s/it, lr: 1.0e-04 loss: 5.334e-02]mindexpander_qwen_v1:   9%|9         | 274/3000 [18:26<2:07:44,  2.81s/it, lr: 1.0e-04 loss: 5.334e-02]mindexpander_qwen_v1:   9%|9         | 275/3000 [18:26<2:03:06,  2.71s/it, lr: 1.0e-04 loss: 5.334e-02]mindexpander_qwen_v1:   9%|9         | 275/3000 [18:26<2:03:06,  2.71s/it, lr: 1.0e-04 loss: 5.334e-02]mindexpander_qwen_v1:   9%|9         | 275/3000 [18:30<2:03:06,  2.71s/it, lr: 1.0e-04 loss: 1.554e-02]mindexpander_qwen_v1:   9%|9         | 275/3000 [18:30<2:03:06,  2.71s/it, lr: 1.0e-04 loss: 1.554e-02]mindexpander_qwen_v1:   9%|9         | 276/3000 [18:30<2:16:24,  3.00s/it, lr: 1.0e-04 loss: 1.554e-02]mindexpander_qwen_v1:   9%|9         | 276/3000 [18:30<2:16:24,  3.00s/it, lr: 1.0e-04 loss: 1.554e-02]mindexpander_qwen_v1:   9%|9         | 276/3000 [18:34<2:16:24,  3.00s/it, lr: 1.0e-04 loss: 1.913e-01]mindexpander_qwen_v1:   9%|9         | 276/3000 [18:34<2:16:24,  3.00s/it, lr: 1.0e-04 loss: 1.913e-01]mindexpander_qwen_v1:   9%|9         | 277/3000 [18:34<2:26:05,  3.22s/it, lr: 1.0e-04 loss: 1.913e-01]mindexpander_qwen_v1:   9%|9         | 277/3000 [18:34<2:26:05,  3.22s/it, lr: 1.0e-04 loss: 1.913e-01]mindexpander_qwen_v1:   9%|9         | 277/3000 [18:38<2:26:05,  3.22s/it, lr: 1.0e-04 loss: 1.661e-01]mindexpander_qwen_v1:   9%|9         | 277/3000 [18:38<2:26:05,  3.22s/it, lr: 1.0e-04 loss: 1.661e-01]mindexpander_qwen_v1:   9%|9         | 278/3000 [18:38<2:34:58,  3.42s/it, lr: 1.0e-04 loss: 1.661e-01]mindexpander_qwen_v1:   9%|9         | 278/3000 [18:38<2:34:58,  3.42s/it, lr: 1.0e-04 loss: 1.661e-01]mindexpander_qwen_v1:   9%|9         | 278/3000 [18:44<2:34:58,  3.42s/it, lr: 1.0e-04 loss: 1.191e-01]mindexpander_qwen_v1:   9%|9         | 278/3000 [18:44<2:34:58,  3.42s/it, lr: 1.0e-04 loss: 1.191e-01]mindexpander_qwen_v1:   9%|9         | 279/3000 [18:44<3:06:22,  4.11s/it, lr: 1.0e-04 loss: 1.191e-01]mindexpander_qwen_v1:   9%|9         | 279/3000 [18:44<3:06:22,  4.11s/it, lr: 1.0e-04 loss: 1.191e-01]mindexpander_qwen_v1:   9%|9         | 279/3000 [18:49<3:06:22,  4.11s/it, lr: 1.0e-04 loss: 1.713e-01]mindexpander_qwen_v1:   9%|9         | 279/3000 [18:49<3:06:22,  4.11s/it, lr: 1.0e-04 loss: 1.713e-01]mindexpander_qwen_v1:   9%|9         | 280/3000 [18:55<3:06:18,  4.11s/it, lr: 1.0e-04 loss: 1.511e-02]mindexpander_qwen_v1:   9%|9         | 280/3000 [18:55<3:06:18,  4.11s/it, lr: 1.0e-04 loss: 1.511e-02]mindexpander_qwen_v1:   9%|9         | 281/3000 [18:55<2:42:04,  3.58s/it, lr: 1.0e-04 loss: 1.511e-02]mindexpander_qwen_v1:   9%|9         | 281/3000 [18:55<2:42:04,  3.58s/it, lr: 1.0e-04 loss: 1.511e-02]mindexpander_qwen_v1:   9%|9         | 281/3000 [18:58<2:42:04,  3.58s/it, lr: 1.0e-04 loss: 1.154e-01]mindexpander_qwen_v1:   9%|9         | 281/3000 [18:58<2:42:04,  3.58s/it, lr: 1.0e-04 loss: 1.154e-01]mindexpander_qwen_v1:   9%|9         | 282/3000 [18:58<2:29:30,  3.30s/it, lr: 1.0e-04 loss: 1.154e-01]mindexpander_qwen_v1:   9%|9         | 282/3000 [18:58<2:29:30,  3.30s/it, lr: 1.0e-04 loss: 1.154e-01]mindexpander_qwen_v1:   9%|9         | 282/3000 [19:00<2:29:30,  3.30s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:   9%|9         | 282/3000 [19:00<2:29:30,  3.30s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:   9%|9         | 283/3000 [19:00<2:19:26,  3.08s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:   9%|9         | 283/3000 [19:00<2:19:26,  3.08s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:   9%|9         | 283/3000 [19:04<2:19:26,  3.08s/it, lr: 1.0e-04 loss: 5.124e-02]mindexpander_qwen_v1:   9%|9         | 283/3000 [19:04<2:19:26,  3.08s/it, lr: 1.0e-04 loss: 5.124e-02]mindexpander_qwen_v1:   9%|9         | 284/3000 [19:04<2:27:41,  3.26s/it, lr: 1.0e-04 loss: 5.124e-02]mindexpander_qwen_v1:   9%|9         | 284/3000 [19:04<2:27:41,  3.26s/it, lr: 1.0e-04 loss: 5.124e-02]mindexpander_qwen_v1:   9%|9         | 284/3000 [19:10<2:27:41,  3.26s/it, lr: 1.0e-04 loss: 1.494e-02]mindexpander_qwen_v1:   9%|9         | 284/3000 [19:10<2:27:41,  3.26s/it, lr: 1.0e-04 loss: 1.494e-02]mindexpander_qwen_v1:  10%|9         | 285/3000 [19:10<3:00:59,  4.00s/it, lr: 1.0e-04 loss: 1.494e-02]mindexpander_qwen_v1:  10%|9         | 285/3000 [19:10<3:00:59,  4.00s/it, lr: 1.0e-04 loss: 1.494e-02]mindexpander_qwen_v1:  10%|9         | 285/3000 [19:12<3:00:59,  4.00s/it, lr: 1.0e-04 loss: 1.031e-02]mindexpander_qwen_v1:  10%|9         | 285/3000 [19:12<3:00:59,  4.00s/it, lr: 1.0e-04 loss: 1.031e-02]mindexpander_qwen_v1:  10%|9         | 286/3000 [19:12<2:40:59,  3.56s/it, lr: 1.0e-04 loss: 1.031e-02]mindexpander_qwen_v1:  10%|9         | 286/3000 [19:12<2:40:59,  3.56s/it, lr: 1.0e-04 loss: 1.031e-02]mindexpander_qwen_v1:  10%|9         | 286/3000 [19:18<2:40:59,  3.56s/it, lr: 1.0e-04 loss: 1.825e-01]mindexpander_qwen_v1:  10%|9         | 286/3000 [19:18<2:40:59,  3.56s/it, lr: 1.0e-04 loss: 1.825e-01]mindexpander_qwen_v1:  10%|9         | 287/3000 [19:18<3:09:45,  4.20s/it, lr: 1.0e-04 loss: 1.825e-01]mindexpander_qwen_v1:  10%|9         | 287/3000 [19:18<3:09:45,  4.20s/it, lr: 1.0e-04 loss: 1.825e-01]mindexpander_qwen_v1:  10%|9         | 287/3000 [19:24<3:09:45,  4.20s/it, lr: 1.0e-04 loss: 9.741e-02]mindexpander_qwen_v1:  10%|9         | 287/3000 [19:24<3:09:45,  4.20s/it, lr: 1.0e-04 loss: 9.741e-02]mindexpander_qwen_v1:  10%|9         | 288/3000 [19:24<3:30:22,  4.65s/it, lr: 1.0e-04 loss: 9.741e-02]mindexpander_qwen_v1:  10%|9         | 288/3000 [19:24<3:30:22,  4.65s/it, lr: 1.0e-04 loss: 9.741e-02]mindexpander_qwen_v1:  10%|9         | 288/3000 [19:28<3:30:22,  4.65s/it, lr: 1.0e-04 loss: 1.605e-01]mindexpander_qwen_v1:  10%|9         | 288/3000 [19:28<3:30:22,  4.65s/it, lr: 1.0e-04 loss: 1.605e-01]mindexpander_qwen_v1:  10%|9         | 289/3000 [19:28<3:18:12,  4.39s/it, lr: 1.0e-04 loss: 1.605e-01]mindexpander_qwen_v1:  10%|9         | 289/3000 [19:28<3:18:12,  4.39s/it, lr: 1.0e-04 loss: 1.605e-01]mindexpander_qwen_v1:  10%|9         | 289/3000 [19:30<3:18:12,  4.39s/it, lr: 1.0e-04 loss: 3.500e-02]mindexpander_qwen_v1:  10%|9         | 289/3000 [19:30<3:18:12,  4.39s/it, lr: 1.0e-04 loss: 3.500e-02]mindexpander_qwen_v1:  10%|9         | 290/3000 [19:34<3:18:07,  4.39s/it, lr: 1.0e-04 loss: 1.672e-01]mindexpander_qwen_v1:  10%|9         | 290/3000 [19:34<3:18:07,  4.39s/it, lr: 1.0e-04 loss: 1.672e-01]mindexpander_qwen_v1:  10%|9         | 291/3000 [19:34<2:26:09,  3.24s/it, lr: 1.0e-04 loss: 1.672e-01]mindexpander_qwen_v1:  10%|9         | 291/3000 [19:34<2:26:09,  3.24s/it, lr: 1.0e-04 loss: 1.672e-01]mindexpander_qwen_v1:  10%|9         | 291/3000 [19:40<2:26:09,  3.24s/it, lr: 1.0e-04 loss: 1.229e-01]mindexpander_qwen_v1:  10%|9         | 291/3000 [19:40<2:26:09,  3.24s/it, lr: 1.0e-04 loss: 1.229e-01]mindexpander_qwen_v1:  10%|9         | 292/3000 [19:40<2:54:07,  3.86s/it, lr: 1.0e-04 loss: 1.229e-01]mindexpander_qwen_v1:  10%|9         | 292/3000 [19:40<2:54:07,  3.86s/it, lr: 1.0e-04 loss: 1.229e-01]mindexpander_qwen_v1:  10%|9         | 292/3000 [19:44<2:54:07,  3.86s/it, lr: 1.0e-04 loss: 6.091e-02]mindexpander_qwen_v1:  10%|9         | 292/3000 [19:44<2:54:07,  3.86s/it, lr: 1.0e-04 loss: 6.091e-02]mindexpander_qwen_v1:  10%|9         | 293/3000 [19:44<2:54:44,  3.87s/it, lr: 1.0e-04 loss: 6.091e-02]mindexpander_qwen_v1:  10%|9         | 293/3000 [19:44<2:54:44,  3.87s/it, lr: 1.0e-04 loss: 6.091e-02]mindexpander_qwen_v1:  10%|9         | 293/3000 [19:47<2:54:44,  3.87s/it, lr: 1.0e-04 loss: 1.005e-01]mindexpander_qwen_v1:  10%|9         | 293/3000 [19:47<2:54:44,  3.87s/it, lr: 1.0e-04 loss: 1.005e-01]mindexpander_qwen_v1:  10%|9         | 294/3000 [19:47<2:52:58,  3.84s/it, lr: 1.0e-04 loss: 1.005e-01]mindexpander_qwen_v1:  10%|9         | 294/3000 [19:47<2:52:58,  3.84s/it, lr: 1.0e-04 loss: 1.005e-01]mindexpander_qwen_v1:  10%|9         | 294/3000 [19:53<2:52:58,  3.84s/it, lr: 1.0e-04 loss: 1.236e-01]mindexpander_qwen_v1:  10%|9         | 294/3000 [19:53<2:52:58,  3.84s/it, lr: 1.0e-04 loss: 1.236e-01]mindexpander_qwen_v1:  10%|9         | 295/3000 [19:53<3:17:10,  4.37s/it, lr: 1.0e-04 loss: 1.236e-01]mindexpander_qwen_v1:  10%|9         | 295/3000 [19:53<3:17:10,  4.37s/it, lr: 1.0e-04 loss: 1.236e-01]mindexpander_qwen_v1:  10%|9         | 295/3000 [19:56<3:17:10,  4.37s/it, lr: 1.0e-04 loss: 1.798e-01]mindexpander_qwen_v1:  10%|9         | 295/3000 [19:56<3:17:10,  4.37s/it, lr: 1.0e-04 loss: 1.798e-01]mindexpander_qwen_v1:  10%|9         | 296/3000 [19:56<2:52:26,  3.83s/it, lr: 1.0e-04 loss: 1.798e-01]mindexpander_qwen_v1:  10%|9         | 296/3000 [19:56<2:52:26,  3.83s/it, lr: 1.0e-04 loss: 1.798e-01]mindexpander_qwen_v1:  10%|9         | 296/3000 [20:01<2:52:26,  3.83s/it, lr: 1.0e-04 loss: 1.726e-01]mindexpander_qwen_v1:  10%|9         | 296/3000 [20:01<2:52:26,  3.83s/it, lr: 1.0e-04 loss: 1.726e-01]mindexpander_qwen_v1:  10%|9         | 297/3000 [20:01<3:19:20,  4.43s/it, lr: 1.0e-04 loss: 1.726e-01]mindexpander_qwen_v1:  10%|9         | 297/3000 [20:01<3:19:20,  4.43s/it, lr: 1.0e-04 loss: 1.726e-01]mindexpander_qwen_v1:  10%|9         | 297/3000 [20:07<3:19:20,  4.43s/it, lr: 1.0e-04 loss: 5.802e-02]mindexpander_qwen_v1:  10%|9         | 297/3000 [20:07<3:19:20,  4.43s/it, lr: 1.0e-04 loss: 5.802e-02]mindexpander_qwen_v1:  10%|9         | 298/3000 [20:07<3:36:50,  4.82s/it, lr: 1.0e-04 loss: 5.802e-02]mindexpander_qwen_v1:  10%|9         | 298/3000 [20:07<3:36:50,  4.82s/it, lr: 1.0e-04 loss: 5.802e-02]mindexpander_qwen_v1:  10%|9         | 298/3000 [20:10<3:36:50,  4.82s/it, lr: 1.0e-04 loss: 1.325e-01]mindexpander_qwen_v1:  10%|9         | 298/3000 [20:10<3:36:50,  4.82s/it, lr: 1.0e-04 loss: 1.325e-01]mindexpander_qwen_v1:  10%|9         | 299/3000 [20:10<3:05:16,  4.12s/it, lr: 1.0e-04 loss: 1.325e-01]mindexpander_qwen_v1:  10%|9         | 299/3000 [20:10<3:05:16,  4.12s/it, lr: 1.0e-04 loss: 1.325e-01]mindexpander_qwen_v1:  10%|9         | 299/3000 [20:14<3:05:16,  4.12s/it, lr: 1.0e-04 loss: 3.949e-02]mindexpander_qwen_v1:  10%|9         | 299/3000 [20:14<3:05:16,  4.12s/it, lr: 1.0e-04 loss: 3.949e-02]mindexpander_qwen_v1:  10%|#         | 300/3000 [20:20<3:05:12,  4.12s/it, lr: 1.0e-04 loss: 2.137e-02]mindexpander_qwen_v1:  10%|#         | 300/3000 [20:20<3:05:12,  4.12s/it, lr: 1.0e-04 loss: 2.137e-02]mindexpander_qwen_v1:  10%|#         | 301/3000 [20:20<2:41:58,  3.60s/it, lr: 1.0e-04 loss: 2.137e-02]mindexpander_qwen_v1:  10%|#         | 301/3000 [20:20<2:41:58,  3.60s/it, lr: 1.0e-04 loss: 2.137e-02]mindexpander_qwen_v1:  10%|#         | 301/3000 [20:25<2:41:58,  3.60s/it, lr: 1.0e-04 loss: 9.098e-02]mindexpander_qwen_v1:  10%|#         | 301/3000 [20:25<2:41:58,  3.60s/it, lr: 1.0e-04 loss: 9.098e-02]mindexpander_qwen_v1:  10%|#         | 302/3000 [20:25<3:05:46,  4.13s/it, lr: 1.0e-04 loss: 9.098e-02]mindexpander_qwen_v1:  10%|#         | 302/3000 [20:25<3:05:46,  4.13s/it, lr: 1.0e-04 loss: 9.098e-02]mindexpander_qwen_v1:  10%|#         | 302/3000 [20:31<3:05:46,  4.13s/it, lr: 1.0e-04 loss: 5.584e-02]mindexpander_qwen_v1:  10%|#         | 302/3000 [20:31<3:05:46,  4.13s/it, lr: 1.0e-04 loss: 5.584e-02]mindexpander_qwen_v1:  10%|#         | 303/3000 [20:31<3:24:41,  4.55s/it, lr: 1.0e-04 loss: 5.584e-02]mindexpander_qwen_v1:  10%|#         | 303/3000 [20:31<3:24:41,  4.55s/it, lr: 1.0e-04 loss: 5.584e-02]mindexpander_qwen_v1:  10%|#         | 303/3000 [20:35<3:24:41,  4.55s/it, lr: 1.0e-04 loss: 1.855e-02]mindexpander_qwen_v1:  10%|#         | 303/3000 [20:35<3:24:41,  4.55s/it, lr: 1.0e-04 loss: 1.855e-02]mindexpander_qwen_v1:  10%|#         | 304/3000 [20:35<3:14:43,  4.33s/it, lr: 1.0e-04 loss: 1.855e-02]mindexpander_qwen_v1:  10%|#         | 304/3000 [20:35<3:14:43,  4.33s/it, lr: 1.0e-04 loss: 1.855e-02]mindexpander_qwen_v1:  10%|#         | 304/3000 [20:39<3:14:43,  4.33s/it, lr: 1.0e-04 loss: 1.930e-01]mindexpander_qwen_v1:  10%|#         | 304/3000 [20:39<3:14:43,  4.33s/it, lr: 1.0e-04 loss: 1.930e-01]mindexpander_qwen_v1:  10%|#         | 305/3000 [20:39<3:09:27,  4.22s/it, lr: 1.0e-04 loss: 1.930e-01]mindexpander_qwen_v1:  10%|#         | 305/3000 [20:39<3:09:27,  4.22s/it, lr: 1.0e-04 loss: 1.930e-01]mindexpander_qwen_v1:  10%|#         | 305/3000 [20:41<3:09:27,  4.22s/it, lr: 1.0e-04 loss: 3.945e-03]mindexpander_qwen_v1:  10%|#         | 305/3000 [20:41<3:09:27,  4.22s/it, lr: 1.0e-04 loss: 3.945e-03]mindexpander_qwen_v1:  10%|#         | 306/3000 [20:41<2:46:50,  3.72s/it, lr: 1.0e-04 loss: 3.945e-03]mindexpander_qwen_v1:  10%|#         | 306/3000 [20:41<2:46:50,  3.72s/it, lr: 1.0e-04 loss: 3.945e-03]mindexpander_qwen_v1:  10%|#         | 306/3000 [20:45<2:46:50,  3.72s/it, lr: 1.0e-04 loss: 1.829e-01]mindexpander_qwen_v1:  10%|#         | 306/3000 [20:45<2:46:50,  3.72s/it, lr: 1.0e-04 loss: 1.829e-01]mindexpander_qwen_v1:  10%|#         | 307/3000 [20:45<2:47:05,  3.72s/it, lr: 1.0e-04 loss: 1.829e-01]mindexpander_qwen_v1:  10%|#         | 307/3000 [20:45<2:47:05,  3.72s/it, lr: 1.0e-04 loss: 1.829e-01]mindexpander_qwen_v1:  10%|#         | 307/3000 [20:48<2:47:05,  3.72s/it, lr: 1.0e-04 loss: 3.334e-02]mindexpander_qwen_v1:  10%|#         | 307/3000 [20:48<2:47:05,  3.72s/it, lr: 1.0e-04 loss: 3.334e-02]mindexpander_qwen_v1:  10%|#         | 308/3000 [20:48<2:30:25,  3.35s/it, lr: 1.0e-04 loss: 3.334e-02]mindexpander_qwen_v1:  10%|#         | 308/3000 [20:48<2:30:25,  3.35s/it, lr: 1.0e-04 loss: 3.334e-02]mindexpander_qwen_v1:  10%|#         | 308/3000 [20:53<2:30:25,  3.35s/it, lr: 1.0e-04 loss: 7.536e-02]mindexpander_qwen_v1:  10%|#         | 308/3000 [20:53<2:30:25,  3.35s/it, lr: 1.0e-04 loss: 7.536e-02]mindexpander_qwen_v1:  10%|#         | 309/3000 [20:53<3:03:52,  4.10s/it, lr: 1.0e-04 loss: 7.536e-02]mindexpander_qwen_v1:  10%|#         | 309/3000 [20:53<3:03:52,  4.10s/it, lr: 1.0e-04 loss: 7.536e-02]mindexpander_qwen_v1:  10%|#         | 309/3000 [20:59<3:03:52,  4.10s/it, lr: 1.0e-04 loss: 1.872e-01]mindexpander_qwen_v1:  10%|#         | 309/3000 [20:59<3:03:52,  4.10s/it, lr: 1.0e-04 loss: 1.872e-01]mindexpander_qwen_v1:  10%|#         | 310/3000 [21:03<3:03:48,  4.10s/it, lr: 1.0e-04 loss: 3.789e-02]mindexpander_qwen_v1:  10%|#         | 310/3000 [21:03<3:03:48,  4.10s/it, lr: 1.0e-04 loss: 3.789e-02]mindexpander_qwen_v1:  10%|#         | 311/3000 [21:03<2:18:06,  3.08s/it, lr: 1.0e-04 loss: 3.789e-02]mindexpander_qwen_v1:  10%|#         | 311/3000 [21:03<2:18:06,  3.08s/it, lr: 1.0e-04 loss: 3.789e-02]mindexpander_qwen_v1:  10%|#         | 311/3000 [21:05<2:18:06,  3.08s/it, lr: 1.0e-04 loss: 1.729e-01]mindexpander_qwen_v1:  10%|#         | 311/3000 [21:05<2:18:06,  3.08s/it, lr: 1.0e-04 loss: 1.729e-01]mindexpander_qwen_v1:  10%|#         | 312/3000 [21:05<2:11:04,  2.93s/it, lr: 1.0e-04 loss: 1.729e-01]mindexpander_qwen_v1:  10%|#         | 312/3000 [21:05<2:11:04,  2.93s/it, lr: 1.0e-04 loss: 1.729e-01]mindexpander_qwen_v1:  10%|#         | 312/3000 [21:09<2:11:04,  2.93s/it, lr: 1.0e-04 loss: 2.725e-02]mindexpander_qwen_v1:  10%|#         | 312/3000 [21:09<2:11:04,  2.93s/it, lr: 1.0e-04 loss: 2.725e-02]mindexpander_qwen_v1:  10%|#         | 313/3000 [21:09<2:22:18,  3.18s/it, lr: 1.0e-04 loss: 2.725e-02]mindexpander_qwen_v1:  10%|#         | 313/3000 [21:09<2:22:18,  3.18s/it, lr: 1.0e-04 loss: 2.725e-02]mindexpander_qwen_v1:  10%|#         | 313/3000 [21:13<2:22:18,  3.18s/it, lr: 1.0e-04 loss: 7.287e-02]mindexpander_qwen_v1:  10%|#         | 313/3000 [21:13<2:22:18,  3.18s/it, lr: 1.0e-04 loss: 7.287e-02]mindexpander_qwen_v1:  10%|#         | 314/3000 [21:13<2:29:06,  3.33s/it, lr: 1.0e-04 loss: 7.287e-02]mindexpander_qwen_v1:  10%|#         | 314/3000 [21:13<2:29:06,  3.33s/it, lr: 1.0e-04 loss: 7.287e-02]mindexpander_qwen_v1:  10%|#         | 314/3000 [21:17<2:29:06,  3.33s/it, lr: 1.0e-04 loss: 1.697e-01]mindexpander_qwen_v1:  10%|#         | 314/3000 [21:17<2:29:06,  3.33s/it, lr: 1.0e-04 loss: 1.697e-01]mindexpander_qwen_v1:  10%|#         | 315/3000 [21:17<2:34:09,  3.44s/it, lr: 1.0e-04 loss: 1.697e-01]mindexpander_qwen_v1:  10%|#         | 315/3000 [21:17<2:34:09,  3.44s/it, lr: 1.0e-04 loss: 1.697e-01]mindexpander_qwen_v1:  10%|#         | 315/3000 [21:23<2:34:09,  3.44s/it, lr: 1.0e-04 loss: 5.186e-02]mindexpander_qwen_v1:  10%|#         | 315/3000 [21:23<2:34:09,  3.44s/it, lr: 1.0e-04 loss: 5.186e-02]mindexpander_qwen_v1:  11%|#         | 316/3000 [21:23<3:03:31,  4.10s/it, lr: 1.0e-04 loss: 5.186e-02]mindexpander_qwen_v1:  11%|#         | 316/3000 [21:23<3:03:31,  4.10s/it, lr: 1.0e-04 loss: 5.186e-02]mindexpander_qwen_v1:  11%|#         | 316/3000 [21:26<3:03:31,  4.10s/it, lr: 1.0e-04 loss: 1.130e-01]mindexpander_qwen_v1:  11%|#         | 316/3000 [21:26<3:03:31,  4.10s/it, lr: 1.0e-04 loss: 1.130e-01]mindexpander_qwen_v1:  11%|#         | 317/3000 [21:26<3:00:55,  4.05s/it, lr: 1.0e-04 loss: 1.130e-01]mindexpander_qwen_v1:  11%|#         | 317/3000 [21:26<3:00:55,  4.05s/it, lr: 1.0e-04 loss: 1.130e-01]mindexpander_qwen_v1:  11%|#         | 317/3000 [21:29<3:00:55,  4.05s/it, lr: 1.0e-04 loss: 9.544e-02]mindexpander_qwen_v1:  11%|#         | 317/3000 [21:29<3:00:55,  4.05s/it, lr: 1.0e-04 loss: 9.544e-02]mindexpander_qwen_v1:  11%|#         | 318/3000 [21:29<2:39:57,  3.58s/it, lr: 1.0e-04 loss: 9.544e-02]mindexpander_qwen_v1:  11%|#         | 318/3000 [21:29<2:39:57,  3.58s/it, lr: 1.0e-04 loss: 9.544e-02]mindexpander_qwen_v1:  11%|#         | 318/3000 [21:31<2:39:57,  3.58s/it, lr: 1.0e-04 loss: 8.221e-02]mindexpander_qwen_v1:  11%|#         | 318/3000 [21:31<2:39:57,  3.58s/it, lr: 1.0e-04 loss: 8.221e-02]mindexpander_qwen_v1:  11%|#         | 319/3000 [21:31<2:24:52,  3.24s/it, lr: 1.0e-04 loss: 8.221e-02]mindexpander_qwen_v1:  11%|#         | 319/3000 [21:31<2:24:52,  3.24s/it, lr: 1.0e-04 loss: 8.221e-02]mindexpander_qwen_v1:  11%|#         | 319/3000 [21:35<2:24:52,  3.24s/it, lr: 1.0e-04 loss: 8.083e-02]mindexpander_qwen_v1:  11%|#         | 319/3000 [21:35<2:24:52,  3.24s/it, lr: 1.0e-04 loss: 8.083e-02]mindexpander_qwen_v1:  11%|#         | 320/3000 [21:41<2:24:49,  3.24s/it, lr: 1.0e-04 loss: 3.442e-02]mindexpander_qwen_v1:  11%|#         | 320/3000 [21:41<2:24:49,  3.24s/it, lr: 1.0e-04 loss: 3.442e-02]mindexpander_qwen_v1:  11%|#         | 321/3000 [21:41<2:18:35,  3.10s/it, lr: 1.0e-04 loss: 3.442e-02]mindexpander_qwen_v1:  11%|#         | 321/3000 [21:41<2:18:35,  3.10s/it, lr: 1.0e-04 loss: 3.442e-02]mindexpander_qwen_v1:  11%|#         | 321/3000 [21:43<2:18:35,  3.10s/it, lr: 1.0e-04 loss: 1.968e-01]mindexpander_qwen_v1:  11%|#         | 321/3000 [21:43<2:18:35,  3.10s/it, lr: 1.0e-04 loss: 1.968e-01]mindexpander_qwen_v1:  11%|#         | 322/3000 [21:43<2:11:21,  2.94s/it, lr: 1.0e-04 loss: 1.968e-01]mindexpander_qwen_v1:  11%|#         | 322/3000 [21:43<2:11:21,  2.94s/it, lr: 1.0e-04 loss: 1.968e-01]mindexpander_qwen_v1:  11%|#         | 322/3000 [21:49<2:11:21,  2.94s/it, lr: 1.0e-04 loss: 3.907e-02]mindexpander_qwen_v1:  11%|#         | 322/3000 [21:49<2:11:21,  2.94s/it, lr: 1.0e-04 loss: 3.907e-02]mindexpander_qwen_v1:  11%|#         | 323/3000 [21:49<2:44:04,  3.68s/it, lr: 1.0e-04 loss: 3.907e-02]mindexpander_qwen_v1:  11%|#         | 323/3000 [21:49<2:44:04,  3.68s/it, lr: 1.0e-04 loss: 3.907e-02]mindexpander_qwen_v1:  11%|#         | 323/3000 [21:52<2:44:04,  3.68s/it, lr: 1.0e-04 loss: 1.844e-01]mindexpander_qwen_v1:  11%|#         | 323/3000 [21:52<2:44:04,  3.68s/it, lr: 1.0e-04 loss: 1.844e-01]mindexpander_qwen_v1:  11%|#         | 324/3000 [21:52<2:29:08,  3.34s/it, lr: 1.0e-04 loss: 1.844e-01]mindexpander_qwen_v1:  11%|#         | 324/3000 [21:52<2:29:08,  3.34s/it, lr: 1.0e-04 loss: 1.844e-01]mindexpander_qwen_v1:  11%|#         | 324/3000 [21:57<2:29:08,  3.34s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  11%|#         | 324/3000 [21:57<2:29:08,  3.34s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  11%|#         | 325/3000 [21:57<3:00:25,  4.05s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  11%|#         | 325/3000 [21:57<3:00:25,  4.05s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  11%|#         | 325/3000 [22:00<3:00:25,  4.05s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  11%|#         | 325/3000 [22:00<3:00:25,  4.05s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  11%|#         | 326/3000 [22:00<2:40:02,  3.59s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  11%|#         | 326/3000 [22:00<2:40:02,  3.59s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  11%|#         | 326/3000 [22:02<2:40:02,  3.59s/it, lr: 1.0e-04 loss: 8.763e-02]mindexpander_qwen_v1:  11%|#         | 326/3000 [22:02<2:40:02,  3.59s/it, lr: 1.0e-04 loss: 8.763e-02]mindexpander_qwen_v1:  11%|#         | 327/3000 [22:02<2:25:13,  3.26s/it, lr: 1.0e-04 loss: 8.763e-02]mindexpander_qwen_v1:  11%|#         | 327/3000 [22:02<2:25:13,  3.26s/it, lr: 1.0e-04 loss: 8.763e-02]mindexpander_qwen_v1:  11%|#         | 327/3000 [22:05<2:25:13,  3.26s/it, lr: 1.0e-04 loss: 8.197e-02]mindexpander_qwen_v1:  11%|#         | 327/3000 [22:05<2:25:13,  3.26s/it, lr: 1.0e-04 loss: 8.197e-02]mindexpander_qwen_v1:  11%|#         | 328/3000 [22:05<2:14:34,  3.02s/it, lr: 1.0e-04 loss: 8.197e-02]mindexpander_qwen_v1:  11%|#         | 328/3000 [22:05<2:14:34,  3.02s/it, lr: 1.0e-04 loss: 8.197e-02]mindexpander_qwen_v1:  11%|#         | 328/3000 [22:11<2:14:34,  3.02s/it, lr: 1.0e-04 loss: 2.402e-02]mindexpander_qwen_v1:  11%|#         | 328/3000 [22:11<2:14:34,  3.02s/it, lr: 1.0e-04 loss: 2.402e-02]mindexpander_qwen_v1:  11%|#         | 329/3000 [22:11<2:51:51,  3.86s/it, lr: 1.0e-04 loss: 2.402e-02]mindexpander_qwen_v1:  11%|#         | 329/3000 [22:11<2:51:51,  3.86s/it, lr: 1.0e-04 loss: 2.402e-02]mindexpander_qwen_v1:  11%|#         | 329/3000 [22:15<2:51:51,  3.86s/it, lr: 1.0e-04 loss: 2.939e-02]mindexpander_qwen_v1:  11%|#         | 329/3000 [22:15<2:51:51,  3.86s/it, lr: 1.0e-04 loss: 2.939e-02]mindexpander_qwen_v1:  11%|#1        | 330/3000 [22:17<2:51:47,  3.86s/it, lr: 1.0e-04 loss: 3.268e-02]mindexpander_qwen_v1:  11%|#1        | 330/3000 [22:17<2:51:47,  3.86s/it, lr: 1.0e-04 loss: 3.268e-02]mindexpander_qwen_v1:  11%|#1        | 331/3000 [22:17<1:58:08,  2.66s/it, lr: 1.0e-04 loss: 3.268e-02]mindexpander_qwen_v1:  11%|#1        | 331/3000 [22:17<1:58:08,  2.66s/it, lr: 1.0e-04 loss: 3.268e-02]mindexpander_qwen_v1:  11%|#1        | 331/3000 [22:20<1:58:08,  2.66s/it, lr: 1.0e-04 loss: 1.069e-01]mindexpander_qwen_v1:  11%|#1        | 331/3000 [22:20<1:58:08,  2.66s/it, lr: 1.0e-04 loss: 1.069e-01]mindexpander_qwen_v1:  11%|#1        | 332/3000 [22:20<1:55:47,  2.60s/it, lr: 1.0e-04 loss: 1.069e-01]mindexpander_qwen_v1:  11%|#1        | 332/3000 [22:20<1:55:47,  2.60s/it, lr: 1.0e-04 loss: 1.069e-01]mindexpander_qwen_v1:  11%|#1        | 332/3000 [22:24<1:55:47,  2.60s/it, lr: 1.0e-04 loss: 6.881e-02]mindexpander_qwen_v1:  11%|#1        | 332/3000 [22:24<1:55:47,  2.60s/it, lr: 1.0e-04 loss: 6.881e-02]mindexpander_qwen_v1:  11%|#1        | 333/3000 [22:24<2:11:22,  2.96s/it, lr: 1.0e-04 loss: 6.881e-02]mindexpander_qwen_v1:  11%|#1        | 333/3000 [22:24<2:11:22,  2.96s/it, lr: 1.0e-04 loss: 6.881e-02]mindexpander_qwen_v1:  11%|#1        | 333/3000 [22:26<2:11:22,  2.96s/it, lr: 1.0e-04 loss: 7.448e-02]mindexpander_qwen_v1:  11%|#1        | 333/3000 [22:26<2:11:22,  2.96s/it, lr: 1.0e-04 loss: 7.448e-02]mindexpander_qwen_v1:  11%|#1        | 334/3000 [22:26<2:05:12,  2.82s/it, lr: 1.0e-04 loss: 7.448e-02]mindexpander_qwen_v1:  11%|#1        | 334/3000 [22:26<2:05:12,  2.82s/it, lr: 1.0e-04 loss: 7.448e-02]mindexpander_qwen_v1:  11%|#1        | 334/3000 [22:32<2:05:12,  2.82s/it, lr: 1.0e-04 loss: 8.603e-02]mindexpander_qwen_v1:  11%|#1        | 334/3000 [22:32<2:05:12,  2.82s/it, lr: 1.0e-04 loss: 8.603e-02]mindexpander_qwen_v1:  11%|#1        | 335/3000 [22:32<2:41:37,  3.64s/it, lr: 1.0e-04 loss: 8.603e-02]mindexpander_qwen_v1:  11%|#1        | 335/3000 [22:32<2:41:37,  3.64s/it, lr: 1.0e-04 loss: 8.603e-02]mindexpander_qwen_v1:  11%|#1        | 335/3000 [22:34<2:41:37,  3.64s/it, lr: 1.0e-04 loss: 2.823e-02]mindexpander_qwen_v1:  11%|#1        | 335/3000 [22:34<2:41:37,  3.64s/it, lr: 1.0e-04 loss: 2.823e-02]mindexpander_qwen_v1:  11%|#1        | 336/3000 [22:34<2:26:27,  3.30s/it, lr: 1.0e-04 loss: 2.823e-02]mindexpander_qwen_v1:  11%|#1        | 336/3000 [22:34<2:26:27,  3.30s/it, lr: 1.0e-04 loss: 2.823e-02]mindexpander_qwen_v1:  11%|#1        | 336/3000 [22:38<2:26:27,  3.30s/it, lr: 1.0e-04 loss: 1.854e-01]mindexpander_qwen_v1:  11%|#1        | 336/3000 [22:38<2:26:27,  3.30s/it, lr: 1.0e-04 loss: 1.854e-01]mindexpander_qwen_v1:  11%|#1        | 337/3000 [22:38<2:33:50,  3.47s/it, lr: 1.0e-04 loss: 1.854e-01]mindexpander_qwen_v1:  11%|#1        | 337/3000 [22:38<2:33:50,  3.47s/it, lr: 1.0e-04 loss: 1.854e-01]mindexpander_qwen_v1:  11%|#1        | 337/3000 [22:42<2:33:50,  3.47s/it, lr: 1.0e-04 loss: 1.536e-02]mindexpander_qwen_v1:  11%|#1        | 337/3000 [22:42<2:33:50,  3.47s/it, lr: 1.0e-04 loss: 1.536e-02]mindexpander_qwen_v1:  11%|#1        | 338/3000 [22:42<2:37:20,  3.55s/it, lr: 1.0e-04 loss: 1.536e-02]mindexpander_qwen_v1:  11%|#1        | 338/3000 [22:42<2:37:20,  3.55s/it, lr: 1.0e-04 loss: 1.536e-02]mindexpander_qwen_v1:  11%|#1        | 338/3000 [22:46<2:37:20,  3.55s/it, lr: 1.0e-04 loss: 5.300e-02]mindexpander_qwen_v1:  11%|#1        | 338/3000 [22:46<2:37:20,  3.55s/it, lr: 1.0e-04 loss: 5.300e-02]mindexpander_qwen_v1:  11%|#1        | 339/3000 [22:46<2:39:56,  3.61s/it, lr: 1.0e-04 loss: 5.300e-02]mindexpander_qwen_v1:  11%|#1        | 339/3000 [22:46<2:39:56,  3.61s/it, lr: 1.0e-04 loss: 5.300e-02]mindexpander_qwen_v1:  11%|#1        | 339/3000 [22:50<2:39:56,  3.61s/it, lr: 1.0e-04 loss: 3.230e-02]mindexpander_qwen_v1:  11%|#1        | 339/3000 [22:50<2:39:56,  3.61s/it, lr: 1.0e-04 loss: 3.230e-02]mindexpander_qwen_v1:  11%|#1        | 340/3000 [22:53<2:39:53,  3.61s/it, lr: 1.0e-04 loss: 1.018e-01]mindexpander_qwen_v1:  11%|#1        | 340/3000 [22:53<2:39:53,  3.61s/it, lr: 1.0e-04 loss: 1.018e-01]mindexpander_qwen_v1:  11%|#1        | 341/3000 [22:53<2:04:39,  2.81s/it, lr: 1.0e-04 loss: 1.018e-01]mindexpander_qwen_v1:  11%|#1        | 341/3000 [22:53<2:04:39,  2.81s/it, lr: 1.0e-04 loss: 1.018e-01]mindexpander_qwen_v1:  11%|#1        | 341/3000 [22:56<2:04:39,  2.81s/it, lr: 1.0e-04 loss: 1.605e-01]mindexpander_qwen_v1:  11%|#1        | 341/3000 [22:56<2:04:39,  2.81s/it, lr: 1.0e-04 loss: 1.605e-01]mindexpander_qwen_v1:  11%|#1        | 342/3000 [22:56<2:00:41,  2.72s/it, lr: 1.0e-04 loss: 1.605e-01]mindexpander_qwen_v1:  11%|#1        | 342/3000 [22:56<2:00:41,  2.72s/it, lr: 1.0e-04 loss: 1.605e-01]mindexpander_qwen_v1:  11%|#1        | 342/3000 [23:02<2:00:41,  2.72s/it, lr: 1.0e-04 loss: 3.015e-02]mindexpander_qwen_v1:  11%|#1        | 342/3000 [23:02<2:00:41,  2.72s/it, lr: 1.0e-04 loss: 3.015e-02]mindexpander_qwen_v1:  11%|#1        | 343/3000 [23:02<2:35:33,  3.51s/it, lr: 1.0e-04 loss: 3.015e-02]mindexpander_qwen_v1:  11%|#1        | 343/3000 [23:02<2:35:33,  3.51s/it, lr: 1.0e-04 loss: 3.015e-02]mindexpander_qwen_v1:  11%|#1        | 343/3000 [23:07<2:35:33,  3.51s/it, lr: 1.0e-04 loss: 1.812e-01]mindexpander_qwen_v1:  11%|#1        | 343/3000 [23:07<2:35:33,  3.51s/it, lr: 1.0e-04 loss: 1.812e-01]mindexpander_qwen_v1:  11%|#1        | 344/3000 [23:07<3:02:32,  4.12s/it, lr: 1.0e-04 loss: 1.812e-01]mindexpander_qwen_v1:  11%|#1        | 344/3000 [23:07<3:02:32,  4.12s/it, lr: 1.0e-04 loss: 1.812e-01]mindexpander_qwen_v1:  11%|#1        | 344/3000 [23:13<3:02:32,  4.12s/it, lr: 1.0e-04 loss: 2.966e-02]mindexpander_qwen_v1:  11%|#1        | 344/3000 [23:13<3:02:32,  4.12s/it, lr: 1.0e-04 loss: 2.966e-02]mindexpander_qwen_v1:  12%|#1        | 345/3000 [23:13<3:24:22,  4.62s/it, lr: 1.0e-04 loss: 2.966e-02]mindexpander_qwen_v1:  12%|#1        | 345/3000 [23:13<3:24:22,  4.62s/it, lr: 1.0e-04 loss: 2.966e-02]mindexpander_qwen_v1:  12%|#1        | 345/3000 [23:16<3:24:22,  4.62s/it, lr: 1.0e-04 loss: 4.193e-02]mindexpander_qwen_v1:  12%|#1        | 345/3000 [23:16<3:24:22,  4.62s/it, lr: 1.0e-04 loss: 4.193e-02]mindexpander_qwen_v1:  12%|#1        | 346/3000 [23:16<2:57:06,  4.00s/it, lr: 1.0e-04 loss: 4.193e-02]mindexpander_qwen_v1:  12%|#1        | 346/3000 [23:16<2:57:06,  4.00s/it, lr: 1.0e-04 loss: 4.193e-02]mindexpander_qwen_v1:  12%|#1        | 346/3000 [23:21<2:57:06,  4.00s/it, lr: 1.0e-04 loss: 7.138e-02]mindexpander_qwen_v1:  12%|#1        | 346/3000 [23:21<2:57:06,  4.00s/it, lr: 1.0e-04 loss: 7.138e-02]mindexpander_qwen_v1:  12%|#1        | 347/3000 [23:21<3:19:29,  4.51s/it, lr: 1.0e-04 loss: 7.138e-02]mindexpander_qwen_v1:  12%|#1        | 347/3000 [23:21<3:19:29,  4.51s/it, lr: 1.0e-04 loss: 7.138e-02]mindexpander_qwen_v1:  12%|#1        | 347/3000 [23:27<3:19:29,  4.51s/it, lr: 1.0e-04 loss: 6.376e-02]mindexpander_qwen_v1:  12%|#1        | 347/3000 [23:27<3:19:29,  4.51s/it, lr: 1.0e-04 loss: 6.376e-02]mindexpander_qwen_v1:  12%|#1        | 348/3000 [23:27<3:37:20,  4.92s/it, lr: 1.0e-04 loss: 6.376e-02]mindexpander_qwen_v1:  12%|#1        | 348/3000 [23:27<3:37:20,  4.92s/it, lr: 1.0e-04 loss: 6.376e-02]mindexpander_qwen_v1:  12%|#1        | 348/3000 [23:30<3:37:20,  4.92s/it, lr: 1.0e-04 loss: 2.146e-01]mindexpander_qwen_v1:  12%|#1        | 348/3000 [23:30<3:37:20,  4.92s/it, lr: 1.0e-04 loss: 2.146e-01]mindexpander_qwen_v1:  12%|#1        | 349/3000 [23:30<3:05:07,  4.19s/it, lr: 1.0e-04 loss: 2.146e-01]mindexpander_qwen_v1:  12%|#1        | 349/3000 [23:30<3:05:07,  4.19s/it, lr: 1.0e-04 loss: 2.146e-01]mindexpander_qwen_v1:  12%|#1        | 349/3000 [23:32<3:05:07,  4.19s/it, lr: 1.0e-04 loss: 3.279e-02]mindexpander_qwen_v1:  12%|#1        | 349/3000 [23:32<3:05:07,  4.19s/it, lr: 1.0e-04 loss: 3.279e-02]mindexpander_qwen_v1:  12%|#1        | 350/3000 [23:36<3:05:03,  4.19s/it, lr: 1.0e-04 loss: 1.738e-01]mindexpander_qwen_v1:  12%|#1        | 350/3000 [23:36<3:05:03,  4.19s/it, lr: 1.0e-04 loss: 1.738e-01]mindexpander_qwen_v1:  12%|#1        | 351/3000 [23:36<2:18:11,  3.13s/it, lr: 1.0e-04 loss: 1.738e-01]mindexpander_qwen_v1:  12%|#1        | 351/3000 [23:36<2:18:11,  3.13s/it, lr: 1.0e-04 loss: 1.738e-01]mindexpander_qwen_v1:  12%|#1        | 351/3000 [23:42<2:18:11,  3.13s/it, lr: 1.0e-04 loss: 1.891e-01]mindexpander_qwen_v1:  12%|#1        | 351/3000 [23:42<2:18:11,  3.13s/it, lr: 1.0e-04 loss: 1.891e-01]mindexpander_qwen_v1:  12%|#1        | 352/3000 [23:42<2:47:59,  3.81s/it, lr: 1.0e-04 loss: 1.891e-01]mindexpander_qwen_v1:  12%|#1        | 352/3000 [23:42<2:47:59,  3.81s/it, lr: 1.0e-04 loss: 1.891e-01]mindexpander_qwen_v1:  12%|#1        | 352/3000 [23:46<2:47:59,  3.81s/it, lr: 1.0e-04 loss: 1.775e-03]mindexpander_qwen_v1:  12%|#1        | 352/3000 [23:46<2:47:59,  3.81s/it, lr: 1.0e-04 loss: 1.775e-03]mindexpander_qwen_v1:  12%|#1        | 353/3000 [23:46<2:47:06,  3.79s/it, lr: 1.0e-04 loss: 1.775e-03]mindexpander_qwen_v1:  12%|#1        | 353/3000 [23:46<2:47:06,  3.79s/it, lr: 1.0e-04 loss: 1.775e-03]mindexpander_qwen_v1:  12%|#1        | 353/3000 [23:51<2:47:06,  3.79s/it, lr: 1.0e-04 loss: 7.027e-03]mindexpander_qwen_v1:  12%|#1        | 353/3000 [23:51<2:47:06,  3.79s/it, lr: 1.0e-04 loss: 7.027e-03]mindexpander_qwen_v1:  12%|#1        | 354/3000 [23:51<3:10:34,  4.32s/it, lr: 1.0e-04 loss: 7.027e-03]mindexpander_qwen_v1:  12%|#1        | 354/3000 [23:51<3:10:34,  4.32s/it, lr: 1.0e-04 loss: 7.027e-03]mindexpander_qwen_v1:  12%|#1        | 354/3000 [23:57<3:10:34,  4.32s/it, lr: 1.0e-04 loss: 1.640e-01]mindexpander_qwen_v1:  12%|#1        | 354/3000 [23:57<3:10:34,  4.32s/it, lr: 1.0e-04 loss: 1.640e-01]mindexpander_qwen_v1:  12%|#1        | 355/3000 [23:57<3:28:11,  4.72s/it, lr: 1.0e-04 loss: 1.640e-01]mindexpander_qwen_v1:  12%|#1        | 355/3000 [23:57<3:28:11,  4.72s/it, lr: 1.0e-04 loss: 1.640e-01]mindexpander_qwen_v1:  12%|#1        | 355/3000 [24:03<3:28:11,  4.72s/it, lr: 1.0e-04 loss: 1.869e-02]mindexpander_qwen_v1:  12%|#1        | 355/3000 [24:03<3:28:11,  4.72s/it, lr: 1.0e-04 loss: 1.869e-02]mindexpander_qwen_v1:  12%|#1        | 356/3000 [24:03<3:43:14,  5.07s/it, lr: 1.0e-04 loss: 1.869e-02]mindexpander_qwen_v1:  12%|#1        | 356/3000 [24:03<3:43:14,  5.07s/it, lr: 1.0e-04 loss: 1.869e-02]mindexpander_qwen_v1:  12%|#1        | 356/3000 [24:05<3:43:14,  5.07s/it, lr: 1.0e-04 loss: 9.791e-02]mindexpander_qwen_v1:  12%|#1        | 356/3000 [24:05<3:43:14,  5.07s/it, lr: 1.0e-04 loss: 9.791e-02]mindexpander_qwen_v1:  12%|#1        | 357/3000 [24:05<3:10:13,  4.32s/it, lr: 1.0e-04 loss: 9.791e-02]mindexpander_qwen_v1:  12%|#1        | 357/3000 [24:05<3:10:13,  4.32s/it, lr: 1.0e-04 loss: 9.791e-02]mindexpander_qwen_v1:  12%|#1        | 357/3000 [24:08<3:10:13,  4.32s/it, lr: 1.0e-04 loss: 1.742e-01]mindexpander_qwen_v1:  12%|#1        | 357/3000 [24:08<3:10:13,  4.32s/it, lr: 1.0e-04 loss: 1.742e-01]mindexpander_qwen_v1:  12%|#1        | 358/3000 [24:08<2:46:04,  3.77s/it, lr: 1.0e-04 loss: 1.742e-01]mindexpander_qwen_v1:  12%|#1        | 358/3000 [24:08<2:46:04,  3.77s/it, lr: 1.0e-04 loss: 1.742e-01]mindexpander_qwen_v1:  12%|#1        | 358/3000 [24:12<2:46:04,  3.77s/it, lr: 1.0e-04 loss: 1.456e-03]mindexpander_qwen_v1:  12%|#1        | 358/3000 [24:12<2:46:04,  3.77s/it, lr: 1.0e-04 loss: 1.456e-03]mindexpander_qwen_v1:  12%|#1        | 359/3000 [24:12<2:45:41,  3.76s/it, lr: 1.0e-04 loss: 1.456e-03]mindexpander_qwen_v1:  12%|#1        | 359/3000 [24:12<2:45:41,  3.76s/it, lr: 1.0e-04 loss: 1.456e-03]mindexpander_qwen_v1:  12%|#1        | 359/3000 [24:18<2:45:41,  3.76s/it, lr: 1.0e-04 loss: 1.563e-01]mindexpander_qwen_v1:  12%|#1        | 359/3000 [24:18<2:45:41,  3.76s/it, lr: 1.0e-04 loss: 1.563e-01]mindexpander_qwen_v1:  12%|#2        | 360/3000 [24:22<2:45:37,  3.76s/it, lr: 1.0e-04 loss: 2.631e-02]mindexpander_qwen_v1:  12%|#2        | 360/3000 [24:22<2:45:37,  3.76s/it, lr: 1.0e-04 loss: 2.631e-02]mindexpander_qwen_v1:  12%|#2        | 361/3000 [24:22<2:07:27,  2.90s/it, lr: 1.0e-04 loss: 2.631e-02]mindexpander_qwen_v1:  12%|#2        | 361/3000 [24:22<2:07:27,  2.90s/it, lr: 1.0e-04 loss: 2.631e-02]mindexpander_qwen_v1:  12%|#2        | 361/3000 [24:24<2:07:27,  2.90s/it, lr: 1.0e-04 loss: 1.675e-01]mindexpander_qwen_v1:  12%|#2        | 361/3000 [24:24<2:07:27,  2.90s/it, lr: 1.0e-04 loss: 1.675e-01]mindexpander_qwen_v1:  12%|#2        | 362/3000 [24:24<2:02:37,  2.79s/it, lr: 1.0e-04 loss: 1.675e-01]mindexpander_qwen_v1:  12%|#2        | 362/3000 [24:24<2:02:37,  2.79s/it, lr: 1.0e-04 loss: 1.675e-01]mindexpander_qwen_v1:  12%|#2        | 362/3000 [24:27<2:02:37,  2.79s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  12%|#2        | 362/3000 [24:27<2:02:37,  2.79s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  12%|#2        | 363/3000 [24:27<1:58:38,  2.70s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  12%|#2        | 363/3000 [24:27<1:58:38,  2.70s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  12%|#2        | 363/3000 [24:31<1:58:38,  2.70s/it, lr: 1.0e-04 loss: 1.249e-02]mindexpander_qwen_v1:  12%|#2        | 363/3000 [24:31<1:58:38,  2.70s/it, lr: 1.0e-04 loss: 1.249e-02]mindexpander_qwen_v1:  12%|#2        | 364/3000 [24:31<2:12:56,  3.03s/it, lr: 1.0e-04 loss: 1.249e-02]mindexpander_qwen_v1:  12%|#2        | 364/3000 [24:31<2:12:56,  3.03s/it, lr: 1.0e-04 loss: 1.249e-02]mindexpander_qwen_v1:  12%|#2        | 364/3000 [24:33<2:12:56,  3.03s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  12%|#2        | 364/3000 [24:33<2:12:56,  3.03s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  12%|#2        | 365/3000 [24:33<2:05:47,  2.86s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  12%|#2        | 365/3000 [24:33<2:05:47,  2.86s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  12%|#2        | 365/3000 [24:37<2:05:47,  2.86s/it, lr: 1.0e-04 loss: 1.656e-01]mindexpander_qwen_v1:  12%|#2        | 365/3000 [24:37<2:05:47,  2.86s/it, lr: 1.0e-04 loss: 1.656e-01]mindexpander_qwen_v1:  12%|#2        | 366/3000 [24:37<2:16:43,  3.11s/it, lr: 1.0e-04 loss: 1.656e-01]mindexpander_qwen_v1:  12%|#2        | 366/3000 [24:37<2:16:43,  3.11s/it, lr: 1.0e-04 loss: 1.656e-01]mindexpander_qwen_v1:  12%|#2        | 366/3000 [24:40<2:16:43,  3.11s/it, lr: 1.0e-04 loss: 4.897e-02]mindexpander_qwen_v1:  12%|#2        | 366/3000 [24:40<2:16:43,  3.11s/it, lr: 1.0e-04 loss: 4.897e-02]mindexpander_qwen_v1:  12%|#2        | 367/3000 [24:40<2:24:36,  3.30s/it, lr: 1.0e-04 loss: 4.897e-02]mindexpander_qwen_v1:  12%|#2        | 367/3000 [24:40<2:24:36,  3.30s/it, lr: 1.0e-04 loss: 4.897e-02]mindexpander_qwen_v1:  12%|#2        | 367/3000 [24:46<2:24:36,  3.30s/it, lr: 1.0e-04 loss: 1.423e-01]mindexpander_qwen_v1:  12%|#2        | 367/3000 [24:46<2:24:36,  3.30s/it, lr: 1.0e-04 loss: 1.423e-01]mindexpander_qwen_v1:  12%|#2        | 368/3000 [24:46<2:57:40,  4.05s/it, lr: 1.0e-04 loss: 1.423e-01]mindexpander_qwen_v1:  12%|#2        | 368/3000 [24:46<2:57:40,  4.05s/it, lr: 1.0e-04 loss: 1.423e-01]mindexpander_qwen_v1:  12%|#2        | 368/3000 [24:52<2:57:40,  4.05s/it, lr: 1.0e-04 loss: 9.574e-02]mindexpander_qwen_v1:  12%|#2        | 368/3000 [24:52<2:57:40,  4.05s/it, lr: 1.0e-04 loss: 9.574e-02]mindexpander_qwen_v1:  12%|#2        | 369/3000 [24:52<3:19:36,  4.55s/it, lr: 1.0e-04 loss: 9.574e-02]mindexpander_qwen_v1:  12%|#2        | 369/3000 [24:52<3:19:36,  4.55s/it, lr: 1.0e-04 loss: 9.574e-02]mindexpander_qwen_v1:  12%|#2        | 369/3000 [24:55<3:19:36,  4.55s/it, lr: 1.0e-04 loss: 2.006e-01]mindexpander_qwen_v1:  12%|#2        | 369/3000 [24:55<3:19:36,  4.55s/it, lr: 1.0e-04 loss: 2.006e-01]mindexpander_qwen_v1:  12%|#2        | 370/3000 [25:00<3:19:31,  4.55s/it, lr: 1.0e-04 loss: 1.092e-01]mindexpander_qwen_v1:  12%|#2        | 370/3000 [25:00<3:19:31,  4.55s/it, lr: 1.0e-04 loss: 1.092e-01]mindexpander_qwen_v1:  12%|#2        | 371/3000 [25:00<2:46:04,  3.79s/it, lr: 1.0e-04 loss: 1.092e-01]mindexpander_qwen_v1:  12%|#2        | 371/3000 [25:00<2:46:04,  3.79s/it, lr: 1.0e-04 loss: 1.092e-01]mindexpander_qwen_v1:  12%|#2        | 371/3000 [25:06<2:46:04,  3.79s/it, lr: 1.0e-04 loss: 3.169e-02]mindexpander_qwen_v1:  12%|#2        | 371/3000 [25:06<2:46:04,  3.79s/it, lr: 1.0e-04 loss: 3.169e-02]mindexpander_qwen_v1:  12%|#2        | 372/3000 [25:06<3:08:32,  4.30s/it, lr: 1.0e-04 loss: 3.169e-02]mindexpander_qwen_v1:  12%|#2        | 372/3000 [25:06<3:08:32,  4.30s/it, lr: 1.0e-04 loss: 3.169e-02]mindexpander_qwen_v1:  12%|#2        | 372/3000 [25:12<3:08:32,  4.30s/it, lr: 1.0e-04 loss: 2.806e-02]mindexpander_qwen_v1:  12%|#2        | 372/3000 [25:12<3:08:32,  4.30s/it, lr: 1.0e-04 loss: 2.806e-02]mindexpander_qwen_v1:  12%|#2        | 373/3000 [25:12<3:25:00,  4.68s/it, lr: 1.0e-04 loss: 2.806e-02]mindexpander_qwen_v1:  12%|#2        | 373/3000 [25:12<3:25:00,  4.68s/it, lr: 1.0e-04 loss: 2.806e-02]mindexpander_qwen_v1:  12%|#2        | 373/3000 [25:18<3:25:00,  4.68s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  12%|#2        | 373/3000 [25:18<3:25:00,  4.68s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  12%|#2        | 374/3000 [25:18<3:37:41,  4.97s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  12%|#2        | 374/3000 [25:18<3:37:41,  4.97s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  12%|#2        | 374/3000 [25:21<3:37:41,  4.97s/it, lr: 1.0e-04 loss: 1.316e-02]mindexpander_qwen_v1:  12%|#2        | 374/3000 [25:21<3:37:41,  4.97s/it, lr: 1.0e-04 loss: 1.316e-02]mindexpander_qwen_v1:  12%|#2        | 375/3000 [25:21<3:22:32,  4.63s/it, lr: 1.0e-04 loss: 1.316e-02]mindexpander_qwen_v1:  12%|#2        | 375/3000 [25:21<3:22:32,  4.63s/it, lr: 1.0e-04 loss: 1.316e-02]mindexpander_qwen_v1:  12%|#2        | 375/3000 [25:25<3:22:32,  4.63s/it, lr: 1.0e-04 loss: 1.615e-01]mindexpander_qwen_v1:  12%|#2        | 375/3000 [25:25<3:22:32,  4.63s/it, lr: 1.0e-04 loss: 1.615e-01]mindexpander_qwen_v1:  13%|#2        | 376/3000 [25:25<3:13:11,  4.42s/it, lr: 1.0e-04 loss: 1.615e-01]mindexpander_qwen_v1:  13%|#2        | 376/3000 [25:25<3:13:11,  4.42s/it, lr: 1.0e-04 loss: 1.615e-01]mindexpander_qwen_v1:  13%|#2        | 376/3000 [25:31<3:13:11,  4.42s/it, lr: 1.0e-04 loss: 1.052e-01]mindexpander_qwen_v1:  13%|#2        | 376/3000 [25:31<3:13:11,  4.42s/it, lr: 1.0e-04 loss: 1.052e-01]mindexpander_qwen_v1:  13%|#2        | 377/3000 [25:31<3:29:59,  4.80s/it, lr: 1.0e-04 loss: 1.052e-01]mindexpander_qwen_v1:  13%|#2        | 377/3000 [25:31<3:29:59,  4.80s/it, lr: 1.0e-04 loss: 1.052e-01]mindexpander_qwen_v1:  13%|#2        | 377/3000 [25:34<3:29:59,  4.80s/it, lr: 1.0e-04 loss: 4.582e-02]mindexpander_qwen_v1:  13%|#2        | 377/3000 [25:34<3:29:59,  4.80s/it, lr: 1.0e-04 loss: 4.582e-02]mindexpander_qwen_v1:  13%|#2        | 378/3000 [25:34<2:59:46,  4.11s/it, lr: 1.0e-04 loss: 4.582e-02]mindexpander_qwen_v1:  13%|#2        | 378/3000 [25:34<2:59:46,  4.11s/it, lr: 1.0e-04 loss: 4.582e-02]mindexpander_qwen_v1:  13%|#2        | 378/3000 [25:39<2:59:46,  4.11s/it, lr: 1.0e-04 loss: 1.824e-01]mindexpander_qwen_v1:  13%|#2        | 378/3000 [25:39<2:59:46,  4.11s/it, lr: 1.0e-04 loss: 1.824e-01]mindexpander_qwen_v1:  13%|#2        | 379/3000 [25:39<3:20:50,  4.60s/it, lr: 1.0e-04 loss: 1.824e-01]mindexpander_qwen_v1:  13%|#2        | 379/3000 [25:39<3:20:50,  4.60s/it, lr: 1.0e-04 loss: 1.824e-01]mindexpander_qwen_v1:  13%|#2        | 379/3000 [25:42<3:20:50,  4.60s/it, lr: 1.0e-04 loss: 8.175e-02]mindexpander_qwen_v1:  13%|#2        | 379/3000 [25:42<3:20:50,  4.60s/it, lr: 1.0e-04 loss: 8.175e-02]mindexpander_qwen_v1:  13%|#2        | 380/3000 [25:46<3:20:46,  4.60s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  13%|#2        | 380/3000 [25:46<3:20:46,  4.60s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  13%|#2        | 381/3000 [25:46<2:26:21,  3.35s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  13%|#2        | 381/3000 [25:46<2:26:21,  3.35s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  13%|#2        | 381/3000 [25:49<2:26:21,  3.35s/it, lr: 1.0e-04 loss: 1.332e-01]mindexpander_qwen_v1:  13%|#2        | 381/3000 [25:49<2:26:21,  3.35s/it, lr: 1.0e-04 loss: 1.332e-01]mindexpander_qwen_v1:  13%|#2        | 382/3000 [25:49<2:30:24,  3.45s/it, lr: 1.0e-04 loss: 1.332e-01]mindexpander_qwen_v1:  13%|#2        | 382/3000 [25:49<2:30:24,  3.45s/it, lr: 1.0e-04 loss: 1.332e-01]mindexpander_qwen_v1:  13%|#2        | 382/3000 [25:52<2:30:24,  3.45s/it, lr: 1.0e-04 loss: 5.600e-02]mindexpander_qwen_v1:  13%|#2        | 382/3000 [25:52<2:30:24,  3.45s/it, lr: 1.0e-04 loss: 5.600e-02]mindexpander_qwen_v1:  13%|#2        | 383/3000 [25:52<2:19:00,  3.19s/it, lr: 1.0e-04 loss: 5.600e-02]mindexpander_qwen_v1:  13%|#2        | 383/3000 [25:52<2:19:00,  3.19s/it, lr: 1.0e-04 loss: 5.600e-02]mindexpander_qwen_v1:  13%|#2        | 383/3000 [25:56<2:19:00,  3.19s/it, lr: 1.0e-04 loss: 1.302e-01]mindexpander_qwen_v1:  13%|#2        | 383/3000 [25:56<2:19:00,  3.19s/it, lr: 1.0e-04 loss: 1.302e-01]mindexpander_qwen_v1:  13%|#2        | 384/3000 [25:56<2:27:11,  3.38s/it, lr: 1.0e-04 loss: 1.302e-01]mindexpander_qwen_v1:  13%|#2        | 384/3000 [25:56<2:27:11,  3.38s/it, lr: 1.0e-04 loss: 1.302e-01]mindexpander_qwen_v1:  13%|#2        | 384/3000 [25:59<2:27:11,  3.38s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  13%|#2        | 384/3000 [25:59<2:27:11,  3.38s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  13%|#2        | 385/3000 [25:59<2:31:32,  3.48s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  13%|#2        | 385/3000 [25:59<2:31:32,  3.48s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  13%|#2        | 385/3000 [26:02<2:31:32,  3.48s/it, lr: 1.0e-04 loss: 9.492e-02]mindexpander_qwen_v1:  13%|#2        | 385/3000 [26:02<2:31:32,  3.48s/it, lr: 1.0e-04 loss: 9.492e-02]mindexpander_qwen_v1:  13%|#2        | 386/3000 [26:02<2:18:43,  3.18s/it, lr: 1.0e-04 loss: 9.492e-02]mindexpander_qwen_v1:  13%|#2        | 386/3000 [26:02<2:18:43,  3.18s/it, lr: 1.0e-04 loss: 9.492e-02]mindexpander_qwen_v1:  13%|#2        | 386/3000 [26:08<2:18:43,  3.18s/it, lr: 1.0e-04 loss: 9.435e-02]mindexpander_qwen_v1:  13%|#2        | 386/3000 [26:08<2:18:43,  3.18s/it, lr: 1.0e-04 loss: 9.435e-02]mindexpander_qwen_v1:  13%|#2        | 387/3000 [26:08<2:51:05,  3.93s/it, lr: 1.0e-04 loss: 9.435e-02]mindexpander_qwen_v1:  13%|#2        | 387/3000 [26:08<2:51:05,  3.93s/it, lr: 1.0e-04 loss: 9.435e-02]mindexpander_qwen_v1:  13%|#2        | 387/3000 [26:10<2:51:05,  3.93s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  13%|#2        | 387/3000 [26:10<2:51:05,  3.93s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  13%|#2        | 388/3000 [26:10<2:34:42,  3.55s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  13%|#2        | 388/3000 [26:10<2:34:42,  3.55s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  13%|#2        | 388/3000 [26:13<2:34:42,  3.55s/it, lr: 1.0e-04 loss: 2.708e-02]mindexpander_qwen_v1:  13%|#2        | 388/3000 [26:13<2:34:42,  3.55s/it, lr: 1.0e-04 loss: 2.708e-02]mindexpander_qwen_v1:  13%|#2        | 389/3000 [26:13<2:20:21,  3.23s/it, lr: 1.0e-04 loss: 2.708e-02]mindexpander_qwen_v1:  13%|#2        | 389/3000 [26:13<2:20:21,  3.23s/it, lr: 1.0e-04 loss: 2.708e-02]mindexpander_qwen_v1:  13%|#2        | 389/3000 [26:17<2:20:21,  3.23s/it, lr: 1.0e-04 loss: 7.397e-02]mindexpander_qwen_v1:  13%|#2        | 389/3000 [26:17<2:20:21,  3.23s/it, lr: 1.0e-04 loss: 7.397e-02]mindexpander_qwen_v1:  13%|#3        | 390/3000 [26:23<2:20:18,  3.23s/it, lr: 1.0e-04 loss: 5.216e-02]mindexpander_qwen_v1:  13%|#3        | 390/3000 [26:23<2:20:18,  3.23s/it, lr: 1.0e-04 loss: 5.216e-02]mindexpander_qwen_v1:  13%|#3        | 391/3000 [26:23<2:13:26,  3.07s/it, lr: 1.0e-04 loss: 5.216e-02]mindexpander_qwen_v1:  13%|#3        | 391/3000 [26:23<2:13:26,  3.07s/it, lr: 1.0e-04 loss: 5.216e-02]mindexpander_qwen_v1:  13%|#3        | 391/3000 [26:26<2:13:26,  3.07s/it, lr: 1.0e-04 loss: 8.685e-02]mindexpander_qwen_v1:  13%|#3        | 391/3000 [26:26<2:13:26,  3.07s/it, lr: 1.0e-04 loss: 8.685e-02]mindexpander_qwen_v1:  13%|#3        | 392/3000 [26:26<2:23:00,  3.29s/it, lr: 1.0e-04 loss: 8.685e-02]mindexpander_qwen_v1:  13%|#3        | 392/3000 [26:26<2:23:00,  3.29s/it, lr: 1.0e-04 loss: 8.685e-02]mindexpander_qwen_v1:  13%|#3        | 392/3000 [26:32<2:23:00,  3.29s/it, lr: 1.0e-04 loss: 1.296e-02]mindexpander_qwen_v1:  13%|#3        | 392/3000 [26:32<2:23:00,  3.29s/it, lr: 1.0e-04 loss: 1.296e-02]mindexpander_qwen_v1:  13%|#3        | 393/3000 [26:32<2:51:04,  3.94s/it, lr: 1.0e-04 loss: 1.296e-02]mindexpander_qwen_v1:  13%|#3        | 393/3000 [26:32<2:51:04,  3.94s/it, lr: 1.0e-04 loss: 1.296e-02]mindexpander_qwen_v1:  13%|#3        | 393/3000 [26:38<2:51:04,  3.94s/it, lr: 1.0e-04 loss: 1.887e-01]mindexpander_qwen_v1:  13%|#3        | 393/3000 [26:38<2:51:04,  3.94s/it, lr: 1.0e-04 loss: 1.887e-01]mindexpander_qwen_v1:  13%|#3        | 394/3000 [26:38<3:12:35,  4.43s/it, lr: 1.0e-04 loss: 1.887e-01]mindexpander_qwen_v1:  13%|#3        | 394/3000 [26:38<3:12:35,  4.43s/it, lr: 1.0e-04 loss: 1.887e-01]mindexpander_qwen_v1:  13%|#3        | 394/3000 [26:41<3:12:35,  4.43s/it, lr: 1.0e-04 loss: 1.333e-01]mindexpander_qwen_v1:  13%|#3        | 394/3000 [26:41<3:12:35,  4.43s/it, lr: 1.0e-04 loss: 1.333e-01]mindexpander_qwen_v1:  13%|#3        | 395/3000 [26:41<2:48:38,  3.88s/it, lr: 1.0e-04 loss: 1.333e-01]mindexpander_qwen_v1:  13%|#3        | 395/3000 [26:41<2:48:38,  3.88s/it, lr: 1.0e-04 loss: 1.333e-01]mindexpander_qwen_v1:  13%|#3        | 395/3000 [26:43<2:48:38,  3.88s/it, lr: 1.0e-04 loss: 8.931e-02]mindexpander_qwen_v1:  13%|#3        | 395/3000 [26:43<2:48:38,  3.88s/it, lr: 1.0e-04 loss: 8.931e-02]mindexpander_qwen_v1:  13%|#3        | 396/3000 [26:43<2:33:24,  3.53s/it, lr: 1.0e-04 loss: 8.931e-02]mindexpander_qwen_v1:  13%|#3        | 396/3000 [26:43<2:33:24,  3.53s/it, lr: 1.0e-04 loss: 8.931e-02]mindexpander_qwen_v1:  13%|#3        | 396/3000 [26:49<2:33:24,  3.53s/it, lr: 1.0e-04 loss: 1.711e-02]mindexpander_qwen_v1:  13%|#3        | 396/3000 [26:49<2:33:24,  3.53s/it, lr: 1.0e-04 loss: 1.711e-02]mindexpander_qwen_v1:  13%|#3        | 397/3000 [26:49<3:01:16,  4.18s/it, lr: 1.0e-04 loss: 1.711e-02]mindexpander_qwen_v1:  13%|#3        | 397/3000 [26:49<3:01:16,  4.18s/it, lr: 1.0e-04 loss: 1.711e-02]mindexpander_qwen_v1:  13%|#3        | 397/3000 [26:55<3:01:16,  4.18s/it, lr: 1.0e-04 loss: 1.798e-01]mindexpander_qwen_v1:  13%|#3        | 397/3000 [26:55<3:01:16,  4.18s/it, lr: 1.0e-04 loss: 1.798e-01]mindexpander_qwen_v1:  13%|#3        | 398/3000 [26:55<3:21:12,  4.64s/it, lr: 1.0e-04 loss: 1.798e-01]mindexpander_qwen_v1:  13%|#3        | 398/3000 [26:55<3:21:12,  4.64s/it, lr: 1.0e-04 loss: 1.798e-01]mindexpander_qwen_v1:  13%|#3        | 398/3000 [26:59<3:21:12,  4.64s/it, lr: 1.0e-04 loss: 2.430e-02]mindexpander_qwen_v1:  13%|#3        | 398/3000 [26:59<3:21:12,  4.64s/it, lr: 1.0e-04 loss: 2.430e-02]mindexpander_qwen_v1:  13%|#3        | 399/3000 [26:59<3:11:33,  4.42s/it, lr: 1.0e-04 loss: 2.430e-02]mindexpander_qwen_v1:  13%|#3        | 399/3000 [26:59<3:11:33,  4.42s/it, lr: 1.0e-04 loss: 2.430e-02]mindexpander_qwen_v1:  13%|#3        | 399/3000 [27:01<3:11:33,  4.42s/it, lr: 1.0e-04 loss: 2.466e-02]mindexpander_qwen_v1:  13%|#3        | 399/3000 [27:01<3:11:33,  4.42s/it, lr: 1.0e-04 loss: 2.466e-02]mindexpander_qwen_v1:  13%|#3        | 400/3000 [27:05<3:11:29,  4.42s/it, lr: 1.0e-04 loss: 4.329e-02]mindexpander_qwen_v1:  13%|#3        | 400/3000 [27:05<3:11:29,  4.42s/it, lr: 1.0e-04 loss: 4.329e-02]mindexpander_qwen_v1:  13%|#3        | 401/3000 [27:05<2:20:52,  3.25s/it, lr: 1.0e-04 loss: 4.329e-02]mindexpander_qwen_v1:  13%|#3        | 401/3000 [27:05<2:20:52,  3.25s/it, lr: 1.0e-04 loss: 4.329e-02]mindexpander_qwen_v1:  13%|#3        | 401/3000 [27:09<2:20:52,  3.25s/it, lr: 1.0e-04 loss: 1.559e-01]mindexpander_qwen_v1:  13%|#3        | 401/3000 [27:09<2:20:52,  3.25s/it, lr: 1.0e-04 loss: 1.559e-01]mindexpander_qwen_v1:  13%|#3        | 402/3000 [27:09<2:26:05,  3.37s/it, lr: 1.0e-04 loss: 1.559e-01]mindexpander_qwen_v1:  13%|#3        | 402/3000 [27:09<2:26:05,  3.37s/it, lr: 1.0e-04 loss: 1.559e-01]mindexpander_qwen_v1:  13%|#3        | 402/3000 [27:11<2:26:05,  3.37s/it, lr: 1.0e-04 loss: 6.647e-03]mindexpander_qwen_v1:  13%|#3        | 402/3000 [27:11<2:26:05,  3.37s/it, lr: 1.0e-04 loss: 6.647e-03]mindexpander_qwen_v1:  13%|#3        | 403/3000 [27:11<2:17:56,  3.19s/it, lr: 1.0e-04 loss: 6.647e-03]mindexpander_qwen_v1:  13%|#3        | 403/3000 [27:11<2:17:56,  3.19s/it, lr: 1.0e-04 loss: 6.647e-03]mindexpander_qwen_v1:  13%|#3        | 403/3000 [27:15<2:17:56,  3.19s/it, lr: 1.0e-04 loss: 9.663e-02]mindexpander_qwen_v1:  13%|#3        | 403/3000 [27:15<2:17:56,  3.19s/it, lr: 1.0e-04 loss: 9.663e-02]mindexpander_qwen_v1:  13%|#3        | 404/3000 [27:15<2:24:33,  3.34s/it, lr: 1.0e-04 loss: 9.663e-02]mindexpander_qwen_v1:  13%|#3        | 404/3000 [27:15<2:24:33,  3.34s/it, lr: 1.0e-04 loss: 9.663e-02]mindexpander_qwen_v1:  13%|#3        | 404/3000 [27:21<2:24:33,  3.34s/it, lr: 1.0e-04 loss: 1.696e-02]mindexpander_qwen_v1:  13%|#3        | 404/3000 [27:21<2:24:33,  3.34s/it, lr: 1.0e-04 loss: 1.696e-02]mindexpander_qwen_v1:  14%|#3        | 405/3000 [27:21<2:53:39,  4.02s/it, lr: 1.0e-04 loss: 1.696e-02]mindexpander_qwen_v1:  14%|#3        | 405/3000 [27:21<2:53:39,  4.02s/it, lr: 1.0e-04 loss: 1.696e-02]mindexpander_qwen_v1:  14%|#3        | 405/3000 [27:24<2:53:39,  4.02s/it, lr: 1.0e-04 loss: 4.320e-02]mindexpander_qwen_v1:  14%|#3        | 405/3000 [27:24<2:53:39,  4.02s/it, lr: 1.0e-04 loss: 4.320e-02]mindexpander_qwen_v1:  14%|#3        | 406/3000 [27:24<2:50:17,  3.94s/it, lr: 1.0e-04 loss: 4.320e-02]mindexpander_qwen_v1:  14%|#3        | 406/3000 [27:24<2:50:17,  3.94s/it, lr: 1.0e-04 loss: 4.320e-02]mindexpander_qwen_v1:  14%|#3        | 406/3000 [27:30<2:50:17,  3.94s/it, lr: 1.0e-04 loss: 1.369e-02]mindexpander_qwen_v1:  14%|#3        | 406/3000 [27:30<2:50:17,  3.94s/it, lr: 1.0e-04 loss: 1.369e-02]mindexpander_qwen_v1:  14%|#3        | 407/3000 [27:30<3:14:24,  4.50s/it, lr: 1.0e-04 loss: 1.369e-02]mindexpander_qwen_v1:  14%|#3        | 407/3000 [27:30<3:14:24,  4.50s/it, lr: 1.0e-04 loss: 1.369e-02]mindexpander_qwen_v1:  14%|#3        | 407/3000 [27:33<3:14:24,  4.50s/it, lr: 1.0e-04 loss: 7.055e-02]mindexpander_qwen_v1:  14%|#3        | 407/3000 [27:33<3:14:24,  4.50s/it, lr: 1.0e-04 loss: 7.055e-02]mindexpander_qwen_v1:  14%|#3        | 408/3000 [27:33<2:48:25,  3.90s/it, lr: 1.0e-04 loss: 7.055e-02]mindexpander_qwen_v1:  14%|#3        | 408/3000 [27:33<2:48:25,  3.90s/it, lr: 1.0e-04 loss: 7.055e-02]mindexpander_qwen_v1:  14%|#3        | 408/3000 [27:35<2:48:25,  3.90s/it, lr: 1.0e-04 loss: 1.424e-02]mindexpander_qwen_v1:  14%|#3        | 408/3000 [27:35<2:48:25,  3.90s/it, lr: 1.0e-04 loss: 1.424e-02]mindexpander_qwen_v1:  14%|#3        | 409/3000 [27:35<2:29:54,  3.47s/it, lr: 1.0e-04 loss: 1.424e-02]mindexpander_qwen_v1:  14%|#3        | 409/3000 [27:35<2:29:54,  3.47s/it, lr: 1.0e-04 loss: 1.424e-02]mindexpander_qwen_v1:  14%|#3        | 409/3000 [27:39<2:29:54,  3.47s/it, lr: 1.0e-04 loss: 4.664e-02]mindexpander_qwen_v1:  14%|#3        | 409/3000 [27:39<2:29:54,  3.47s/it, lr: 1.0e-04 loss: 4.664e-02]mindexpander_qwen_v1:  14%|#3        | 410/3000 [27:45<2:29:51,  3.47s/it, lr: 1.0e-04 loss: 4.237e-03]mindexpander_qwen_v1:  14%|#3        | 410/3000 [27:45<2:29:51,  3.47s/it, lr: 1.0e-04 loss: 4.237e-03]mindexpander_qwen_v1:  14%|#3        | 411/3000 [27:45<2:19:08,  3.22s/it, lr: 1.0e-04 loss: 4.237e-03]mindexpander_qwen_v1:  14%|#3        | 411/3000 [27:45<2:19:08,  3.22s/it, lr: 1.0e-04 loss: 4.237e-03]mindexpander_qwen_v1:  14%|#3        | 411/3000 [27:49<2:19:08,  3.22s/it, lr: 1.0e-04 loss: 5.909e-02]mindexpander_qwen_v1:  14%|#3        | 411/3000 [27:49<2:19:08,  3.22s/it, lr: 1.0e-04 loss: 5.909e-02]mindexpander_qwen_v1:  14%|#3        | 412/3000 [27:49<2:24:34,  3.35s/it, lr: 1.0e-04 loss: 5.909e-02]mindexpander_qwen_v1:  14%|#3        | 412/3000 [27:49<2:24:34,  3.35s/it, lr: 1.0e-04 loss: 5.909e-02]mindexpander_qwen_v1:  14%|#3        | 412/3000 [27:52<2:24:34,  3.35s/it, lr: 1.0e-04 loss: 1.297e-01]mindexpander_qwen_v1:  14%|#3        | 412/3000 [27:52<2:24:34,  3.35s/it, lr: 1.0e-04 loss: 1.297e-01]mindexpander_qwen_v1:  14%|#3        | 413/3000 [27:52<2:28:58,  3.46s/it, lr: 1.0e-04 loss: 1.297e-01]mindexpander_qwen_v1:  14%|#3        | 413/3000 [27:52<2:28:58,  3.46s/it, lr: 1.0e-04 loss: 1.297e-01]mindexpander_qwen_v1:  14%|#3        | 413/3000 [27:55<2:28:58,  3.46s/it, lr: 1.0e-04 loss: 2.782e-02]mindexpander_qwen_v1:  14%|#3        | 413/3000 [27:55<2:28:58,  3.46s/it, lr: 1.0e-04 loss: 2.782e-02]mindexpander_qwen_v1:  14%|#3        | 414/3000 [27:55<2:17:13,  3.18s/it, lr: 1.0e-04 loss: 2.782e-02]mindexpander_qwen_v1:  14%|#3        | 414/3000 [27:55<2:17:13,  3.18s/it, lr: 1.0e-04 loss: 2.782e-02]mindexpander_qwen_v1:  14%|#3        | 414/3000 [28:01<2:17:13,  3.18s/it, lr: 1.0e-04 loss: 8.176e-02]mindexpander_qwen_v1:  14%|#3        | 414/3000 [28:01<2:17:13,  3.18s/it, lr: 1.0e-04 loss: 8.176e-02]mindexpander_qwen_v1:  14%|#3        | 415/3000 [28:01<2:49:55,  3.94s/it, lr: 1.0e-04 loss: 8.176e-02]mindexpander_qwen_v1:  14%|#3        | 415/3000 [28:01<2:49:55,  3.94s/it, lr: 1.0e-04 loss: 8.176e-02]mindexpander_qwen_v1:  14%|#3        | 415/3000 [28:06<2:49:55,  3.94s/it, lr: 1.0e-04 loss: 8.412e-02]mindexpander_qwen_v1:  14%|#3        | 415/3000 [28:06<2:49:55,  3.94s/it, lr: 1.0e-04 loss: 8.412e-02]mindexpander_qwen_v1:  14%|#3        | 416/3000 [28:06<3:12:11,  4.46s/it, lr: 1.0e-04 loss: 8.412e-02]mindexpander_qwen_v1:  14%|#3        | 416/3000 [28:06<3:12:11,  4.46s/it, lr: 1.0e-04 loss: 8.412e-02]mindexpander_qwen_v1:  14%|#3        | 416/3000 [28:09<3:12:11,  4.46s/it, lr: 1.0e-04 loss: 2.135e-01]mindexpander_qwen_v1:  14%|#3        | 416/3000 [28:09<3:12:11,  4.46s/it, lr: 1.0e-04 loss: 2.135e-01]mindexpander_qwen_v1:  14%|#3        | 417/3000 [28:09<2:47:05,  3.88s/it, lr: 1.0e-04 loss: 2.135e-01]mindexpander_qwen_v1:  14%|#3        | 417/3000 [28:09<2:47:05,  3.88s/it, lr: 1.0e-04 loss: 2.135e-01]mindexpander_qwen_v1:  14%|#3        | 417/3000 [28:11<2:47:05,  3.88s/it, lr: 1.0e-04 loss: 5.490e-02]mindexpander_qwen_v1:  14%|#3        | 417/3000 [28:11<2:47:05,  3.88s/it, lr: 1.0e-04 loss: 5.490e-02]mindexpander_qwen_v1:  14%|#3        | 418/3000 [28:11<2:29:14,  3.47s/it, lr: 1.0e-04 loss: 5.490e-02]mindexpander_qwen_v1:  14%|#3        | 418/3000 [28:11<2:29:14,  3.47s/it, lr: 1.0e-04 loss: 5.490e-02]mindexpander_qwen_v1:  14%|#3        | 418/3000 [28:14<2:29:14,  3.47s/it, lr: 1.0e-04 loss: 5.458e-02]mindexpander_qwen_v1:  14%|#3        | 418/3000 [28:14<2:29:14,  3.47s/it, lr: 1.0e-04 loss: 5.458e-02]mindexpander_qwen_v1:  14%|#3        | 419/3000 [28:14<2:18:43,  3.22s/it, lr: 1.0e-04 loss: 5.458e-02]mindexpander_qwen_v1:  14%|#3        | 419/3000 [28:14<2:18:43,  3.22s/it, lr: 1.0e-04 loss: 5.458e-02]mindexpander_qwen_v1:  14%|#3        | 419/3000 [28:18<2:18:43,  3.22s/it, lr: 1.0e-04 loss: 8.145e-03]mindexpander_qwen_v1:  14%|#3        | 419/3000 [28:18<2:18:43,  3.22s/it, lr: 1.0e-04 loss: 8.145e-03]mindexpander_qwen_v1:  14%|#4        | 420/3000 [28:24<2:18:40,  3.22s/it, lr: 1.0e-04 loss: 1.888e-01]mindexpander_qwen_v1:  14%|#4        | 420/3000 [28:24<2:18:40,  3.22s/it, lr: 1.0e-04 loss: 1.888e-01]mindexpander_qwen_v1:  14%|#4        | 421/3000 [28:24<2:11:50,  3.07s/it, lr: 1.0e-04 loss: 1.888e-01]mindexpander_qwen_v1:  14%|#4        | 421/3000 [28:24<2:11:50,  3.07s/it, lr: 1.0e-04 loss: 1.888e-01]mindexpander_qwen_v1:  14%|#4        | 421/3000 [28:26<2:11:50,  3.07s/it, lr: 1.0e-04 loss: 9.775e-02]mindexpander_qwen_v1:  14%|#4        | 421/3000 [28:26<2:11:50,  3.07s/it, lr: 1.0e-04 loss: 9.775e-02]mindexpander_qwen_v1:  14%|#4        | 422/3000 [28:26<2:05:19,  2.92s/it, lr: 1.0e-04 loss: 9.775e-02]mindexpander_qwen_v1:  14%|#4        | 422/3000 [28:26<2:05:19,  2.92s/it, lr: 1.0e-04 loss: 9.775e-02]mindexpander_qwen_v1:  14%|#4        | 422/3000 [28:29<2:05:19,  2.92s/it, lr: 1.0e-04 loss: 1.272e-01]mindexpander_qwen_v1:  14%|#4        | 422/3000 [28:29<2:05:19,  2.92s/it, lr: 1.0e-04 loss: 1.272e-01]mindexpander_qwen_v1:  14%|#4        | 423/3000 [28:29<2:03:01,  2.86s/it, lr: 1.0e-04 loss: 1.272e-01]mindexpander_qwen_v1:  14%|#4        | 423/3000 [28:29<2:03:01,  2.86s/it, lr: 1.0e-04 loss: 1.272e-01]mindexpander_qwen_v1:  14%|#4        | 423/3000 [28:35<2:03:01,  2.86s/it, lr: 1.0e-04 loss: 3.172e-02]mindexpander_qwen_v1:  14%|#4        | 423/3000 [28:35<2:03:01,  2.86s/it, lr: 1.0e-04 loss: 3.172e-02]mindexpander_qwen_v1:  14%|#4        | 424/3000 [28:35<2:36:36,  3.65s/it, lr: 1.0e-04 loss: 3.172e-02]mindexpander_qwen_v1:  14%|#4        | 424/3000 [28:35<2:36:36,  3.65s/it, lr: 1.0e-04 loss: 3.172e-02]mindexpander_qwen_v1:  14%|#4        | 424/3000 [28:38<2:36:36,  3.65s/it, lr: 1.0e-04 loss: 1.686e-01]mindexpander_qwen_v1:  14%|#4        | 424/3000 [28:38<2:36:36,  3.65s/it, lr: 1.0e-04 loss: 1.686e-01]mindexpander_qwen_v1:  14%|#4        | 425/3000 [28:39<2:37:39,  3.67s/it, lr: 1.0e-04 loss: 1.686e-01]mindexpander_qwen_v1:  14%|#4        | 425/3000 [28:39<2:37:39,  3.67s/it, lr: 1.0e-04 loss: 1.686e-01]mindexpander_qwen_v1:  14%|#4        | 425/3000 [28:42<2:37:39,  3.67s/it, lr: 1.0e-04 loss: 4.458e-02]mindexpander_qwen_v1:  14%|#4        | 425/3000 [28:42<2:37:39,  3.67s/it, lr: 1.0e-04 loss: 4.458e-02]mindexpander_qwen_v1:  14%|#4        | 426/3000 [28:42<2:38:23,  3.69s/it, lr: 1.0e-04 loss: 4.458e-02]mindexpander_qwen_v1:  14%|#4        | 426/3000 [28:42<2:38:23,  3.69s/it, lr: 1.0e-04 loss: 4.458e-02]mindexpander_qwen_v1:  14%|#4        | 426/3000 [28:48<2:38:23,  3.69s/it, lr: 1.0e-04 loss: 1.537e-01]mindexpander_qwen_v1:  14%|#4        | 426/3000 [28:48<2:38:23,  3.69s/it, lr: 1.0e-04 loss: 1.537e-01]mindexpander_qwen_v1:  14%|#4        | 427/3000 [28:48<3:05:28,  4.33s/it, lr: 1.0e-04 loss: 1.537e-01]mindexpander_qwen_v1:  14%|#4        | 427/3000 [28:48<3:05:28,  4.33s/it, lr: 1.0e-04 loss: 1.537e-01]mindexpander_qwen_v1:  14%|#4        | 427/3000 [28:54<3:05:28,  4.33s/it, lr: 1.0e-04 loss: 6.871e-03]mindexpander_qwen_v1:  14%|#4        | 427/3000 [28:54<3:05:28,  4.33s/it, lr: 1.0e-04 loss: 6.871e-03]mindexpander_qwen_v1:  14%|#4        | 428/3000 [28:54<3:23:40,  4.75s/it, lr: 1.0e-04 loss: 6.871e-03]mindexpander_qwen_v1:  14%|#4        | 428/3000 [28:54<3:23:40,  4.75s/it, lr: 1.0e-04 loss: 6.871e-03]mindexpander_qwen_v1:  14%|#4        | 428/3000 [28:56<3:23:40,  4.75s/it, lr: 1.0e-04 loss: 2.236e-02]mindexpander_qwen_v1:  14%|#4        | 428/3000 [28:56<3:23:40,  4.75s/it, lr: 1.0e-04 loss: 2.236e-02]mindexpander_qwen_v1:  14%|#4        | 429/3000 [28:56<2:54:37,  4.08s/it, lr: 1.0e-04 loss: 2.236e-02]mindexpander_qwen_v1:  14%|#4        | 429/3000 [28:56<2:54:37,  4.08s/it, lr: 1.0e-04 loss: 2.236e-02]mindexpander_qwen_v1:  14%|#4        | 429/3000 [29:02<2:54:37,  4.08s/it, lr: 1.0e-04 loss: 1.205e-01]mindexpander_qwen_v1:  14%|#4        | 429/3000 [29:02<2:54:37,  4.08s/it, lr: 1.0e-04 loss: 1.205e-01]mindexpander_qwen_v1:  14%|#4        | 430/3000 [29:06<2:54:33,  4.08s/it, lr: 1.0e-04 loss: 1.101e-01]mindexpander_qwen_v1:  14%|#4        | 430/3000 [29:06<2:54:33,  4.08s/it, lr: 1.0e-04 loss: 1.101e-01]mindexpander_qwen_v1:  14%|#4        | 431/3000 [29:06<2:12:56,  3.10s/it, lr: 1.0e-04 loss: 1.101e-01]mindexpander_qwen_v1:  14%|#4        | 431/3000 [29:06<2:12:56,  3.10s/it, lr: 1.0e-04 loss: 1.101e-01]mindexpander_qwen_v1:  14%|#4        | 431/3000 [29:10<2:12:56,  3.10s/it, lr: 1.0e-04 loss: 9.351e-02]mindexpander_qwen_v1:  14%|#4        | 431/3000 [29:10<2:12:56,  3.10s/it, lr: 1.0e-04 loss: 9.351e-02]mindexpander_qwen_v1:  14%|#4        | 432/3000 [29:10<2:19:37,  3.26s/it, lr: 1.0e-04 loss: 9.351e-02]mindexpander_qwen_v1:  14%|#4        | 432/3000 [29:10<2:19:37,  3.26s/it, lr: 1.0e-04 loss: 9.351e-02]mindexpander_qwen_v1:  14%|#4        | 432/3000 [29:16<2:19:37,  3.26s/it, lr: 1.0e-04 loss: 6.961e-02]mindexpander_qwen_v1:  14%|#4        | 432/3000 [29:16<2:19:37,  3.26s/it, lr: 1.0e-04 loss: 6.961e-02]mindexpander_qwen_v1:  14%|#4        | 433/3000 [29:16<2:47:23,  3.91s/it, lr: 1.0e-04 loss: 6.961e-02]mindexpander_qwen_v1:  14%|#4        | 433/3000 [29:16<2:47:23,  3.91s/it, lr: 1.0e-04 loss: 6.961e-02]mindexpander_qwen_v1:  14%|#4        | 433/3000 [29:21<2:47:23,  3.91s/it, lr: 1.0e-04 loss: 1.408e-01]mindexpander_qwen_v1:  14%|#4        | 433/3000 [29:21<2:47:23,  3.91s/it, lr: 1.0e-04 loss: 1.408e-01]mindexpander_qwen_v1:  14%|#4        | 434/3000 [29:21<3:08:44,  4.41s/it, lr: 1.0e-04 loss: 1.408e-01]mindexpander_qwen_v1:  14%|#4        | 434/3000 [29:21<3:08:44,  4.41s/it, lr: 1.0e-04 loss: 1.408e-01]mindexpander_qwen_v1:  14%|#4        | 434/3000 [29:27<3:08:44,  4.41s/it, lr: 1.0e-04 loss: 4.225e-02]mindexpander_qwen_v1:  14%|#4        | 434/3000 [29:27<3:08:44,  4.41s/it, lr: 1.0e-04 loss: 4.225e-02]mindexpander_qwen_v1:  14%|#4        | 435/3000 [29:27<3:26:10,  4.82s/it, lr: 1.0e-04 loss: 4.225e-02]mindexpander_qwen_v1:  14%|#4        | 435/3000 [29:27<3:26:10,  4.82s/it, lr: 1.0e-04 loss: 4.225e-02]mindexpander_qwen_v1:  14%|#4        | 435/3000 [29:30<3:26:10,  4.82s/it, lr: 1.0e-04 loss: 3.365e-02]mindexpander_qwen_v1:  14%|#4        | 435/3000 [29:30<3:26:10,  4.82s/it, lr: 1.0e-04 loss: 3.365e-02]mindexpander_qwen_v1:  15%|#4        | 436/3000 [29:30<2:57:14,  4.15s/it, lr: 1.0e-04 loss: 3.365e-02]mindexpander_qwen_v1:  15%|#4        | 436/3000 [29:30<2:57:14,  4.15s/it, lr: 1.0e-04 loss: 3.365e-02]mindexpander_qwen_v1:  15%|#4        | 436/3000 [29:33<2:57:14,  4.15s/it, lr: 1.0e-04 loss: 5.743e-03]mindexpander_qwen_v1:  15%|#4        | 436/3000 [29:33<2:57:14,  4.15s/it, lr: 1.0e-04 loss: 5.743e-03]mindexpander_qwen_v1:  15%|#4        | 437/3000 [29:33<2:52:04,  4.03s/it, lr: 1.0e-04 loss: 5.743e-03]mindexpander_qwen_v1:  15%|#4        | 437/3000 [29:33<2:52:04,  4.03s/it, lr: 1.0e-04 loss: 5.743e-03]mindexpander_qwen_v1:  15%|#4        | 437/3000 [29:39<2:52:04,  4.03s/it, lr: 1.0e-04 loss: 1.801e-01]mindexpander_qwen_v1:  15%|#4        | 437/3000 [29:39<2:52:04,  4.03s/it, lr: 1.0e-04 loss: 1.801e-01]mindexpander_qwen_v1:  15%|#4        | 438/3000 [29:39<3:13:36,  4.53s/it, lr: 1.0e-04 loss: 1.801e-01]mindexpander_qwen_v1:  15%|#4        | 438/3000 [29:39<3:13:36,  4.53s/it, lr: 1.0e-04 loss: 1.801e-01]mindexpander_qwen_v1:  15%|#4        | 438/3000 [29:43<3:13:36,  4.53s/it, lr: 1.0e-04 loss: 1.221e-01]mindexpander_qwen_v1:  15%|#4        | 438/3000 [29:43<3:13:36,  4.53s/it, lr: 1.0e-04 loss: 1.221e-01]mindexpander_qwen_v1:  15%|#4        | 439/3000 [29:43<3:05:50,  4.35s/it, lr: 1.0e-04 loss: 1.221e-01]mindexpander_qwen_v1:  15%|#4        | 439/3000 [29:43<3:05:50,  4.35s/it, lr: 1.0e-04 loss: 1.221e-01]mindexpander_qwen_v1:  15%|#4        | 439/3000 [29:45<3:05:50,  4.35s/it, lr: 1.0e-04 loss: 1.811e-01]mindexpander_qwen_v1:  15%|#4        | 439/3000 [29:45<3:05:50,  4.35s/it, lr: 1.0e-04 loss: 1.811e-01]mindexpander_qwen_v1:  15%|#4        | 440/3000 [29:49<3:05:46,  4.35s/it, lr: 1.0e-04 loss: 6.339e-03]mindexpander_qwen_v1:  15%|#4        | 440/3000 [29:49<3:05:46,  4.35s/it, lr: 1.0e-04 loss: 6.339e-03]mindexpander_qwen_v1:  15%|#4        | 441/3000 [29:49<2:17:08,  3.22s/it, lr: 1.0e-04 loss: 6.339e-03]mindexpander_qwen_v1:  15%|#4        | 441/3000 [29:49<2:17:08,  3.22s/it, lr: 1.0e-04 loss: 6.339e-03]mindexpander_qwen_v1:  15%|#4        | 441/3000 [29:52<2:17:08,  3.22s/it, lr: 1.0e-04 loss: 1.725e-01]mindexpander_qwen_v1:  15%|#4        | 441/3000 [29:52<2:17:08,  3.22s/it, lr: 1.0e-04 loss: 1.725e-01]mindexpander_qwen_v1:  15%|#4        | 442/3000 [29:52<2:10:56,  3.07s/it, lr: 1.0e-04 loss: 1.725e-01]mindexpander_qwen_v1:  15%|#4        | 442/3000 [29:52<2:10:56,  3.07s/it, lr: 1.0e-04 loss: 1.725e-01]mindexpander_qwen_v1:  15%|#4        | 442/3000 [29:54<2:10:56,  3.07s/it, lr: 1.0e-04 loss: 1.709e-01]mindexpander_qwen_v1:  15%|#4        | 442/3000 [29:54<2:10:56,  3.07s/it, lr: 1.0e-04 loss: 1.709e-01]mindexpander_qwen_v1:  15%|#4        | 443/3000 [29:54<2:03:57,  2.91s/it, lr: 1.0e-04 loss: 1.709e-01]mindexpander_qwen_v1:  15%|#4        | 443/3000 [29:54<2:03:57,  2.91s/it, lr: 1.0e-04 loss: 1.709e-01]mindexpander_qwen_v1:  15%|#4        | 443/3000 [29:58<2:03:57,  2.91s/it, lr: 1.0e-04 loss: 2.143e-02]mindexpander_qwen_v1:  15%|#4        | 443/3000 [29:58<2:03:57,  2.91s/it, lr: 1.0e-04 loss: 2.143e-02]mindexpander_qwen_v1:  15%|#4        | 444/3000 [29:58<2:13:30,  3.13s/it, lr: 1.0e-04 loss: 2.143e-02]mindexpander_qwen_v1:  15%|#4        | 444/3000 [29:58<2:13:30,  3.13s/it, lr: 1.0e-04 loss: 2.143e-02]mindexpander_qwen_v1:  15%|#4        | 444/3000 [30:02<2:13:30,  3.13s/it, lr: 1.0e-04 loss: 5.595e-02]mindexpander_qwen_v1:  15%|#4        | 444/3000 [30:02<2:13:30,  3.13s/it, lr: 1.0e-04 loss: 5.595e-02]mindexpander_qwen_v1:  15%|#4        | 445/3000 [30:02<2:20:39,  3.30s/it, lr: 1.0e-04 loss: 5.595e-02]mindexpander_qwen_v1:  15%|#4        | 445/3000 [30:02<2:20:39,  3.30s/it, lr: 1.0e-04 loss: 5.595e-02]mindexpander_qwen_v1:  15%|#4        | 445/3000 [30:04<2:20:39,  3.30s/it, lr: 1.0e-04 loss: 9.529e-02]mindexpander_qwen_v1:  15%|#4        | 445/3000 [30:04<2:20:39,  3.30s/it, lr: 1.0e-04 loss: 9.529e-02]mindexpander_qwen_v1:  15%|#4        | 446/3000 [30:04<2:12:40,  3.12s/it, lr: 1.0e-04 loss: 9.529e-02]mindexpander_qwen_v1:  15%|#4        | 446/3000 [30:04<2:12:40,  3.12s/it, lr: 1.0e-04 loss: 9.529e-02]mindexpander_qwen_v1:  15%|#4        | 446/3000 [30:07<2:12:40,  3.12s/it, lr: 1.0e-04 loss: 4.097e-02]mindexpander_qwen_v1:  15%|#4        | 446/3000 [30:07<2:12:40,  3.12s/it, lr: 1.0e-04 loss: 4.097e-02]mindexpander_qwen_v1:  15%|#4        | 447/3000 [30:07<2:04:20,  2.92s/it, lr: 1.0e-04 loss: 4.097e-02]mindexpander_qwen_v1:  15%|#4        | 447/3000 [30:07<2:04:20,  2.92s/it, lr: 1.0e-04 loss: 4.097e-02]mindexpander_qwen_v1:  15%|#4        | 447/3000 [30:13<2:04:20,  2.92s/it, lr: 1.0e-04 loss: 1.802e-02]mindexpander_qwen_v1:  15%|#4        | 447/3000 [30:13<2:04:20,  2.92s/it, lr: 1.0e-04 loss: 1.802e-02]mindexpander_qwen_v1:  15%|#4        | 448/3000 [30:13<2:39:29,  3.75s/it, lr: 1.0e-04 loss: 1.802e-02]mindexpander_qwen_v1:  15%|#4        | 448/3000 [30:13<2:39:29,  3.75s/it, lr: 1.0e-04 loss: 1.802e-02]mindexpander_qwen_v1:  15%|#4        | 448/3000 [30:15<2:39:29,  3.75s/it, lr: 1.0e-04 loss: 3.285e-02]mindexpander_qwen_v1:  15%|#4        | 448/3000 [30:15<2:39:29,  3.75s/it, lr: 1.0e-04 loss: 3.285e-02]mindexpander_qwen_v1:  15%|#4        | 449/3000 [30:15<2:23:07,  3.37s/it, lr: 1.0e-04 loss: 3.285e-02]mindexpander_qwen_v1:  15%|#4        | 449/3000 [30:15<2:23:07,  3.37s/it, lr: 1.0e-04 loss: 3.285e-02]mindexpander_qwen_v1:  15%|#4        | 449/3000 [30:18<2:23:07,  3.37s/it, lr: 1.0e-04 loss: 1.286e-01]mindexpander_qwen_v1:  15%|#4        | 449/3000 [30:18<2:23:07,  3.37s/it, lr: 1.0e-04 loss: 1.286e-01]mindexpander_qwen_v1:  15%|#5        | 450/3000 [30:21<2:23:04,  3.37s/it, lr: 1.0e-04 loss: 9.462e-02]mindexpander_qwen_v1:  15%|#5        | 450/3000 [30:21<2:23:04,  3.37s/it, lr: 1.0e-04 loss: 9.462e-02]mindexpander_qwen_v1:  15%|#5        | 451/3000 [30:21<1:41:28,  2.39s/it, lr: 1.0e-04 loss: 9.462e-02]mindexpander_qwen_v1:  15%|#5        | 451/3000 [30:21<1:41:28,  2.39s/it, lr: 1.0e-04 loss: 9.462e-02]mindexpander_qwen_v1:  15%|#5        | 451/3000 [30:24<1:41:28,  2.39s/it, lr: 1.0e-04 loss: 1.265e-01]mindexpander_qwen_v1:  15%|#5        | 451/3000 [30:24<1:41:28,  2.39s/it, lr: 1.0e-04 loss: 1.265e-01]mindexpander_qwen_v1:  15%|#5        | 452/3000 [30:24<1:55:34,  2.72s/it, lr: 1.0e-04 loss: 1.265e-01]mindexpander_qwen_v1:  15%|#5        | 452/3000 [30:24<1:55:34,  2.72s/it, lr: 1.0e-04 loss: 1.265e-01]mindexpander_qwen_v1:  15%|#5        | 452/3000 [30:30<1:55:34,  2.72s/it, lr: 1.0e-04 loss: 6.418e-02]mindexpander_qwen_v1:  15%|#5        | 452/3000 [30:30<1:55:34,  2.72s/it, lr: 1.0e-04 loss: 6.418e-02]mindexpander_qwen_v1:  15%|#5        | 453/3000 [30:30<2:29:10,  3.51s/it, lr: 1.0e-04 loss: 6.418e-02]mindexpander_qwen_v1:  15%|#5        | 453/3000 [30:30<2:29:10,  3.51s/it, lr: 1.0e-04 loss: 6.418e-02]mindexpander_qwen_v1:  15%|#5        | 453/3000 [30:36<2:29:10,  3.51s/it, lr: 1.0e-04 loss: 7.224e-02]mindexpander_qwen_v1:  15%|#5        | 453/3000 [30:36<2:29:10,  3.51s/it, lr: 1.0e-04 loss: 7.224e-02]mindexpander_qwen_v1:  15%|#5        | 454/3000 [30:36<2:56:10,  4.15s/it, lr: 1.0e-04 loss: 7.224e-02]mindexpander_qwen_v1:  15%|#5        | 454/3000 [30:36<2:56:10,  4.15s/it, lr: 1.0e-04 loss: 7.224e-02]mindexpander_qwen_v1:  15%|#5        | 454/3000 [30:42<2:56:10,  4.15s/it, lr: 1.0e-04 loss: 1.308e-01]mindexpander_qwen_v1:  15%|#5        | 454/3000 [30:42<2:56:10,  4.15s/it, lr: 1.0e-04 loss: 1.308e-01]mindexpander_qwen_v1:  15%|#5        | 455/3000 [30:42<3:15:06,  4.60s/it, lr: 1.0e-04 loss: 1.308e-01]mindexpander_qwen_v1:  15%|#5        | 455/3000 [30:42<3:15:06,  4.60s/it, lr: 1.0e-04 loss: 1.308e-01]mindexpander_qwen_v1:  15%|#5        | 455/3000 [30:45<3:15:06,  4.60s/it, lr: 1.0e-04 loss: 7.929e-02]mindexpander_qwen_v1:  15%|#5        | 455/3000 [30:45<3:15:06,  4.60s/it, lr: 1.0e-04 loss: 7.929e-02]mindexpander_qwen_v1:  15%|#5        | 456/3000 [30:45<3:04:37,  4.35s/it, lr: 1.0e-04 loss: 7.929e-02]mindexpander_qwen_v1:  15%|#5        | 456/3000 [30:45<3:04:37,  4.35s/it, lr: 1.0e-04 loss: 7.929e-02]mindexpander_qwen_v1:  15%|#5        | 456/3000 [30:51<3:04:37,  4.35s/it, lr: 1.0e-04 loss: 5.283e-02]mindexpander_qwen_v1:  15%|#5        | 456/3000 [30:51<3:04:37,  4.35s/it, lr: 1.0e-04 loss: 5.283e-02]mindexpander_qwen_v1:  15%|#5        | 457/3000 [30:51<3:21:47,  4.76s/it, lr: 1.0e-04 loss: 5.283e-02]mindexpander_qwen_v1:  15%|#5        | 457/3000 [30:51<3:21:47,  4.76s/it, lr: 1.0e-04 loss: 5.283e-02]mindexpander_qwen_v1:  15%|#5        | 457/3000 [30:57<3:21:47,  4.76s/it, lr: 1.0e-04 loss: 1.740e-01]mindexpander_qwen_v1:  15%|#5        | 457/3000 [30:57<3:21:47,  4.76s/it, lr: 1.0e-04 loss: 1.740e-01]mindexpander_qwen_v1:  15%|#5        | 458/3000 [30:57<3:35:37,  5.09s/it, lr: 1.0e-04 loss: 1.740e-01]mindexpander_qwen_v1:  15%|#5        | 458/3000 [30:57<3:35:37,  5.09s/it, lr: 1.0e-04 loss: 1.740e-01]mindexpander_qwen_v1:  15%|#5        | 458/3000 [30:59<3:35:37,  5.09s/it, lr: 1.0e-04 loss: 1.360e-01]mindexpander_qwen_v1:  15%|#5        | 458/3000 [30:59<3:35:37,  5.09s/it, lr: 1.0e-04 loss: 1.360e-01]mindexpander_qwen_v1:  15%|#5        | 459/3000 [30:59<3:02:33,  4.31s/it, lr: 1.0e-04 loss: 1.360e-01]mindexpander_qwen_v1:  15%|#5        | 459/3000 [30:59<3:02:33,  4.31s/it, lr: 1.0e-04 loss: 1.360e-01]mindexpander_qwen_v1:  15%|#5        | 459/3000 [31:03<3:02:33,  4.31s/it, lr: 1.0e-04 loss: 1.554e-02]mindexpander_qwen_v1:  15%|#5        | 459/3000 [31:03<3:02:33,  4.31s/it, lr: 1.0e-04 loss: 1.554e-02]mindexpander_qwen_v1:  15%|#5        | 460/3000 [31:09<3:02:29,  4.31s/it, lr: 1.0e-04 loss: 1.185e-01]mindexpander_qwen_v1:  15%|#5        | 460/3000 [31:09<3:02:29,  4.31s/it, lr: 1.0e-04 loss: 1.185e-01]mindexpander_qwen_v1:  15%|#5        | 461/3000 [31:09<2:34:42,  3.66s/it, lr: 1.0e-04 loss: 1.185e-01]mindexpander_qwen_v1:  15%|#5        | 461/3000 [31:09<2:34:42,  3.66s/it, lr: 1.0e-04 loss: 1.185e-01]mindexpander_qwen_v1:  15%|#5        | 461/3000 [31:15<2:34:42,  3.66s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:  15%|#5        | 461/3000 [31:15<2:34:42,  3.66s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:  15%|#5        | 462/3000 [31:15<2:57:47,  4.20s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:  15%|#5        | 462/3000 [31:15<2:57:47,  4.20s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:  15%|#5        | 462/3000 [31:19<2:57:47,  4.20s/it, lr: 1.0e-04 loss: 1.372e-01]mindexpander_qwen_v1:  15%|#5        | 462/3000 [31:19<2:57:47,  4.20s/it, lr: 1.0e-04 loss: 1.372e-01]mindexpander_qwen_v1:  15%|#5        | 463/3000 [31:19<2:52:37,  4.08s/it, lr: 1.0e-04 loss: 1.372e-01]mindexpander_qwen_v1:  15%|#5        | 463/3000 [31:19<2:52:37,  4.08s/it, lr: 1.0e-04 loss: 1.372e-01]mindexpander_qwen_v1:  15%|#5        | 463/3000 [31:22<2:52:37,  4.08s/it, lr: 1.0e-04 loss: 6.244e-02]mindexpander_qwen_v1:  15%|#5        | 463/3000 [31:22<2:52:37,  4.08s/it, lr: 1.0e-04 loss: 6.244e-02]mindexpander_qwen_v1:  15%|#5        | 464/3000 [31:22<2:48:36,  3.99s/it, lr: 1.0e-04 loss: 6.244e-02]mindexpander_qwen_v1:  15%|#5        | 464/3000 [31:22<2:48:36,  3.99s/it, lr: 1.0e-04 loss: 6.244e-02]mindexpander_qwen_v1:  15%|#5        | 464/3000 [31:28<2:48:36,  3.99s/it, lr: 1.0e-04 loss: 7.557e-02]mindexpander_qwen_v1:  15%|#5        | 464/3000 [31:28<2:48:36,  3.99s/it, lr: 1.0e-04 loss: 7.557e-02]mindexpander_qwen_v1:  16%|#5        | 465/3000 [31:28<3:09:21,  4.48s/it, lr: 1.0e-04 loss: 7.557e-02]mindexpander_qwen_v1:  16%|#5        | 465/3000 [31:28<3:09:21,  4.48s/it, lr: 1.0e-04 loss: 7.557e-02]mindexpander_qwen_v1:  16%|#5        | 465/3000 [31:31<3:09:21,  4.48s/it, lr: 1.0e-04 loss: 1.094e-01]mindexpander_qwen_v1:  16%|#5        | 465/3000 [31:31<3:09:21,  4.48s/it, lr: 1.0e-04 loss: 1.094e-01]mindexpander_qwen_v1:  16%|#5        | 466/3000 [31:31<2:47:20,  3.96s/it, lr: 1.0e-04 loss: 1.094e-01]mindexpander_qwen_v1:  16%|#5        | 466/3000 [31:31<2:47:20,  3.96s/it, lr: 1.0e-04 loss: 1.094e-01]mindexpander_qwen_v1:  16%|#5        | 466/3000 [31:33<2:47:20,  3.96s/it, lr: 1.0e-04 loss: 6.000e-02]mindexpander_qwen_v1:  16%|#5        | 466/3000 [31:33<2:47:20,  3.96s/it, lr: 1.0e-04 loss: 6.000e-02]mindexpander_qwen_v1:  16%|#5        | 467/3000 [31:33<2:29:02,  3.53s/it, lr: 1.0e-04 loss: 6.000e-02]mindexpander_qwen_v1:  16%|#5        | 467/3000 [31:33<2:29:02,  3.53s/it, lr: 1.0e-04 loss: 6.000e-02]mindexpander_qwen_v1:  16%|#5        | 467/3000 [31:36<2:29:02,  3.53s/it, lr: 1.0e-04 loss: 1.059e-01]mindexpander_qwen_v1:  16%|#5        | 467/3000 [31:36<2:29:02,  3.53s/it, lr: 1.0e-04 loss: 1.059e-01]mindexpander_qwen_v1:  16%|#5        | 468/3000 [31:36<2:15:34,  3.21s/it, lr: 1.0e-04 loss: 1.059e-01]mindexpander_qwen_v1:  16%|#5        | 468/3000 [31:36<2:15:34,  3.21s/it, lr: 1.0e-04 loss: 1.059e-01]mindexpander_qwen_v1:  16%|#5        | 468/3000 [31:41<2:15:34,  3.21s/it, lr: 1.0e-04 loss: 6.345e-02]mindexpander_qwen_v1:  16%|#5        | 468/3000 [31:41<2:15:34,  3.21s/it, lr: 1.0e-04 loss: 6.345e-02]mindexpander_qwen_v1:  16%|#5        | 469/3000 [31:41<2:47:03,  3.96s/it, lr: 1.0e-04 loss: 6.345e-02]mindexpander_qwen_v1:  16%|#5        | 469/3000 [31:41<2:47:03,  3.96s/it, lr: 1.0e-04 loss: 6.345e-02]mindexpander_qwen_v1:  16%|#5        | 469/3000 [31:44<2:47:03,  3.96s/it, lr: 1.0e-04 loss: 1.020e-01]mindexpander_qwen_v1:  16%|#5        | 469/3000 [31:44<2:47:03,  3.96s/it, lr: 1.0e-04 loss: 1.020e-01]mindexpander_qwen_v1:  16%|#5        | 470/3000 [31:50<2:46:59,  3.96s/it, lr: 1.0e-04 loss: 8.665e-03]mindexpander_qwen_v1:  16%|#5        | 470/3000 [31:50<2:46:59,  3.96s/it, lr: 1.0e-04 loss: 8.665e-03]mindexpander_qwen_v1:  16%|#5        | 471/3000 [31:50<2:26:00,  3.46s/it, lr: 1.0e-04 loss: 8.665e-03]mindexpander_qwen_v1:  16%|#5        | 471/3000 [31:50<2:26:00,  3.46s/it, lr: 1.0e-04 loss: 8.665e-03]mindexpander_qwen_v1:  16%|#5        | 471/3000 [31:54<2:26:00,  3.46s/it, lr: 1.0e-04 loss: 1.933e-01]mindexpander_qwen_v1:  16%|#5        | 471/3000 [31:54<2:26:00,  3.46s/it, lr: 1.0e-04 loss: 1.933e-01]mindexpander_qwen_v1:  16%|#5        | 472/3000 [31:54<2:28:45,  3.53s/it, lr: 1.0e-04 loss: 1.933e-01]mindexpander_qwen_v1:  16%|#5        | 472/3000 [31:54<2:28:45,  3.53s/it, lr: 1.0e-04 loss: 1.933e-01]mindexpander_qwen_v1:  16%|#5        | 472/3000 [31:56<2:28:45,  3.53s/it, lr: 1.0e-04 loss: 3.349e-02]mindexpander_qwen_v1:  16%|#5        | 472/3000 [31:56<2:28:45,  3.53s/it, lr: 1.0e-04 loss: 3.349e-02]mindexpander_qwen_v1:  16%|#5        | 473/3000 [31:56<2:16:53,  3.25s/it, lr: 1.0e-04 loss: 3.349e-02]mindexpander_qwen_v1:  16%|#5        | 473/3000 [31:56<2:16:53,  3.25s/it, lr: 1.0e-04 loss: 3.349e-02]mindexpander_qwen_v1:  16%|#5        | 473/3000 [32:00<2:16:53,  3.25s/it, lr: 1.0e-04 loss: 1.625e-01]mindexpander_qwen_v1:  16%|#5        | 473/3000 [32:00<2:16:53,  3.25s/it, lr: 1.0e-04 loss: 1.625e-01]mindexpander_qwen_v1:  16%|#5        | 474/3000 [32:00<2:24:06,  3.42s/it, lr: 1.0e-04 loss: 1.625e-01]mindexpander_qwen_v1:  16%|#5        | 474/3000 [32:00<2:24:06,  3.42s/it, lr: 1.0e-04 loss: 1.625e-01]mindexpander_qwen_v1:  16%|#5        | 474/3000 [32:04<2:24:06,  3.42s/it, lr: 1.0e-04 loss: 7.483e-02]mindexpander_qwen_v1:  16%|#5        | 474/3000 [32:04<2:24:06,  3.42s/it, lr: 1.0e-04 loss: 7.483e-02]mindexpander_qwen_v1:  16%|#5        | 475/3000 [32:04<2:27:56,  3.52s/it, lr: 1.0e-04 loss: 7.483e-02]mindexpander_qwen_v1:  16%|#5        | 475/3000 [32:04<2:27:56,  3.52s/it, lr: 1.0e-04 loss: 7.483e-02]mindexpander_qwen_v1:  16%|#5        | 475/3000 [32:06<2:27:56,  3.52s/it, lr: 1.0e-04 loss: 8.399e-04]mindexpander_qwen_v1:  16%|#5        | 475/3000 [32:06<2:27:56,  3.52s/it, lr: 1.0e-04 loss: 8.399e-04]mindexpander_qwen_v1:  16%|#5        | 476/3000 [32:06<2:15:05,  3.21s/it, lr: 1.0e-04 loss: 8.399e-04]mindexpander_qwen_v1:  16%|#5        | 476/3000 [32:06<2:15:05,  3.21s/it, lr: 1.0e-04 loss: 8.399e-04]mindexpander_qwen_v1:  16%|#5        | 476/3000 [32:09<2:15:05,  3.21s/it, lr: 1.0e-04 loss: 1.819e-01]mindexpander_qwen_v1:  16%|#5        | 476/3000 [32:09<2:15:05,  3.21s/it, lr: 1.0e-04 loss: 1.819e-01]mindexpander_qwen_v1:  16%|#5        | 477/3000 [32:09<2:05:38,  2.99s/it, lr: 1.0e-04 loss: 1.819e-01]mindexpander_qwen_v1:  16%|#5        | 477/3000 [32:09<2:05:38,  2.99s/it, lr: 1.0e-04 loss: 1.819e-01]mindexpander_qwen_v1:  16%|#5        | 477/3000 [32:12<2:05:38,  2.99s/it, lr: 1.0e-04 loss: 9.819e-02]mindexpander_qwen_v1:  16%|#5        | 477/3000 [32:12<2:05:38,  2.99s/it, lr: 1.0e-04 loss: 9.819e-02]mindexpander_qwen_v1:  16%|#5        | 478/3000 [32:12<2:16:53,  3.26s/it, lr: 1.0e-04 loss: 9.819e-02]mindexpander_qwen_v1:  16%|#5        | 478/3000 [32:12<2:16:53,  3.26s/it, lr: 1.0e-04 loss: 9.819e-02]mindexpander_qwen_v1:  16%|#5        | 478/3000 [32:16<2:16:53,  3.26s/it, lr: 1.0e-04 loss: 3.891e-02]mindexpander_qwen_v1:  16%|#5        | 478/3000 [32:16<2:16:53,  3.26s/it, lr: 1.0e-04 loss: 3.891e-02]mindexpander_qwen_v1:  16%|#5        | 479/3000 [32:16<2:22:56,  3.40s/it, lr: 1.0e-04 loss: 3.891e-02]mindexpander_qwen_v1:  16%|#5        | 479/3000 [32:16<2:22:56,  3.40s/it, lr: 1.0e-04 loss: 3.891e-02]mindexpander_qwen_v1:  16%|#5        | 479/3000 [32:22<2:22:56,  3.40s/it, lr: 1.0e-04 loss: 6.027e-02]mindexpander_qwen_v1:  16%|#5        | 479/3000 [32:22<2:22:56,  3.40s/it, lr: 1.0e-04 loss: 6.027e-02]mindexpander_qwen_v1:  16%|#6        | 480/3000 [32:25<2:22:53,  3.40s/it, lr: 1.0e-04 loss: 3.975e-02]mindexpander_qwen_v1:  16%|#6        | 480/3000 [32:25<2:22:53,  3.40s/it, lr: 1.0e-04 loss: 3.975e-02]mindexpander_qwen_v1:  16%|#6        | 481/3000 [32:25<1:41:09,  2.41s/it, lr: 1.0e-04 loss: 3.975e-02]mindexpander_qwen_v1:  16%|#6        | 481/3000 [32:25<1:41:09,  2.41s/it, lr: 1.0e-04 loss: 3.975e-02]mindexpander_qwen_v1:  16%|#6        | 481/3000 [32:29<1:41:09,  2.41s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  16%|#6        | 481/3000 [32:29<1:41:09,  2.41s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  16%|#6        | 482/3000 [32:29<1:57:20,  2.80s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  16%|#6        | 482/3000 [32:29<1:57:20,  2.80s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  16%|#6        | 482/3000 [32:34<1:57:20,  2.80s/it, lr: 1.0e-04 loss: 2.588e-02]mindexpander_qwen_v1:  16%|#6        | 482/3000 [32:34<1:57:20,  2.80s/it, lr: 1.0e-04 loss: 2.588e-02]mindexpander_qwen_v1:  16%|#6        | 483/3000 [32:34<2:29:29,  3.56s/it, lr: 1.0e-04 loss: 2.588e-02]mindexpander_qwen_v1:  16%|#6        | 483/3000 [32:34<2:29:29,  3.56s/it, lr: 1.0e-04 loss: 2.588e-02]mindexpander_qwen_v1:  16%|#6        | 483/3000 [32:37<2:29:29,  3.56s/it, lr: 1.0e-04 loss: 1.325e-01]mindexpander_qwen_v1:  16%|#6        | 483/3000 [32:37<2:29:29,  3.56s/it, lr: 1.0e-04 loss: 1.325e-01]mindexpander_qwen_v1:  16%|#6        | 484/3000 [32:37<2:16:41,  3.26s/it, lr: 1.0e-04 loss: 1.325e-01]mindexpander_qwen_v1:  16%|#6        | 484/3000 [32:37<2:16:41,  3.26s/it, lr: 1.0e-04 loss: 1.325e-01]mindexpander_qwen_v1:  16%|#6        | 484/3000 [32:43<2:16:41,  3.26s/it, lr: 1.0e-04 loss: 1.723e-01]mindexpander_qwen_v1:  16%|#6        | 484/3000 [32:43<2:16:41,  3.26s/it, lr: 1.0e-04 loss: 1.723e-01]mindexpander_qwen_v1:  16%|#6        | 485/3000 [32:43<2:47:42,  4.00s/it, lr: 1.0e-04 loss: 1.723e-01]mindexpander_qwen_v1:  16%|#6        | 485/3000 [32:43<2:47:42,  4.00s/it, lr: 1.0e-04 loss: 1.723e-01]mindexpander_qwen_v1:  16%|#6        | 485/3000 [32:47<2:47:42,  4.00s/it, lr: 1.0e-04 loss: 9.548e-02]mindexpander_qwen_v1:  16%|#6        | 485/3000 [32:47<2:47:42,  4.00s/it, lr: 1.0e-04 loss: 9.548e-02]mindexpander_qwen_v1:  16%|#6        | 486/3000 [32:47<2:44:38,  3.93s/it, lr: 1.0e-04 loss: 9.548e-02]mindexpander_qwen_v1:  16%|#6        | 486/3000 [32:47<2:44:38,  3.93s/it, lr: 1.0e-04 loss: 9.548e-02]mindexpander_qwen_v1:  16%|#6        | 486/3000 [32:49<2:44:38,  3.93s/it, lr: 1.0e-04 loss: 1.624e-02]mindexpander_qwen_v1:  16%|#6        | 486/3000 [32:49<2:44:38,  3.93s/it, lr: 1.0e-04 loss: 1.624e-02]mindexpander_qwen_v1:  16%|#6        | 487/3000 [32:49<2:26:49,  3.51s/it, lr: 1.0e-04 loss: 1.624e-02]mindexpander_qwen_v1:  16%|#6        | 487/3000 [32:49<2:26:49,  3.51s/it, lr: 1.0e-04 loss: 1.624e-02]mindexpander_qwen_v1:  16%|#6        | 487/3000 [32:53<2:26:49,  3.51s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:  16%|#6        | 487/3000 [32:53<2:26:49,  3.51s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:  16%|#6        | 488/3000 [32:53<2:29:42,  3.58s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:  16%|#6        | 488/3000 [32:53<2:29:42,  3.58s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:  16%|#6        | 488/3000 [32:56<2:29:42,  3.58s/it, lr: 1.0e-04 loss: 3.810e-02]mindexpander_qwen_v1:  16%|#6        | 488/3000 [32:56<2:29:42,  3.58s/it, lr: 1.0e-04 loss: 3.810e-02]mindexpander_qwen_v1:  16%|#6        | 489/3000 [32:56<2:31:43,  3.63s/it, lr: 1.0e-04 loss: 3.810e-02]mindexpander_qwen_v1:  16%|#6        | 489/3000 [32:56<2:31:43,  3.63s/it, lr: 1.0e-04 loss: 3.810e-02]mindexpander_qwen_v1:  16%|#6        | 489/3000 [33:02<2:31:43,  3.63s/it, lr: 1.0e-04 loss: 1.358e-03]mindexpander_qwen_v1:  16%|#6        | 489/3000 [33:02<2:31:43,  3.63s/it, lr: 1.0e-04 loss: 1.358e-03]mindexpander_qwen_v1:  16%|#6        | 490/3000 [33:08<2:31:40,  3.63s/it, lr: 1.0e-04 loss: 1.069e-01]mindexpander_qwen_v1:  16%|#6        | 490/3000 [33:08<2:31:40,  3.63s/it, lr: 1.0e-04 loss: 1.069e-01]mindexpander_qwen_v1:  16%|#6        | 491/3000 [33:08<2:17:19,  3.28s/it, lr: 1.0e-04 loss: 1.069e-01]mindexpander_qwen_v1:  16%|#6        | 491/3000 [33:08<2:17:19,  3.28s/it, lr: 1.0e-04 loss: 1.069e-01]mindexpander_qwen_v1:  16%|#6        | 491/3000 [33:12<2:17:19,  3.28s/it, lr: 1.0e-04 loss: 1.195e-01]mindexpander_qwen_v1:  16%|#6        | 491/3000 [33:12<2:17:19,  3.28s/it, lr: 1.0e-04 loss: 1.195e-01]mindexpander_qwen_v1:  16%|#6        | 492/3000 [33:12<2:21:59,  3.40s/it, lr: 1.0e-04 loss: 1.195e-01]mindexpander_qwen_v1:  16%|#6        | 492/3000 [33:12<2:21:59,  3.40s/it, lr: 1.0e-04 loss: 1.195e-01]mindexpander_qwen_v1:  16%|#6        | 492/3000 [33:15<2:21:59,  3.40s/it, lr: 1.0e-04 loss: 2.097e-01]mindexpander_qwen_v1:  16%|#6        | 492/3000 [33:15<2:21:59,  3.40s/it, lr: 1.0e-04 loss: 2.097e-01]mindexpander_qwen_v1:  16%|#6        | 493/3000 [33:15<2:13:43,  3.20s/it, lr: 1.0e-04 loss: 2.097e-01]mindexpander_qwen_v1:  16%|#6        | 493/3000 [33:15<2:13:43,  3.20s/it, lr: 1.0e-04 loss: 2.097e-01]mindexpander_qwen_v1:  16%|#6        | 493/3000 [33:18<2:13:43,  3.20s/it, lr: 1.0e-04 loss: 1.530e-01]mindexpander_qwen_v1:  16%|#6        | 493/3000 [33:18<2:13:43,  3.20s/it, lr: 1.0e-04 loss: 1.530e-01]mindexpander_qwen_v1:  16%|#6        | 494/3000 [33:18<2:19:50,  3.35s/it, lr: 1.0e-04 loss: 1.530e-01]mindexpander_qwen_v1:  16%|#6        | 494/3000 [33:18<2:19:50,  3.35s/it, lr: 1.0e-04 loss: 1.530e-01]mindexpander_qwen_v1:  16%|#6        | 494/3000 [33:22<2:19:50,  3.35s/it, lr: 1.0e-04 loss: 1.644e-01]mindexpander_qwen_v1:  16%|#6        | 494/3000 [33:22<2:19:50,  3.35s/it, lr: 1.0e-04 loss: 1.644e-01]mindexpander_qwen_v1:  16%|#6        | 495/3000 [33:22<2:24:22,  3.46s/it, lr: 1.0e-04 loss: 1.644e-01]mindexpander_qwen_v1:  16%|#6        | 495/3000 [33:22<2:24:22,  3.46s/it, lr: 1.0e-04 loss: 1.644e-01]mindexpander_qwen_v1:  16%|#6        | 495/3000 [33:24<2:24:22,  3.46s/it, lr: 1.0e-04 loss: 1.683e-01]mindexpander_qwen_v1:  16%|#6        | 495/3000 [33:24<2:24:22,  3.46s/it, lr: 1.0e-04 loss: 1.683e-01]mindexpander_qwen_v1:  17%|#6        | 496/3000 [33:24<2:12:47,  3.18s/it, lr: 1.0e-04 loss: 1.683e-01]mindexpander_qwen_v1:  17%|#6        | 496/3000 [33:24<2:12:47,  3.18s/it, lr: 1.0e-04 loss: 1.683e-01]mindexpander_qwen_v1:  17%|#6        | 496/3000 [33:28<2:12:47,  3.18s/it, lr: 1.0e-04 loss: 1.794e-01]mindexpander_qwen_v1:  17%|#6        | 496/3000 [33:28<2:12:47,  3.18s/it, lr: 1.0e-04 loss: 1.794e-01]mindexpander_qwen_v1:  17%|#6        | 497/3000 [33:28<2:21:39,  3.40s/it, lr: 1.0e-04 loss: 1.794e-01]mindexpander_qwen_v1:  17%|#6        | 497/3000 [33:28<2:21:39,  3.40s/it, lr: 1.0e-04 loss: 1.794e-01]mindexpander_qwen_v1:  17%|#6        | 497/3000 [33:34<2:21:39,  3.40s/it, lr: 1.0e-04 loss: 2.109e-02]mindexpander_qwen_v1:  17%|#6        | 497/3000 [33:34<2:21:39,  3.40s/it, lr: 1.0e-04 loss: 2.109e-02]mindexpander_qwen_v1:  17%|#6        | 498/3000 [33:34<2:50:37,  4.09s/it, lr: 1.0e-04 loss: 2.109e-02]mindexpander_qwen_v1:  17%|#6        | 498/3000 [33:34<2:50:37,  4.09s/it, lr: 1.0e-04 loss: 2.109e-02]mindexpander_qwen_v1:  17%|#6        | 498/3000 [33:40<2:50:37,  4.09s/it, lr: 1.0e-04 loss: 1.012e-02]mindexpander_qwen_v1:  17%|#6        | 498/3000 [33:40<2:50:37,  4.09s/it, lr: 1.0e-04 loss: 1.012e-02]mindexpander_qwen_v1:  17%|#6        | 499/3000 [33:40<3:11:01,  4.58s/it, lr: 1.0e-04 loss: 1.012e-02]mindexpander_qwen_v1:  17%|#6        | 499/3000 [33:40<3:11:01,  4.58s/it, lr: 1.0e-04 loss: 1.012e-02]mindexpander_qwen_v1:  17%|#6        | 499/3000 [33:42<3:11:01,  4.58s/it, lr: 1.0e-04 loss: 1.638e-01]mindexpander_qwen_v1:  17%|#6        | 499/3000 [33:42<3:11:01,  4.58s/it, lr: 1.0e-04 loss: 1.638e-01]
+Saving at step 500
+Saved checkpoint to /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000000500.safetensors
+Saved optimizer to /app/ai-toolkit/output/mindexpander_qwen_v1/optimizer.pt
+
+
+Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:   0%|          | 0/2 [00:00<?, ?it/s][A[A
+
+Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.85s/it]Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.85s/it][A[A
+
+Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.86s/it]Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.86s/it][A[A
+
+                                                                                                                                [A[Amindexpander_qwen_v1:  17%|#6        | 500/3000 [33:45<3:10:56,  4.58s/it, lr: 1.0e-04 loss: 1.547e-01]mindexpander_qwen_v1:  17%|#6        | 500/3000 [33:45<3:10:56,  4.58s/it, lr: 1.0e-04 loss: 1.547e-01]mindexpander_qwen_v1:  17%|#6        | 501/3000 [33:45<2:08:48,  3.09s/it, lr: 1.0e-04 loss: 1.547e-01]mindexpander_qwen_v1:  17%|#6        | 501/3000 [33:45<2:08:48,  3.09s/it, lr: 1.0e-04 loss: 1.547e-01]mindexpander_qwen_v1:  17%|#6        | 501/3000 [33:51<2:08:48,  3.09s/it, lr: 1.0e-04 loss: 1.787e-01]mindexpander_qwen_v1:  17%|#6        | 501/3000 [33:51<2:08:48,  3.09s/it, lr: 1.0e-04 loss: 1.787e-01]mindexpander_qwen_v1:  17%|#6        | 502/3000 [33:51<2:36:05,  3.75s/it, lr: 1.0e-04 loss: 1.787e-01]mindexpander_qwen_v1:  17%|#6        | 502/3000 [33:51<2:36:05,  3.75s/it, lr: 1.0e-04 loss: 1.787e-01]mindexpander_qwen_v1:  17%|#6        | 502/3000 [33:55<2:36:05,  3.75s/it, lr: 1.0e-04 loss: 1.754e-01]mindexpander_qwen_v1:  17%|#6        | 502/3000 [33:55<2:36:05,  3.75s/it, lr: 1.0e-04 loss: 1.754e-01]mindexpander_qwen_v1:  17%|#6        | 503/3000 [33:55<2:35:59,  3.75s/it, lr: 1.0e-04 loss: 1.754e-01]mindexpander_qwen_v1:  17%|#6        | 503/3000 [33:55<2:35:59,  3.75s/it, lr: 1.0e-04 loss: 1.754e-01]mindexpander_qwen_v1:  17%|#6        | 503/3000 [34:00<2:35:59,  3.75s/it, lr: 1.0e-04 loss: 9.686e-02]mindexpander_qwen_v1:  17%|#6        | 503/3000 [34:00<2:35:59,  3.75s/it, lr: 1.0e-04 loss: 9.686e-02]mindexpander_qwen_v1:  17%|#6        | 504/3000 [34:00<3:00:11,  4.33s/it, lr: 1.0e-04 loss: 9.686e-02]mindexpander_qwen_v1:  17%|#6        | 504/3000 [34:00<3:00:11,  4.33s/it, lr: 1.0e-04 loss: 9.686e-02]mindexpander_qwen_v1:  17%|#6        | 504/3000 [34:03<3:00:11,  4.33s/it, lr: 1.0e-04 loss: 1.463e-01]mindexpander_qwen_v1:  17%|#6        | 504/3000 [34:03<3:00:11,  4.33s/it, lr: 1.0e-04 loss: 1.463e-01]mindexpander_qwen_v1:  17%|#6        | 505/3000 [34:03<2:38:15,  3.81s/it, lr: 1.0e-04 loss: 1.463e-01]mindexpander_qwen_v1:  17%|#6        | 505/3000 [34:03<2:38:15,  3.81s/it, lr: 1.0e-04 loss: 1.463e-01]mindexpander_qwen_v1:  17%|#6        | 505/3000 [34:05<2:38:15,  3.81s/it, lr: 1.0e-04 loss: 1.199e-01]mindexpander_qwen_v1:  17%|#6        | 505/3000 [34:05<2:38:15,  3.81s/it, lr: 1.0e-04 loss: 1.199e-01]mindexpander_qwen_v1:  17%|#6        | 506/3000 [34:05<2:22:06,  3.42s/it, lr: 1.0e-04 loss: 1.199e-01]mindexpander_qwen_v1:  17%|#6        | 506/3000 [34:05<2:22:06,  3.42s/it, lr: 1.0e-04 loss: 1.199e-01]mindexpander_qwen_v1:  17%|#6        | 506/3000 [34:09<2:22:06,  3.42s/it, lr: 1.0e-04 loss: 1.012e-01]mindexpander_qwen_v1:  17%|#6        | 506/3000 [34:09<2:22:06,  3.42s/it, lr: 1.0e-04 loss: 1.012e-01]mindexpander_qwen_v1:  17%|#6        | 507/3000 [34:09<2:25:55,  3.51s/it, lr: 1.0e-04 loss: 1.012e-01]mindexpander_qwen_v1:  17%|#6        | 507/3000 [34:09<2:25:55,  3.51s/it, lr: 1.0e-04 loss: 1.012e-01]mindexpander_qwen_v1:  17%|#6        | 507/3000 [34:12<2:25:55,  3.51s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  17%|#6        | 507/3000 [34:12<2:25:55,  3.51s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  17%|#6        | 508/3000 [34:12<2:15:22,  3.26s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  17%|#6        | 508/3000 [34:12<2:15:22,  3.26s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  17%|#6        | 508/3000 [34:18<2:15:22,  3.26s/it, lr: 1.0e-04 loss: 2.729e-02]mindexpander_qwen_v1:  17%|#6        | 508/3000 [34:18<2:15:22,  3.26s/it, lr: 1.0e-04 loss: 2.729e-02]mindexpander_qwen_v1:  17%|#6        | 509/3000 [34:18<2:45:53,  4.00s/it, lr: 1.0e-04 loss: 2.729e-02]mindexpander_qwen_v1:  17%|#6        | 509/3000 [34:18<2:45:53,  4.00s/it, lr: 1.0e-04 loss: 2.729e-02]mindexpander_qwen_v1:  17%|#6        | 509/3000 [34:22<2:45:53,  4.00s/it, lr: 1.0e-04 loss: 1.753e-01]mindexpander_qwen_v1:  17%|#6        | 509/3000 [34:22<2:45:53,  4.00s/it, lr: 1.0e-04 loss: 1.753e-01]mindexpander_qwen_v1:  17%|#7        | 510/3000 [34:24<2:45:49,  4.00s/it, lr: 1.0e-04 loss: 8.596e-02]mindexpander_qwen_v1:  17%|#7        | 510/3000 [34:24<2:45:49,  4.00s/it, lr: 1.0e-04 loss: 8.596e-02]mindexpander_qwen_v1:  17%|#7        | 511/3000 [34:24<1:53:15,  2.73s/it, lr: 1.0e-04 loss: 8.596e-02]mindexpander_qwen_v1:  17%|#7        | 511/3000 [34:24<1:53:15,  2.73s/it, lr: 1.0e-04 loss: 8.596e-02]mindexpander_qwen_v1:  17%|#7        | 511/3000 [34:30<1:53:15,  2.73s/it, lr: 1.0e-04 loss: 1.862e-01]mindexpander_qwen_v1:  17%|#7        | 511/3000 [34:30<1:53:15,  2.73s/it, lr: 1.0e-04 loss: 1.862e-01]mindexpander_qwen_v1:  17%|#7        | 512/3000 [34:30<2:26:18,  3.53s/it, lr: 1.0e-04 loss: 1.862e-01]mindexpander_qwen_v1:  17%|#7        | 512/3000 [34:30<2:26:18,  3.53s/it, lr: 1.0e-04 loss: 1.862e-01]mindexpander_qwen_v1:  17%|#7        | 512/3000 [34:36<2:26:18,  3.53s/it, lr: 1.0e-04 loss: 2.361e-02]mindexpander_qwen_v1:  17%|#7        | 512/3000 [34:36<2:26:18,  3.53s/it, lr: 1.0e-04 loss: 2.361e-02]mindexpander_qwen_v1:  17%|#7        | 513/3000 [34:36<2:50:15,  4.11s/it, lr: 1.0e-04 loss: 2.361e-02]mindexpander_qwen_v1:  17%|#7        | 513/3000 [34:36<2:50:15,  4.11s/it, lr: 1.0e-04 loss: 2.361e-02]mindexpander_qwen_v1:  17%|#7        | 513/3000 [34:42<2:50:15,  4.11s/it, lr: 1.0e-04 loss: 6.731e-02]mindexpander_qwen_v1:  17%|#7        | 513/3000 [34:42<2:50:15,  4.11s/it, lr: 1.0e-04 loss: 6.731e-02]mindexpander_qwen_v1:  17%|#7        | 514/3000 [34:42<3:08:43,  4.56s/it, lr: 1.0e-04 loss: 6.731e-02]mindexpander_qwen_v1:  17%|#7        | 514/3000 [34:42<3:08:43,  4.56s/it, lr: 1.0e-04 loss: 6.731e-02]mindexpander_qwen_v1:  17%|#7        | 514/3000 [34:44<3:08:43,  4.56s/it, lr: 1.0e-04 loss: 1.868e-01]mindexpander_qwen_v1:  17%|#7        | 514/3000 [34:44<3:08:43,  4.56s/it, lr: 1.0e-04 loss: 1.868e-01]mindexpander_qwen_v1:  17%|#7        | 515/3000 [34:44<2:44:19,  3.97s/it, lr: 1.0e-04 loss: 1.868e-01]mindexpander_qwen_v1:  17%|#7        | 515/3000 [34:44<2:44:19,  3.97s/it, lr: 1.0e-04 loss: 1.868e-01]mindexpander_qwen_v1:  17%|#7        | 515/3000 [34:50<2:44:19,  3.97s/it, lr: 1.0e-04 loss: 1.650e-02]mindexpander_qwen_v1:  17%|#7        | 515/3000 [34:50<2:44:19,  3.97s/it, lr: 1.0e-04 loss: 1.650e-02]mindexpander_qwen_v1:  17%|#7        | 516/3000 [34:50<3:07:00,  4.52s/it, lr: 1.0e-04 loss: 1.650e-02]mindexpander_qwen_v1:  17%|#7        | 516/3000 [34:50<3:07:00,  4.52s/it, lr: 1.0e-04 loss: 1.650e-02]mindexpander_qwen_v1:  17%|#7        | 516/3000 [34:56<3:07:00,  4.52s/it, lr: 1.0e-04 loss: 1.516e-01]mindexpander_qwen_v1:  17%|#7        | 516/3000 [34:56<3:07:00,  4.52s/it, lr: 1.0e-04 loss: 1.516e-01]mindexpander_qwen_v1:  17%|#7        | 517/3000 [34:56<3:21:45,  4.88s/it, lr: 1.0e-04 loss: 1.516e-01]mindexpander_qwen_v1:  17%|#7        | 517/3000 [34:56<3:21:45,  4.88s/it, lr: 1.0e-04 loss: 1.516e-01]mindexpander_qwen_v1:  17%|#7        | 517/3000 [35:01<3:21:45,  4.88s/it, lr: 1.0e-04 loss: 1.446e-01]mindexpander_qwen_v1:  17%|#7        | 517/3000 [35:01<3:21:45,  4.88s/it, lr: 1.0e-04 loss: 1.446e-01]mindexpander_qwen_v1:  17%|#7        | 518/3000 [35:01<3:32:18,  5.13s/it, lr: 1.0e-04 loss: 1.446e-01]mindexpander_qwen_v1:  17%|#7        | 518/3000 [35:01<3:32:18,  5.13s/it, lr: 1.0e-04 loss: 1.446e-01]mindexpander_qwen_v1:  17%|#7        | 518/3000 [35:04<3:32:18,  5.13s/it, lr: 1.0e-04 loss: 1.966e-01]mindexpander_qwen_v1:  17%|#7        | 518/3000 [35:04<3:32:18,  5.13s/it, lr: 1.0e-04 loss: 1.966e-01]mindexpander_qwen_v1:  17%|#7        | 519/3000 [35:04<2:59:30,  4.34s/it, lr: 1.0e-04 loss: 1.966e-01]mindexpander_qwen_v1:  17%|#7        | 519/3000 [35:04<2:59:30,  4.34s/it, lr: 1.0e-04 loss: 1.966e-01]mindexpander_qwen_v1:  17%|#7        | 519/3000 [35:08<2:59:30,  4.34s/it, lr: 1.0e-04 loss: 8.290e-02]mindexpander_qwen_v1:  17%|#7        | 519/3000 [35:08<2:59:30,  4.34s/it, lr: 1.0e-04 loss: 8.290e-02]mindexpander_qwen_v1:  17%|#7        | 520/3000 [35:12<2:59:26,  4.34s/it, lr: 1.0e-04 loss: 5.997e-03]mindexpander_qwen_v1:  17%|#7        | 520/3000 [35:12<2:59:26,  4.34s/it, lr: 1.0e-04 loss: 5.997e-03]mindexpander_qwen_v1:  17%|#7        | 521/3000 [35:12<2:12:40,  3.21s/it, lr: 1.0e-04 loss: 5.997e-03]mindexpander_qwen_v1:  17%|#7        | 521/3000 [35:12<2:12:40,  3.21s/it, lr: 1.0e-04 loss: 5.997e-03]mindexpander_qwen_v1:  17%|#7        | 521/3000 [35:17<2:12:40,  3.21s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:  17%|#7        | 521/3000 [35:17<2:12:40,  3.21s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:  17%|#7        | 522/3000 [35:17<2:38:26,  3.84s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:  17%|#7        | 522/3000 [35:17<2:38:26,  3.84s/it, lr: 1.0e-04 loss: 1.780e-01]mindexpander_qwen_v1:  17%|#7        | 522/3000 [35:23<2:38:26,  3.84s/it, lr: 1.0e-04 loss: 5.658e-02]mindexpander_qwen_v1:  17%|#7        | 522/3000 [35:23<2:38:26,  3.84s/it, lr: 1.0e-04 loss: 5.658e-02]mindexpander_qwen_v1:  17%|#7        | 523/3000 [35:23<2:58:56,  4.33s/it, lr: 1.0e-04 loss: 5.658e-02]mindexpander_qwen_v1:  17%|#7        | 523/3000 [35:23<2:58:56,  4.33s/it, lr: 1.0e-04 loss: 5.658e-02]mindexpander_qwen_v1:  17%|#7        | 523/3000 [35:27<2:58:56,  4.33s/it, lr: 1.0e-04 loss: 5.410e-02]mindexpander_qwen_v1:  17%|#7        | 523/3000 [35:27<2:58:56,  4.33s/it, lr: 1.0e-04 loss: 5.410e-02]mindexpander_qwen_v1:  17%|#7        | 524/3000 [35:27<2:53:59,  4.22s/it, lr: 1.0e-04 loss: 5.410e-02]mindexpander_qwen_v1:  17%|#7        | 524/3000 [35:27<2:53:59,  4.22s/it, lr: 1.0e-04 loss: 5.410e-02]mindexpander_qwen_v1:  17%|#7        | 524/3000 [35:33<2:53:59,  4.22s/it, lr: 1.0e-04 loss: 6.997e-02]mindexpander_qwen_v1:  17%|#7        | 524/3000 [35:33<2:53:59,  4.22s/it, lr: 1.0e-04 loss: 6.997e-02]mindexpander_qwen_v1:  18%|#7        | 525/3000 [35:33<3:11:32,  4.64s/it, lr: 1.0e-04 loss: 6.997e-02]mindexpander_qwen_v1:  18%|#7        | 525/3000 [35:33<3:11:32,  4.64s/it, lr: 1.0e-04 loss: 6.997e-02]mindexpander_qwen_v1:  18%|#7        | 525/3000 [35:35<3:11:32,  4.64s/it, lr: 1.0e-04 loss: 4.389e-02]mindexpander_qwen_v1:  18%|#7        | 525/3000 [35:35<3:11:32,  4.64s/it, lr: 1.0e-04 loss: 4.389e-02]mindexpander_qwen_v1:  18%|#7        | 526/3000 [35:35<2:45:41,  4.02s/it, lr: 1.0e-04 loss: 4.389e-02]mindexpander_qwen_v1:  18%|#7        | 526/3000 [35:35<2:45:41,  4.02s/it, lr: 1.0e-04 loss: 4.389e-02]mindexpander_qwen_v1:  18%|#7        | 526/3000 [35:38<2:45:41,  4.02s/it, lr: 1.0e-04 loss: 1.974e-01]mindexpander_qwen_v1:  18%|#7        | 526/3000 [35:38<2:45:41,  4.02s/it, lr: 1.0e-04 loss: 1.974e-01]mindexpander_qwen_v1:  18%|#7        | 527/3000 [35:38<2:26:45,  3.56s/it, lr: 1.0e-04 loss: 1.974e-01]mindexpander_qwen_v1:  18%|#7        | 527/3000 [35:38<2:26:45,  3.56s/it, lr: 1.0e-04 loss: 1.974e-01]mindexpander_qwen_v1:  18%|#7        | 527/3000 [35:41<2:26:45,  3.56s/it, lr: 1.0e-04 loss: 1.348e-01]mindexpander_qwen_v1:  18%|#7        | 527/3000 [35:41<2:26:45,  3.56s/it, lr: 1.0e-04 loss: 1.348e-01]mindexpander_qwen_v1:  18%|#7        | 528/3000 [35:41<2:30:47,  3.66s/it, lr: 1.0e-04 loss: 1.348e-01]mindexpander_qwen_v1:  18%|#7        | 528/3000 [35:41<2:30:47,  3.66s/it, lr: 1.0e-04 loss: 1.348e-01]mindexpander_qwen_v1:  18%|#7        | 528/3000 [35:45<2:30:47,  3.66s/it, lr: 1.0e-04 loss: 1.651e-01]mindexpander_qwen_v1:  18%|#7        | 528/3000 [35:45<2:30:47,  3.66s/it, lr: 1.0e-04 loss: 1.651e-01]mindexpander_qwen_v1:  18%|#7        | 529/3000 [35:45<2:31:46,  3.69s/it, lr: 1.0e-04 loss: 1.651e-01]mindexpander_qwen_v1:  18%|#7        | 529/3000 [35:45<2:31:46,  3.69s/it, lr: 1.0e-04 loss: 1.651e-01]mindexpander_qwen_v1:  18%|#7        | 529/3000 [35:48<2:31:46,  3.69s/it, lr: 1.0e-04 loss: 2.869e-02]mindexpander_qwen_v1:  18%|#7        | 529/3000 [35:48<2:31:46,  3.69s/it, lr: 1.0e-04 loss: 2.869e-02]mindexpander_qwen_v1:  18%|#7        | 530/3000 [35:50<2:31:42,  3.69s/it, lr: 1.0e-04 loss: 1.049e-01]mindexpander_qwen_v1:  18%|#7        | 530/3000 [35:50<2:31:42,  3.69s/it, lr: 1.0e-04 loss: 1.049e-01]mindexpander_qwen_v1:  18%|#7        | 531/3000 [35:50<1:45:33,  2.57s/it, lr: 1.0e-04 loss: 1.049e-01]mindexpander_qwen_v1:  18%|#7        | 531/3000 [35:50<1:45:33,  2.57s/it, lr: 1.0e-04 loss: 1.049e-01]mindexpander_qwen_v1:  18%|#7        | 531/3000 [35:53<1:45:33,  2.57s/it, lr: 1.0e-04 loss: 7.932e-02]mindexpander_qwen_v1:  18%|#7        | 531/3000 [35:53<1:45:33,  2.57s/it, lr: 1.0e-04 loss: 7.932e-02]mindexpander_qwen_v1:  18%|#7        | 532/3000 [35:53<1:46:19,  2.58s/it, lr: 1.0e-04 loss: 7.932e-02]mindexpander_qwen_v1:  18%|#7        | 532/3000 [35:53<1:46:19,  2.58s/it, lr: 1.0e-04 loss: 7.932e-02]mindexpander_qwen_v1:  18%|#7        | 532/3000 [35:57<1:46:19,  2.58s/it, lr: 1.0e-04 loss: 1.632e-01]mindexpander_qwen_v1:  18%|#7        | 532/3000 [35:57<1:46:19,  2.58s/it, lr: 1.0e-04 loss: 1.632e-01]mindexpander_qwen_v1:  18%|#7        | 533/3000 [35:57<1:58:41,  2.89s/it, lr: 1.0e-04 loss: 1.632e-01]mindexpander_qwen_v1:  18%|#7        | 533/3000 [35:57<1:58:41,  2.89s/it, lr: 1.0e-04 loss: 1.632e-01]mindexpander_qwen_v1:  18%|#7        | 533/3000 [36:00<1:58:41,  2.89s/it, lr: 1.0e-04 loss: 7.832e-02]mindexpander_qwen_v1:  18%|#7        | 533/3000 [36:00<1:58:41,  2.89s/it, lr: 1.0e-04 loss: 7.832e-02]mindexpander_qwen_v1:  18%|#7        | 534/3000 [36:00<2:08:11,  3.12s/it, lr: 1.0e-04 loss: 7.832e-02]mindexpander_qwen_v1:  18%|#7        | 534/3000 [36:00<2:08:11,  3.12s/it, lr: 1.0e-04 loss: 7.832e-02]mindexpander_qwen_v1:  18%|#7        | 534/3000 [36:04<2:08:11,  3.12s/it, lr: 1.0e-04 loss: 1.049e-01]mindexpander_qwen_v1:  18%|#7        | 534/3000 [36:04<2:08:11,  3.12s/it, lr: 1.0e-04 loss: 1.049e-01]mindexpander_qwen_v1:  18%|#7        | 535/3000 [36:04<2:15:15,  3.29s/it, lr: 1.0e-04 loss: 1.049e-01]mindexpander_qwen_v1:  18%|#7        | 535/3000 [36:04<2:15:15,  3.29s/it, lr: 1.0e-04 loss: 1.049e-01]mindexpander_qwen_v1:  18%|#7        | 535/3000 [36:07<2:15:15,  3.29s/it, lr: 1.0e-04 loss: 1.024e-01]mindexpander_qwen_v1:  18%|#7        | 535/3000 [36:07<2:15:15,  3.29s/it, lr: 1.0e-04 loss: 1.024e-01]mindexpander_qwen_v1:  18%|#7        | 536/3000 [36:07<2:07:33,  3.11s/it, lr: 1.0e-04 loss: 1.024e-01]mindexpander_qwen_v1:  18%|#7        | 536/3000 [36:07<2:07:33,  3.11s/it, lr: 1.0e-04 loss: 1.024e-01]mindexpander_qwen_v1:  18%|#7        | 536/3000 [36:10<2:07:33,  3.11s/it, lr: 1.0e-04 loss: 1.522e-02]mindexpander_qwen_v1:  18%|#7        | 536/3000 [36:10<2:07:33,  3.11s/it, lr: 1.0e-04 loss: 1.522e-02]mindexpander_qwen_v1:  18%|#7        | 537/3000 [36:10<2:15:05,  3.29s/it, lr: 1.0e-04 loss: 1.522e-02]mindexpander_qwen_v1:  18%|#7        | 537/3000 [36:10<2:15:05,  3.29s/it, lr: 1.0e-04 loss: 1.522e-02]mindexpander_qwen_v1:  18%|#7        | 537/3000 [36:16<2:15:05,  3.29s/it, lr: 1.0e-04 loss: 1.547e-01]mindexpander_qwen_v1:  18%|#7        | 537/3000 [36:16<2:15:05,  3.29s/it, lr: 1.0e-04 loss: 1.547e-01]mindexpander_qwen_v1:  18%|#7        | 538/3000 [36:16<2:44:36,  4.01s/it, lr: 1.0e-04 loss: 1.547e-01]mindexpander_qwen_v1:  18%|#7        | 538/3000 [36:16<2:44:36,  4.01s/it, lr: 1.0e-04 loss: 1.547e-01]mindexpander_qwen_v1:  18%|#7        | 538/3000 [36:19<2:44:36,  4.01s/it, lr: 1.0e-04 loss: 3.541e-02]mindexpander_qwen_v1:  18%|#7        | 538/3000 [36:19<2:44:36,  4.01s/it, lr: 1.0e-04 loss: 3.541e-02]mindexpander_qwen_v1:  18%|#7        | 539/3000 [36:19<2:25:47,  3.55s/it, lr: 1.0e-04 loss: 3.541e-02]mindexpander_qwen_v1:  18%|#7        | 539/3000 [36:19<2:25:47,  3.55s/it, lr: 1.0e-04 loss: 3.541e-02]mindexpander_qwen_v1:  18%|#7        | 539/3000 [36:22<2:25:47,  3.55s/it, lr: 1.0e-04 loss: 1.717e-01]mindexpander_qwen_v1:  18%|#7        | 539/3000 [36:22<2:25:47,  3.55s/it, lr: 1.0e-04 loss: 1.717e-01]mindexpander_qwen_v1:  18%|#8        | 540/3000 [36:27<2:25:43,  3.55s/it, lr: 1.0e-04 loss: 9.787e-02]mindexpander_qwen_v1:  18%|#8        | 540/3000 [36:27<2:25:43,  3.55s/it, lr: 1.0e-04 loss: 9.787e-02]mindexpander_qwen_v1:  18%|#8        | 541/3000 [36:27<2:13:04,  3.25s/it, lr: 1.0e-04 loss: 9.787e-02]mindexpander_qwen_v1:  18%|#8        | 541/3000 [36:27<2:13:04,  3.25s/it, lr: 1.0e-04 loss: 9.787e-02]mindexpander_qwen_v1:  18%|#8        | 541/3000 [36:33<2:13:04,  3.25s/it, lr: 1.0e-04 loss: 6.431e-03]mindexpander_qwen_v1:  18%|#8        | 541/3000 [36:33<2:13:04,  3.25s/it, lr: 1.0e-04 loss: 6.431e-03]mindexpander_qwen_v1:  18%|#8        | 542/3000 [36:33<2:38:17,  3.86s/it, lr: 1.0e-04 loss: 6.431e-03]mindexpander_qwen_v1:  18%|#8        | 542/3000 [36:33<2:38:17,  3.86s/it, lr: 1.0e-04 loss: 6.431e-03]mindexpander_qwen_v1:  18%|#8        | 542/3000 [36:37<2:38:17,  3.86s/it, lr: 1.0e-04 loss: 4.190e-02]mindexpander_qwen_v1:  18%|#8        | 542/3000 [36:37<2:38:17,  3.86s/it, lr: 1.0e-04 loss: 4.190e-02]mindexpander_qwen_v1:  18%|#8        | 543/3000 [36:37<2:38:55,  3.88s/it, lr: 1.0e-04 loss: 4.190e-02]mindexpander_qwen_v1:  18%|#8        | 543/3000 [36:37<2:38:55,  3.88s/it, lr: 1.0e-04 loss: 4.190e-02]mindexpander_qwen_v1:  18%|#8        | 543/3000 [36:43<2:38:55,  3.88s/it, lr: 1.0e-04 loss: 1.009e-01]mindexpander_qwen_v1:  18%|#8        | 543/3000 [36:43<2:38:55,  3.88s/it, lr: 1.0e-04 loss: 1.009e-01]mindexpander_qwen_v1:  18%|#8        | 544/3000 [36:43<2:59:29,  4.38s/it, lr: 1.0e-04 loss: 1.009e-01]mindexpander_qwen_v1:  18%|#8        | 544/3000 [36:43<2:59:29,  4.38s/it, lr: 1.0e-04 loss: 1.009e-01]mindexpander_qwen_v1:  18%|#8        | 544/3000 [36:45<2:59:29,  4.38s/it, lr: 1.0e-04 loss: 9.406e-03]mindexpander_qwen_v1:  18%|#8        | 544/3000 [36:45<2:59:29,  4.38s/it, lr: 1.0e-04 loss: 9.406e-03]mindexpander_qwen_v1:  18%|#8        | 545/3000 [36:45<2:37:10,  3.84s/it, lr: 1.0e-04 loss: 9.406e-03]mindexpander_qwen_v1:  18%|#8        | 545/3000 [36:45<2:37:10,  3.84s/it, lr: 1.0e-04 loss: 9.406e-03]mindexpander_qwen_v1:  18%|#8        | 545/3000 [36:48<2:37:10,  3.84s/it, lr: 1.0e-04 loss: 1.269e-01]mindexpander_qwen_v1:  18%|#8        | 545/3000 [36:48<2:37:10,  3.84s/it, lr: 1.0e-04 loss: 1.269e-01]mindexpander_qwen_v1:  18%|#8        | 546/3000 [36:48<2:20:59,  3.45s/it, lr: 1.0e-04 loss: 1.269e-01]mindexpander_qwen_v1:  18%|#8        | 546/3000 [36:48<2:20:59,  3.45s/it, lr: 1.0e-04 loss: 1.269e-01]mindexpander_qwen_v1:  18%|#8        | 546/3000 [36:52<2:20:59,  3.45s/it, lr: 1.0e-04 loss: 1.822e-01]mindexpander_qwen_v1:  18%|#8        | 546/3000 [36:52<2:20:59,  3.45s/it, lr: 1.0e-04 loss: 1.822e-01]mindexpander_qwen_v1:  18%|#8        | 547/3000 [36:52<2:26:25,  3.58s/it, lr: 1.0e-04 loss: 1.822e-01]mindexpander_qwen_v1:  18%|#8        | 547/3000 [36:52<2:26:25,  3.58s/it, lr: 1.0e-04 loss: 1.822e-01]mindexpander_qwen_v1:  18%|#8        | 547/3000 [36:54<2:26:25,  3.58s/it, lr: 1.0e-04 loss: 1.645e-01]mindexpander_qwen_v1:  18%|#8        | 547/3000 [36:54<2:26:25,  3.58s/it, lr: 1.0e-04 loss: 1.645e-01]mindexpander_qwen_v1:  18%|#8        | 548/3000 [36:54<2:12:41,  3.25s/it, lr: 1.0e-04 loss: 1.645e-01]mindexpander_qwen_v1:  18%|#8        | 548/3000 [36:54<2:12:41,  3.25s/it, lr: 1.0e-04 loss: 1.645e-01]mindexpander_qwen_v1:  18%|#8        | 548/3000 [37:00<2:12:41,  3.25s/it, lr: 1.0e-04 loss: 9.100e-02]mindexpander_qwen_v1:  18%|#8        | 548/3000 [37:00<2:12:41,  3.25s/it, lr: 1.0e-04 loss: 9.100e-02]mindexpander_qwen_v1:  18%|#8        | 549/3000 [37:00<2:42:49,  3.99s/it, lr: 1.0e-04 loss: 9.100e-02]mindexpander_qwen_v1:  18%|#8        | 549/3000 [37:00<2:42:49,  3.99s/it, lr: 1.0e-04 loss: 9.100e-02]mindexpander_qwen_v1:  18%|#8        | 549/3000 [37:06<2:42:49,  3.99s/it, lr: 1.0e-04 loss: 1.866e-02]mindexpander_qwen_v1:  18%|#8        | 549/3000 [37:06<2:42:49,  3.99s/it, lr: 1.0e-04 loss: 1.866e-02]mindexpander_qwen_v1:  18%|#8        | 550/3000 [37:08<2:42:45,  3.99s/it, lr: 1.0e-04 loss: 6.316e-02]mindexpander_qwen_v1:  18%|#8        | 550/3000 [37:08<2:42:45,  3.99s/it, lr: 1.0e-04 loss: 6.316e-02]mindexpander_qwen_v1:  18%|#8        | 551/3000 [37:08<1:53:15,  2.77s/it, lr: 1.0e-04 loss: 6.316e-02]mindexpander_qwen_v1:  18%|#8        | 551/3000 [37:08<1:53:15,  2.77s/it, lr: 1.0e-04 loss: 6.316e-02]mindexpander_qwen_v1:  18%|#8        | 551/3000 [37:14<1:53:15,  2.77s/it, lr: 1.0e-04 loss: 2.621e-02]mindexpander_qwen_v1:  18%|#8        | 551/3000 [37:14<1:53:15,  2.77s/it, lr: 1.0e-04 loss: 2.621e-02]mindexpander_qwen_v1:  18%|#8        | 552/3000 [37:14<2:23:14,  3.51s/it, lr: 1.0e-04 loss: 2.621e-02]mindexpander_qwen_v1:  18%|#8        | 552/3000 [37:14<2:23:14,  3.51s/it, lr: 1.0e-04 loss: 2.621e-02]mindexpander_qwen_v1:  18%|#8        | 552/3000 [37:20<2:23:14,  3.51s/it, lr: 1.0e-04 loss: 4.957e-02]mindexpander_qwen_v1:  18%|#8        | 552/3000 [37:20<2:23:14,  3.51s/it, lr: 1.0e-04 loss: 4.957e-02]mindexpander_qwen_v1:  18%|#8        | 553/3000 [37:20<2:47:09,  4.10s/it, lr: 1.0e-04 loss: 4.957e-02]mindexpander_qwen_v1:  18%|#8        | 553/3000 [37:20<2:47:09,  4.10s/it, lr: 1.0e-04 loss: 4.957e-02]mindexpander_qwen_v1:  18%|#8        | 553/3000 [37:24<2:47:09,  4.10s/it, lr: 1.0e-04 loss: 1.044e-02]mindexpander_qwen_v1:  18%|#8        | 553/3000 [37:24<2:47:09,  4.10s/it, lr: 1.0e-04 loss: 1.044e-02]mindexpander_qwen_v1:  18%|#8        | 554/3000 [37:24<2:43:08,  4.00s/it, lr: 1.0e-04 loss: 1.044e-02]mindexpander_qwen_v1:  18%|#8        | 554/3000 [37:24<2:43:08,  4.00s/it, lr: 1.0e-04 loss: 1.044e-02]mindexpander_qwen_v1:  18%|#8        | 554/3000 [37:27<2:43:08,  4.00s/it, lr: 1.0e-04 loss: 1.669e-02]mindexpander_qwen_v1:  18%|#8        | 554/3000 [37:27<2:43:08,  4.00s/it, lr: 1.0e-04 loss: 1.669e-02]mindexpander_qwen_v1:  18%|#8        | 555/3000 [37:27<2:40:04,  3.93s/it, lr: 1.0e-04 loss: 1.669e-02]mindexpander_qwen_v1:  18%|#8        | 555/3000 [37:27<2:40:04,  3.93s/it, lr: 1.0e-04 loss: 1.669e-02]mindexpander_qwen_v1:  18%|#8        | 555/3000 [37:31<2:40:04,  3.93s/it, lr: 1.0e-04 loss: 1.763e-01]mindexpander_qwen_v1:  18%|#8        | 555/3000 [37:31<2:40:04,  3.93s/it, lr: 1.0e-04 loss: 1.763e-01]mindexpander_qwen_v1:  19%|#8        | 556/3000 [37:31<2:39:55,  3.93s/it, lr: 1.0e-04 loss: 1.763e-01]mindexpander_qwen_v1:  19%|#8        | 556/3000 [37:31<2:39:55,  3.93s/it, lr: 1.0e-04 loss: 1.763e-01]mindexpander_qwen_v1:  19%|#8        | 556/3000 [37:37<2:39:55,  3.93s/it, lr: 1.0e-04 loss: 6.087e-02]mindexpander_qwen_v1:  19%|#8        | 556/3000 [37:37<2:39:55,  3.93s/it, lr: 1.0e-04 loss: 6.087e-02]mindexpander_qwen_v1:  19%|#8        | 557/3000 [37:37<3:01:28,  4.46s/it, lr: 1.0e-04 loss: 6.087e-02]mindexpander_qwen_v1:  19%|#8        | 557/3000 [37:37<3:01:28,  4.46s/it, lr: 1.0e-04 loss: 6.087e-02]mindexpander_qwen_v1:  19%|#8        | 557/3000 [37:43<3:01:28,  4.46s/it, lr: 1.0e-04 loss: 6.623e-02]mindexpander_qwen_v1:  19%|#8        | 557/3000 [37:43<3:01:28,  4.46s/it, lr: 1.0e-04 loss: 6.623e-02]mindexpander_qwen_v1:  19%|#8        | 558/3000 [37:43<3:17:03,  4.84s/it, lr: 1.0e-04 loss: 6.623e-02]mindexpander_qwen_v1:  19%|#8        | 558/3000 [37:43<3:17:03,  4.84s/it, lr: 1.0e-04 loss: 6.623e-02]mindexpander_qwen_v1:  19%|#8        | 558/3000 [37:45<3:17:03,  4.84s/it, lr: 1.0e-04 loss: 1.104e-01]mindexpander_qwen_v1:  19%|#8        | 558/3000 [37:45<3:17:03,  4.84s/it, lr: 1.0e-04 loss: 1.104e-01]mindexpander_qwen_v1:  19%|#8        | 559/3000 [37:45<2:50:54,  4.20s/it, lr: 1.0e-04 loss: 1.104e-01]mindexpander_qwen_v1:  19%|#8        | 559/3000 [37:45<2:50:54,  4.20s/it, lr: 1.0e-04 loss: 1.104e-01]mindexpander_qwen_v1:  19%|#8        | 559/3000 [37:51<2:50:54,  4.20s/it, lr: 1.0e-04 loss: 8.217e-02]mindexpander_qwen_v1:  19%|#8        | 559/3000 [37:51<2:50:54,  4.20s/it, lr: 1.0e-04 loss: 8.217e-02]mindexpander_qwen_v1:  19%|#8        | 560/3000 [37:54<2:50:50,  4.20s/it, lr: 1.0e-04 loss: 1.926e-01]mindexpander_qwen_v1:  19%|#8        | 560/3000 [37:54<2:50:50,  4.20s/it, lr: 1.0e-04 loss: 1.926e-01]mindexpander_qwen_v1:  19%|#8        | 561/3000 [37:54<1:55:26,  2.84s/it, lr: 1.0e-04 loss: 1.926e-01]mindexpander_qwen_v1:  19%|#8        | 561/3000 [37:54<1:55:26,  2.84s/it, lr: 1.0e-04 loss: 1.926e-01]mindexpander_qwen_v1:  19%|#8        | 561/3000 [37:56<1:55:26,  2.84s/it, lr: 1.0e-04 loss: 3.916e-02]mindexpander_qwen_v1:  19%|#8        | 561/3000 [37:56<1:55:26,  2.84s/it, lr: 1.0e-04 loss: 3.916e-02]mindexpander_qwen_v1:  19%|#8        | 562/3000 [37:56<1:51:28,  2.74s/it, lr: 1.0e-04 loss: 3.916e-02]mindexpander_qwen_v1:  19%|#8        | 562/3000 [37:56<1:51:28,  2.74s/it, lr: 1.0e-04 loss: 3.916e-02]mindexpander_qwen_v1:  19%|#8        | 562/3000 [38:00<1:51:28,  2.74s/it, lr: 1.0e-04 loss: 4.563e-02]mindexpander_qwen_v1:  19%|#8        | 562/3000 [38:00<1:51:28,  2.74s/it, lr: 1.0e-04 loss: 4.563e-02]mindexpander_qwen_v1:  19%|#8        | 563/3000 [38:00<2:03:49,  3.05s/it, lr: 1.0e-04 loss: 4.563e-02]mindexpander_qwen_v1:  19%|#8        | 563/3000 [38:00<2:03:49,  3.05s/it, lr: 1.0e-04 loss: 4.563e-02]mindexpander_qwen_v1:  19%|#8        | 563/3000 [38:04<2:03:49,  3.05s/it, lr: 1.0e-04 loss: 1.521e-02]mindexpander_qwen_v1:  19%|#8        | 563/3000 [38:04<2:03:49,  3.05s/it, lr: 1.0e-04 loss: 1.521e-02]mindexpander_qwen_v1:  19%|#8        | 564/3000 [38:04<2:11:26,  3.24s/it, lr: 1.0e-04 loss: 1.521e-02]mindexpander_qwen_v1:  19%|#8        | 564/3000 [38:04<2:11:26,  3.24s/it, lr: 1.0e-04 loss: 1.521e-02]mindexpander_qwen_v1:  19%|#8        | 564/3000 [38:08<2:11:26,  3.24s/it, lr: 1.0e-04 loss: 1.657e-01]mindexpander_qwen_v1:  19%|#8        | 564/3000 [38:08<2:11:26,  3.24s/it, lr: 1.0e-04 loss: 1.657e-01]mindexpander_qwen_v1:  19%|#8        | 565/3000 [38:08<2:17:07,  3.38s/it, lr: 1.0e-04 loss: 1.657e-01]mindexpander_qwen_v1:  19%|#8        | 565/3000 [38:08<2:17:07,  3.38s/it, lr: 1.0e-04 loss: 1.657e-01]mindexpander_qwen_v1:  19%|#8        | 565/3000 [38:11<2:17:07,  3.38s/it, lr: 1.0e-04 loss: 8.815e-02]mindexpander_qwen_v1:  19%|#8        | 565/3000 [38:11<2:17:07,  3.38s/it, lr: 1.0e-04 loss: 8.815e-02]mindexpander_qwen_v1:  19%|#8        | 566/3000 [38:11<2:21:12,  3.48s/it, lr: 1.0e-04 loss: 8.815e-02]mindexpander_qwen_v1:  19%|#8        | 566/3000 [38:11<2:21:12,  3.48s/it, lr: 1.0e-04 loss: 8.815e-02]mindexpander_qwen_v1:  19%|#8        | 566/3000 [38:14<2:21:12,  3.48s/it, lr: 1.0e-04 loss: 1.678e-01]mindexpander_qwen_v1:  19%|#8        | 566/3000 [38:14<2:21:12,  3.48s/it, lr: 1.0e-04 loss: 1.678e-01]mindexpander_qwen_v1:  19%|#8        | 567/3000 [38:14<2:11:33,  3.24s/it, lr: 1.0e-04 loss: 1.678e-01]mindexpander_qwen_v1:  19%|#8        | 567/3000 [38:14<2:11:33,  3.24s/it, lr: 1.0e-04 loss: 1.678e-01]mindexpander_qwen_v1:  19%|#8        | 567/3000 [38:16<2:11:33,  3.24s/it, lr: 1.0e-04 loss: 3.389e-02]mindexpander_qwen_v1:  19%|#8        | 567/3000 [38:16<2:11:33,  3.24s/it, lr: 1.0e-04 loss: 3.389e-02]mindexpander_qwen_v1:  19%|#8        | 568/3000 [38:16<2:02:02,  3.01s/it, lr: 1.0e-04 loss: 3.389e-02]mindexpander_qwen_v1:  19%|#8        | 568/3000 [38:16<2:02:02,  3.01s/it, lr: 1.0e-04 loss: 3.389e-02]mindexpander_qwen_v1:  19%|#8        | 568/3000 [38:20<2:02:02,  3.01s/it, lr: 1.0e-04 loss: 8.013e-02]mindexpander_qwen_v1:  19%|#8        | 568/3000 [38:20<2:02:02,  3.01s/it, lr: 1.0e-04 loss: 8.013e-02]mindexpander_qwen_v1:  19%|#8        | 569/3000 [38:20<2:10:44,  3.23s/it, lr: 1.0e-04 loss: 8.013e-02]mindexpander_qwen_v1:  19%|#8        | 569/3000 [38:20<2:10:44,  3.23s/it, lr: 1.0e-04 loss: 8.013e-02]mindexpander_qwen_v1:  19%|#8        | 569/3000 [38:26<2:10:44,  3.23s/it, lr: 1.0e-04 loss: 1.845e-01]mindexpander_qwen_v1:  19%|#8        | 569/3000 [38:26<2:10:44,  3.23s/it, lr: 1.0e-04 loss: 1.845e-01]mindexpander_qwen_v1:  19%|#9        | 570/3000 [38:32<2:10:40,  3.23s/it, lr: 1.0e-04 loss: 2.142e-02]mindexpander_qwen_v1:  19%|#9        | 570/3000 [38:32<2:10:40,  3.23s/it, lr: 1.0e-04 loss: 2.142e-02]mindexpander_qwen_v1:  19%|#9        | 571/3000 [38:32<2:06:17,  3.12s/it, lr: 1.0e-04 loss: 2.142e-02]mindexpander_qwen_v1:  19%|#9        | 571/3000 [38:32<2:06:17,  3.12s/it, lr: 1.0e-04 loss: 2.142e-02]mindexpander_qwen_v1:  19%|#9        | 571/3000 [38:38<2:06:17,  3.12s/it, lr: 1.0e-04 loss: 3.495e-02]mindexpander_qwen_v1:  19%|#9        | 571/3000 [38:38<2:06:17,  3.12s/it, lr: 1.0e-04 loss: 3.495e-02]mindexpander_qwen_v1:  19%|#9        | 572/3000 [38:38<2:32:27,  3.77s/it, lr: 1.0e-04 loss: 3.495e-02]mindexpander_qwen_v1:  19%|#9        | 572/3000 [38:38<2:32:27,  3.77s/it, lr: 1.0e-04 loss: 3.495e-02]mindexpander_qwen_v1:  19%|#9        | 572/3000 [38:44<2:32:27,  3.77s/it, lr: 1.0e-04 loss: 1.882e-01]mindexpander_qwen_v1:  19%|#9        | 572/3000 [38:44<2:32:27,  3.77s/it, lr: 1.0e-04 loss: 1.882e-01]mindexpander_qwen_v1:  19%|#9        | 573/3000 [38:44<2:53:23,  4.29s/it, lr: 1.0e-04 loss: 1.882e-01]mindexpander_qwen_v1:  19%|#9        | 573/3000 [38:44<2:53:23,  4.29s/it, lr: 1.0e-04 loss: 1.882e-01]mindexpander_qwen_v1:  19%|#9        | 573/3000 [38:47<2:53:23,  4.29s/it, lr: 1.0e-04 loss: 1.734e-01]mindexpander_qwen_v1:  19%|#9        | 573/3000 [38:47<2:53:23,  4.29s/it, lr: 1.0e-04 loss: 1.734e-01]mindexpander_qwen_v1:  19%|#9        | 574/3000 [38:47<2:47:30,  4.14s/it, lr: 1.0e-04 loss: 1.734e-01]mindexpander_qwen_v1:  19%|#9        | 574/3000 [38:47<2:47:30,  4.14s/it, lr: 1.0e-04 loss: 1.734e-01]mindexpander_qwen_v1:  19%|#9        | 574/3000 [38:53<2:47:30,  4.14s/it, lr: 1.0e-04 loss: 2.426e-02]mindexpander_qwen_v1:  19%|#9        | 574/3000 [38:53<2:47:30,  4.14s/it, lr: 1.0e-04 loss: 2.426e-02]mindexpander_qwen_v1:  19%|#9        | 575/3000 [38:53<3:07:10,  4.63s/it, lr: 1.0e-04 loss: 2.426e-02]mindexpander_qwen_v1:  19%|#9        | 575/3000 [38:53<3:07:10,  4.63s/it, lr: 1.0e-04 loss: 2.426e-02]mindexpander_qwen_v1:  19%|#9        | 575/3000 [38:57<3:07:10,  4.63s/it, lr: 1.0e-04 loss: 4.201e-02]mindexpander_qwen_v1:  19%|#9        | 575/3000 [38:57<3:07:10,  4.63s/it, lr: 1.0e-04 loss: 4.201e-02]mindexpander_qwen_v1:  19%|#9        | 576/3000 [38:57<2:56:52,  4.38s/it, lr: 1.0e-04 loss: 4.201e-02]mindexpander_qwen_v1:  19%|#9        | 576/3000 [38:57<2:56:52,  4.38s/it, lr: 1.0e-04 loss: 4.201e-02]mindexpander_qwen_v1:  19%|#9        | 576/3000 [39:03<2:56:52,  4.38s/it, lr: 1.0e-04 loss: 1.704e-01]mindexpander_qwen_v1:  19%|#9        | 576/3000 [39:03<2:56:52,  4.38s/it, lr: 1.0e-04 loss: 1.704e-01]mindexpander_qwen_v1:  19%|#9        | 577/3000 [39:03<3:12:51,  4.78s/it, lr: 1.0e-04 loss: 1.704e-01]mindexpander_qwen_v1:  19%|#9        | 577/3000 [39:03<3:12:51,  4.78s/it, lr: 1.0e-04 loss: 1.704e-01]mindexpander_qwen_v1:  19%|#9        | 577/3000 [39:05<3:12:51,  4.78s/it, lr: 1.0e-04 loss: 9.637e-02]mindexpander_qwen_v1:  19%|#9        | 577/3000 [39:05<3:12:51,  4.78s/it, lr: 1.0e-04 loss: 9.637e-02]mindexpander_qwen_v1:  19%|#9        | 578/3000 [39:05<2:45:53,  4.11s/it, lr: 1.0e-04 loss: 9.637e-02]mindexpander_qwen_v1:  19%|#9        | 578/3000 [39:05<2:45:53,  4.11s/it, lr: 1.0e-04 loss: 9.637e-02]mindexpander_qwen_v1:  19%|#9        | 578/3000 [39:09<2:45:53,  4.11s/it, lr: 1.0e-04 loss: 5.735e-02]mindexpander_qwen_v1:  19%|#9        | 578/3000 [39:09<2:45:53,  4.11s/it, lr: 1.0e-04 loss: 5.735e-02]mindexpander_qwen_v1:  19%|#9        | 579/3000 [39:09<2:43:17,  4.05s/it, lr: 1.0e-04 loss: 5.735e-02]mindexpander_qwen_v1:  19%|#9        | 579/3000 [39:09<2:43:17,  4.05s/it, lr: 1.0e-04 loss: 5.735e-02]mindexpander_qwen_v1:  19%|#9        | 579/3000 [39:12<2:43:17,  4.05s/it, lr: 1.0e-04 loss: 3.358e-02]mindexpander_qwen_v1:  19%|#9        | 579/3000 [39:12<2:43:17,  4.05s/it, lr: 1.0e-04 loss: 3.358e-02]mindexpander_qwen_v1:  19%|#9        | 580/3000 [39:15<2:43:13,  4.05s/it, lr: 1.0e-04 loss: 3.547e-02]mindexpander_qwen_v1:  19%|#9        | 580/3000 [39:15<2:43:13,  4.05s/it, lr: 1.0e-04 loss: 3.547e-02]mindexpander_qwen_v1:  19%|#9        | 581/3000 [39:15<2:03:01,  3.05s/it, lr: 1.0e-04 loss: 3.547e-02]mindexpander_qwen_v1:  19%|#9        | 581/3000 [39:15<2:03:01,  3.05s/it, lr: 1.0e-04 loss: 3.547e-02]mindexpander_qwen_v1:  19%|#9        | 581/3000 [39:19<2:03:01,  3.05s/it, lr: 1.0e-04 loss: 1.046e-01]mindexpander_qwen_v1:  19%|#9        | 581/3000 [39:19<2:03:01,  3.05s/it, lr: 1.0e-04 loss: 1.046e-01]mindexpander_qwen_v1:  19%|#9        | 582/3000 [39:19<2:09:44,  3.22s/it, lr: 1.0e-04 loss: 1.046e-01]mindexpander_qwen_v1:  19%|#9        | 582/3000 [39:19<2:09:44,  3.22s/it, lr: 1.0e-04 loss: 1.046e-01]mindexpander_qwen_v1:  19%|#9        | 582/3000 [39:23<2:09:44,  3.22s/it, lr: 1.0e-04 loss: 1.152e-01]mindexpander_qwen_v1:  19%|#9        | 582/3000 [39:23<2:09:44,  3.22s/it, lr: 1.0e-04 loss: 1.152e-01]mindexpander_qwen_v1:  19%|#9        | 583/3000 [39:23<2:16:50,  3.40s/it, lr: 1.0e-04 loss: 1.152e-01]mindexpander_qwen_v1:  19%|#9        | 583/3000 [39:23<2:16:50,  3.40s/it, lr: 1.0e-04 loss: 1.152e-01]mindexpander_qwen_v1:  19%|#9        | 583/3000 [39:27<2:16:50,  3.40s/it, lr: 1.0e-04 loss: 4.438e-02]mindexpander_qwen_v1:  19%|#9        | 583/3000 [39:27<2:16:50,  3.40s/it, lr: 1.0e-04 loss: 4.438e-02]mindexpander_qwen_v1:  19%|#9        | 584/3000 [39:27<2:20:35,  3.49s/it, lr: 1.0e-04 loss: 4.438e-02]mindexpander_qwen_v1:  19%|#9        | 584/3000 [39:27<2:20:35,  3.49s/it, lr: 1.0e-04 loss: 4.438e-02]mindexpander_qwen_v1:  19%|#9        | 584/3000 [39:29<2:20:35,  3.49s/it, lr: 1.0e-04 loss: 9.643e-02]mindexpander_qwen_v1:  19%|#9        | 584/3000 [39:29<2:20:35,  3.49s/it, lr: 1.0e-04 loss: 9.643e-02]mindexpander_qwen_v1:  20%|#9        | 585/3000 [39:29<2:08:52,  3.20s/it, lr: 1.0e-04 loss: 9.643e-02]mindexpander_qwen_v1:  20%|#9        | 585/3000 [39:29<2:08:52,  3.20s/it, lr: 1.0e-04 loss: 9.643e-02]mindexpander_qwen_v1:  20%|#9        | 585/3000 [39:35<2:08:52,  3.20s/it, lr: 1.0e-04 loss: 2.566e-02]mindexpander_qwen_v1:  20%|#9        | 585/3000 [39:35<2:08:52,  3.20s/it, lr: 1.0e-04 loss: 2.566e-02]mindexpander_qwen_v1:  20%|#9        | 586/3000 [39:35<2:38:06,  3.93s/it, lr: 1.0e-04 loss: 2.566e-02]mindexpander_qwen_v1:  20%|#9        | 586/3000 [39:35<2:38:06,  3.93s/it, lr: 1.0e-04 loss: 2.566e-02]mindexpander_qwen_v1:  20%|#9        | 586/3000 [39:38<2:38:06,  3.93s/it, lr: 1.0e-04 loss: 9.502e-02]mindexpander_qwen_v1:  20%|#9        | 586/3000 [39:38<2:38:06,  3.93s/it, lr: 1.0e-04 loss: 9.502e-02]mindexpander_qwen_v1:  20%|#9        | 587/3000 [39:38<2:23:08,  3.56s/it, lr: 1.0e-04 loss: 9.502e-02]mindexpander_qwen_v1:  20%|#9        | 587/3000 [39:38<2:23:08,  3.56s/it, lr: 1.0e-04 loss: 9.502e-02]mindexpander_qwen_v1:  20%|#9        | 587/3000 [39:40<2:23:08,  3.56s/it, lr: 1.0e-04 loss: 3.155e-02]mindexpander_qwen_v1:  20%|#9        | 587/3000 [39:40<2:23:08,  3.56s/it, lr: 1.0e-04 loss: 3.155e-02]mindexpander_qwen_v1:  20%|#9        | 588/3000 [39:40<2:10:02,  3.23s/it, lr: 1.0e-04 loss: 3.155e-02]mindexpander_qwen_v1:  20%|#9        | 588/3000 [39:40<2:10:02,  3.23s/it, lr: 1.0e-04 loss: 3.155e-02]mindexpander_qwen_v1:  20%|#9        | 588/3000 [39:43<2:10:02,  3.23s/it, lr: 1.0e-04 loss: 2.027e-01]mindexpander_qwen_v1:  20%|#9        | 588/3000 [39:43<2:10:02,  3.23s/it, lr: 1.0e-04 loss: 2.027e-01]mindexpander_qwen_v1:  20%|#9        | 589/3000 [39:43<2:00:41,  3.00s/it, lr: 1.0e-04 loss: 2.027e-01]mindexpander_qwen_v1:  20%|#9        | 589/3000 [39:43<2:00:41,  3.00s/it, lr: 1.0e-04 loss: 2.027e-01]mindexpander_qwen_v1:  20%|#9        | 589/3000 [39:48<2:00:41,  3.00s/it, lr: 1.0e-04 loss: 1.172e-01]mindexpander_qwen_v1:  20%|#9        | 589/3000 [39:48<2:00:41,  3.00s/it, lr: 1.0e-04 loss: 1.172e-01]mindexpander_qwen_v1:  20%|#9        | 590/3000 [39:54<2:00:38,  3.00s/it, lr: 1.0e-04 loss: 5.160e-02]mindexpander_qwen_v1:  20%|#9        | 590/3000 [39:54<2:00:38,  3.00s/it, lr: 1.0e-04 loss: 5.160e-02]mindexpander_qwen_v1:  20%|#9        | 591/3000 [39:54<1:59:29,  2.98s/it, lr: 1.0e-04 loss: 5.160e-02]mindexpander_qwen_v1:  20%|#9        | 591/3000 [39:54<1:59:29,  2.98s/it, lr: 1.0e-04 loss: 5.160e-02]mindexpander_qwen_v1:  20%|#9        | 591/3000 [39:58<1:59:29,  2.98s/it, lr: 1.0e-04 loss: 1.954e-01]mindexpander_qwen_v1:  20%|#9        | 591/3000 [39:58<1:59:29,  2.98s/it, lr: 1.0e-04 loss: 1.954e-01]mindexpander_qwen_v1:  20%|#9        | 592/3000 [39:58<2:07:02,  3.17s/it, lr: 1.0e-04 loss: 1.954e-01]mindexpander_qwen_v1:  20%|#9        | 592/3000 [39:58<2:07:02,  3.17s/it, lr: 1.0e-04 loss: 1.954e-01]mindexpander_qwen_v1:  20%|#9        | 592/3000 [40:02<2:07:02,  3.17s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  20%|#9        | 592/3000 [40:02<2:07:02,  3.17s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  20%|#9        | 593/3000 [40:02<2:12:58,  3.31s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  20%|#9        | 593/3000 [40:02<2:12:58,  3.31s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  20%|#9        | 593/3000 [40:04<2:12:58,  3.31s/it, lr: 1.0e-04 loss: 3.261e-02]mindexpander_qwen_v1:  20%|#9        | 593/3000 [40:04<2:12:58,  3.31s/it, lr: 1.0e-04 loss: 3.261e-02]mindexpander_qwen_v1:  20%|#9        | 594/3000 [40:04<2:03:30,  3.08s/it, lr: 1.0e-04 loss: 3.261e-02]mindexpander_qwen_v1:  20%|#9        | 594/3000 [40:04<2:03:30,  3.08s/it, lr: 1.0e-04 loss: 3.261e-02]mindexpander_qwen_v1:  20%|#9        | 594/3000 [40:07<2:03:30,  3.08s/it, lr: 1.0e-04 loss: 1.832e-01]mindexpander_qwen_v1:  20%|#9        | 594/3000 [40:07<2:03:30,  3.08s/it, lr: 1.0e-04 loss: 1.832e-01]mindexpander_qwen_v1:  20%|#9        | 595/3000 [40:07<1:58:38,  2.96s/it, lr: 1.0e-04 loss: 1.832e-01]mindexpander_qwen_v1:  20%|#9        | 595/3000 [40:07<1:58:38,  2.96s/it, lr: 1.0e-04 loss: 1.832e-01]mindexpander_qwen_v1:  20%|#9        | 595/3000 [40:09<1:58:38,  2.96s/it, lr: 1.0e-04 loss: 4.421e-02]mindexpander_qwen_v1:  20%|#9        | 595/3000 [40:09<1:58:38,  2.96s/it, lr: 1.0e-04 loss: 4.421e-02]mindexpander_qwen_v1:  20%|#9        | 596/3000 [40:09<1:52:48,  2.82s/it, lr: 1.0e-04 loss: 4.421e-02]mindexpander_qwen_v1:  20%|#9        | 596/3000 [40:09<1:52:48,  2.82s/it, lr: 1.0e-04 loss: 4.421e-02]mindexpander_qwen_v1:  20%|#9        | 596/3000 [40:15<1:52:48,  2.82s/it, lr: 1.0e-04 loss: 1.642e-02]mindexpander_qwen_v1:  20%|#9        | 596/3000 [40:15<1:52:48,  2.82s/it, lr: 1.0e-04 loss: 1.642e-02]mindexpander_qwen_v1:  20%|#9        | 597/3000 [40:15<2:26:47,  3.67s/it, lr: 1.0e-04 loss: 1.642e-02]mindexpander_qwen_v1:  20%|#9        | 597/3000 [40:15<2:26:47,  3.67s/it, lr: 1.0e-04 loss: 1.642e-02]mindexpander_qwen_v1:  20%|#9        | 597/3000 [40:19<2:26:47,  3.67s/it, lr: 1.0e-04 loss: 1.511e-01]mindexpander_qwen_v1:  20%|#9        | 597/3000 [40:19<2:26:47,  3.67s/it, lr: 1.0e-04 loss: 1.511e-01]mindexpander_qwen_v1:  20%|#9        | 598/3000 [40:19<2:27:35,  3.69s/it, lr: 1.0e-04 loss: 1.511e-01]mindexpander_qwen_v1:  20%|#9        | 598/3000 [40:19<2:27:35,  3.69s/it, lr: 1.0e-04 loss: 1.511e-01]mindexpander_qwen_v1:  20%|#9        | 598/3000 [40:21<2:27:35,  3.69s/it, lr: 1.0e-04 loss: 2.928e-02]mindexpander_qwen_v1:  20%|#9        | 598/3000 [40:21<2:27:35,  3.69s/it, lr: 1.0e-04 loss: 2.928e-02]mindexpander_qwen_v1:  20%|#9        | 599/3000 [40:21<2:15:06,  3.38s/it, lr: 1.0e-04 loss: 2.928e-02]mindexpander_qwen_v1:  20%|#9        | 599/3000 [40:21<2:15:06,  3.38s/it, lr: 1.0e-04 loss: 2.928e-02]mindexpander_qwen_v1:  20%|#9        | 599/3000 [40:26<2:15:06,  3.38s/it, lr: 1.0e-04 loss: 1.912e-01]mindexpander_qwen_v1:  20%|#9        | 599/3000 [40:26<2:15:06,  3.38s/it, lr: 1.0e-04 loss: 1.912e-01]mindexpander_qwen_v1:  20%|##        | 600/3000 [40:29<2:15:02,  3.38s/it, lr: 1.0e-04 loss: 9.151e-02]mindexpander_qwen_v1:  20%|##        | 600/3000 [40:29<2:15:02,  3.38s/it, lr: 1.0e-04 loss: 9.151e-02]mindexpander_qwen_v1:  20%|##        | 601/3000 [40:29<1:47:23,  2.69s/it, lr: 1.0e-04 loss: 9.151e-02]mindexpander_qwen_v1:  20%|##        | 601/3000 [40:29<1:47:23,  2.69s/it, lr: 1.0e-04 loss: 9.151e-02]mindexpander_qwen_v1:  20%|##        | 601/3000 [40:35<1:47:23,  2.69s/it, lr: 1.0e-04 loss: 9.721e-02]mindexpander_qwen_v1:  20%|##        | 601/3000 [40:35<1:47:23,  2.69s/it, lr: 1.0e-04 loss: 9.721e-02]mindexpander_qwen_v1:  20%|##        | 602/3000 [40:35<2:17:35,  3.44s/it, lr: 1.0e-04 loss: 9.721e-02]mindexpander_qwen_v1:  20%|##        | 602/3000 [40:35<2:17:35,  3.44s/it, lr: 1.0e-04 loss: 9.721e-02]mindexpander_qwen_v1:  20%|##        | 602/3000 [40:39<2:17:35,  3.44s/it, lr: 1.0e-04 loss: 9.557e-02]mindexpander_qwen_v1:  20%|##        | 602/3000 [40:39<2:17:35,  3.44s/it, lr: 1.0e-04 loss: 9.557e-02]mindexpander_qwen_v1:  20%|##        | 603/3000 [40:39<2:22:51,  3.58s/it, lr: 1.0e-04 loss: 9.557e-02]mindexpander_qwen_v1:  20%|##        | 603/3000 [40:39<2:22:51,  3.58s/it, lr: 1.0e-04 loss: 9.557e-02]mindexpander_qwen_v1:  20%|##        | 603/3000 [40:45<2:22:51,  3.58s/it, lr: 1.0e-04 loss: 2.227e-02]mindexpander_qwen_v1:  20%|##        | 603/3000 [40:45<2:22:51,  3.58s/it, lr: 1.0e-04 loss: 2.227e-02]mindexpander_qwen_v1:  20%|##        | 604/3000 [40:45<2:46:24,  4.17s/it, lr: 1.0e-04 loss: 2.227e-02]mindexpander_qwen_v1:  20%|##        | 604/3000 [40:45<2:46:24,  4.17s/it, lr: 1.0e-04 loss: 2.227e-02]mindexpander_qwen_v1:  20%|##        | 604/3000 [40:50<2:46:24,  4.17s/it, lr: 1.0e-04 loss: 1.659e-02]mindexpander_qwen_v1:  20%|##        | 604/3000 [40:50<2:46:24,  4.17s/it, lr: 1.0e-04 loss: 1.659e-02]mindexpander_qwen_v1:  20%|##        | 605/3000 [40:50<3:03:59,  4.61s/it, lr: 1.0e-04 loss: 1.659e-02]mindexpander_qwen_v1:  20%|##        | 605/3000 [40:50<3:03:59,  4.61s/it, lr: 1.0e-04 loss: 1.659e-02]mindexpander_qwen_v1:  20%|##        | 605/3000 [40:56<3:03:59,  4.61s/it, lr: 1.0e-04 loss: 4.802e-02]mindexpander_qwen_v1:  20%|##        | 605/3000 [40:56<3:03:59,  4.61s/it, lr: 1.0e-04 loss: 4.802e-02]mindexpander_qwen_v1:  20%|##        | 606/3000 [40:56<3:16:58,  4.94s/it, lr: 1.0e-04 loss: 4.802e-02]mindexpander_qwen_v1:  20%|##        | 606/3000 [40:56<3:16:58,  4.94s/it, lr: 1.0e-04 loss: 4.802e-02]mindexpander_qwen_v1:  20%|##        | 606/3000 [40:59<3:16:58,  4.94s/it, lr: 1.0e-04 loss: 2.625e-02]mindexpander_qwen_v1:  20%|##        | 606/3000 [40:59<3:16:58,  4.94s/it, lr: 1.0e-04 loss: 2.625e-02]mindexpander_qwen_v1:  20%|##        | 607/3000 [40:59<2:50:20,  4.27s/it, lr: 1.0e-04 loss: 2.625e-02]mindexpander_qwen_v1:  20%|##        | 607/3000 [40:59<2:50:20,  4.27s/it, lr: 1.0e-04 loss: 2.625e-02]mindexpander_qwen_v1:  20%|##        | 607/3000 [41:05<2:50:20,  4.27s/it, lr: 1.0e-04 loss: 1.068e-01]mindexpander_qwen_v1:  20%|##        | 607/3000 [41:05<2:50:20,  4.27s/it, lr: 1.0e-04 loss: 1.068e-01]mindexpander_qwen_v1:  20%|##        | 608/3000 [41:05<3:07:35,  4.71s/it, lr: 1.0e-04 loss: 1.068e-01]mindexpander_qwen_v1:  20%|##        | 608/3000 [41:05<3:07:35,  4.71s/it, lr: 1.0e-04 loss: 1.068e-01]mindexpander_qwen_v1:  20%|##        | 608/3000 [41:08<3:07:35,  4.71s/it, lr: 1.0e-04 loss: 1.693e-02]mindexpander_qwen_v1:  20%|##        | 608/3000 [41:08<3:07:35,  4.71s/it, lr: 1.0e-04 loss: 1.693e-02]mindexpander_qwen_v1:  20%|##        | 609/3000 [41:08<2:56:12,  4.42s/it, lr: 1.0e-04 loss: 1.693e-02]mindexpander_qwen_v1:  20%|##        | 609/3000 [41:08<2:56:12,  4.42s/it, lr: 1.0e-04 loss: 1.693e-02]mindexpander_qwen_v1:  20%|##        | 609/3000 [41:12<2:56:12,  4.42s/it, lr: 1.0e-04 loss: 1.381e-01]mindexpander_qwen_v1:  20%|##        | 609/3000 [41:12<2:56:12,  4.42s/it, lr: 1.0e-04 loss: 1.381e-01]mindexpander_qwen_v1:  20%|##        | 610/3000 [41:15<2:56:07,  4.42s/it, lr: 1.0e-04 loss: 1.057e-01]mindexpander_qwen_v1:  20%|##        | 610/3000 [41:15<2:56:07,  4.42s/it, lr: 1.0e-04 loss: 1.057e-01]mindexpander_qwen_v1:  20%|##        | 611/3000 [41:15<1:59:44,  3.01s/it, lr: 1.0e-04 loss: 1.057e-01]mindexpander_qwen_v1:  20%|##        | 611/3000 [41:15<1:59:44,  3.01s/it, lr: 1.0e-04 loss: 1.057e-01]mindexpander_qwen_v1:  20%|##        | 611/3000 [41:17<1:59:44,  3.01s/it, lr: 1.0e-04 loss: 8.412e-02]mindexpander_qwen_v1:  20%|##        | 611/3000 [41:17<1:59:44,  3.01s/it, lr: 1.0e-04 loss: 8.412e-02]mindexpander_qwen_v1:  20%|##        | 612/3000 [41:17<1:54:14,  2.87s/it, lr: 1.0e-04 loss: 8.412e-02]mindexpander_qwen_v1:  20%|##        | 612/3000 [41:17<1:54:14,  2.87s/it, lr: 1.0e-04 loss: 8.412e-02]mindexpander_qwen_v1:  20%|##        | 612/3000 [41:20<1:54:14,  2.87s/it, lr: 1.0e-04 loss: 9.013e-03]mindexpander_qwen_v1:  20%|##        | 612/3000 [41:20<1:54:14,  2.87s/it, lr: 1.0e-04 loss: 9.013e-03]mindexpander_qwen_v1:  20%|##        | 613/3000 [41:20<1:49:51,  2.76s/it, lr: 1.0e-04 loss: 9.013e-03]mindexpander_qwen_v1:  20%|##        | 613/3000 [41:20<1:49:51,  2.76s/it, lr: 1.0e-04 loss: 9.013e-03]mindexpander_qwen_v1:  20%|##        | 613/3000 [41:24<1:49:51,  2.76s/it, lr: 1.0e-04 loss: 1.725e-02]mindexpander_qwen_v1:  20%|##        | 613/3000 [41:24<1:49:51,  2.76s/it, lr: 1.0e-04 loss: 1.725e-02]mindexpander_qwen_v1:  20%|##        | 614/3000 [41:24<2:02:07,  3.07s/it, lr: 1.0e-04 loss: 1.725e-02]mindexpander_qwen_v1:  20%|##        | 614/3000 [41:24<2:02:07,  3.07s/it, lr: 1.0e-04 loss: 1.725e-02]mindexpander_qwen_v1:  20%|##        | 614/3000 [41:29<2:02:07,  3.07s/it, lr: 1.0e-04 loss: 9.021e-02]mindexpander_qwen_v1:  20%|##        | 614/3000 [41:29<2:02:07,  3.07s/it, lr: 1.0e-04 loss: 9.021e-02]mindexpander_qwen_v1:  20%|##        | 615/3000 [41:29<2:31:47,  3.82s/it, lr: 1.0e-04 loss: 9.021e-02]mindexpander_qwen_v1:  20%|##        | 615/3000 [41:29<2:31:47,  3.82s/it, lr: 1.0e-04 loss: 9.021e-02]mindexpander_qwen_v1:  20%|##        | 615/3000 [41:32<2:31:47,  3.82s/it, lr: 1.0e-04 loss: 9.289e-02]mindexpander_qwen_v1:  20%|##        | 615/3000 [41:32<2:31:47,  3.82s/it, lr: 1.0e-04 loss: 9.289e-02]mindexpander_qwen_v1:  21%|##        | 616/3000 [41:32<2:16:15,  3.43s/it, lr: 1.0e-04 loss: 9.289e-02]mindexpander_qwen_v1:  21%|##        | 616/3000 [41:32<2:16:15,  3.43s/it, lr: 1.0e-04 loss: 9.289e-02]mindexpander_qwen_v1:  21%|##        | 616/3000 [41:34<2:16:15,  3.43s/it, lr: 1.0e-04 loss: 2.055e-01]mindexpander_qwen_v1:  21%|##        | 616/3000 [41:34<2:16:15,  3.43s/it, lr: 1.0e-04 loss: 2.055e-01]mindexpander_qwen_v1:  21%|##        | 617/3000 [41:34<2:04:55,  3.15s/it, lr: 1.0e-04 loss: 2.055e-01]mindexpander_qwen_v1:  21%|##        | 617/3000 [41:34<2:04:55,  3.15s/it, lr: 1.0e-04 loss: 2.055e-01]mindexpander_qwen_v1:  21%|##        | 617/3000 [41:38<2:04:55,  3.15s/it, lr: 1.0e-04 loss: 1.322e-01]mindexpander_qwen_v1:  21%|##        | 617/3000 [41:38<2:04:55,  3.15s/it, lr: 1.0e-04 loss: 1.322e-01]mindexpander_qwen_v1:  21%|##        | 618/3000 [41:38<2:13:32,  3.36s/it, lr: 1.0e-04 loss: 1.322e-01]mindexpander_qwen_v1:  21%|##        | 618/3000 [41:38<2:13:32,  3.36s/it, lr: 1.0e-04 loss: 1.322e-01]mindexpander_qwen_v1:  21%|##        | 618/3000 [41:41<2:13:32,  3.36s/it, lr: 1.0e-04 loss: 9.843e-02]mindexpander_qwen_v1:  21%|##        | 618/3000 [41:41<2:13:32,  3.36s/it, lr: 1.0e-04 loss: 9.843e-02]mindexpander_qwen_v1:  21%|##        | 619/3000 [41:41<2:02:44,  3.09s/it, lr: 1.0e-04 loss: 9.843e-02]mindexpander_qwen_v1:  21%|##        | 619/3000 [41:41<2:02:44,  3.09s/it, lr: 1.0e-04 loss: 9.843e-02]mindexpander_qwen_v1:  21%|##        | 619/3000 [41:44<2:02:44,  3.09s/it, lr: 1.0e-04 loss: 1.614e-01]mindexpander_qwen_v1:  21%|##        | 619/3000 [41:44<2:02:44,  3.09s/it, lr: 1.0e-04 loss: 1.614e-01]mindexpander_qwen_v1:  21%|##        | 620/3000 [41:47<2:02:41,  3.09s/it, lr: 1.0e-04 loss: 3.283e-02]mindexpander_qwen_v1:  21%|##        | 620/3000 [41:47<2:02:41,  3.09s/it, lr: 1.0e-04 loss: 3.283e-02]mindexpander_qwen_v1:  21%|##        | 621/3000 [41:47<1:28:46,  2.24s/it, lr: 1.0e-04 loss: 3.283e-02]mindexpander_qwen_v1:  21%|##        | 621/3000 [41:47<1:28:46,  2.24s/it, lr: 1.0e-04 loss: 3.283e-02]mindexpander_qwen_v1:  21%|##        | 621/3000 [41:49<1:28:46,  2.24s/it, lr: 1.0e-04 loss: 3.555e-02]mindexpander_qwen_v1:  21%|##        | 621/3000 [41:49<1:28:46,  2.24s/it, lr: 1.0e-04 loss: 3.555e-02]mindexpander_qwen_v1:  21%|##        | 622/3000 [41:49<1:32:32,  2.34s/it, lr: 1.0e-04 loss: 3.555e-02]mindexpander_qwen_v1:  21%|##        | 622/3000 [41:49<1:32:32,  2.34s/it, lr: 1.0e-04 loss: 3.555e-02]mindexpander_qwen_v1:  21%|##        | 622/3000 [41:55<1:32:32,  2.34s/it, lr: 1.0e-04 loss: 2.910e-02]mindexpander_qwen_v1:  21%|##        | 622/3000 [41:55<1:32:32,  2.34s/it, lr: 1.0e-04 loss: 2.910e-02]mindexpander_qwen_v1:  21%|##        | 623/3000 [41:55<2:07:33,  3.22s/it, lr: 1.0e-04 loss: 2.910e-02]mindexpander_qwen_v1:  21%|##        | 623/3000 [41:55<2:07:33,  3.22s/it, lr: 1.0e-04 loss: 2.910e-02]mindexpander_qwen_v1:  21%|##        | 623/3000 [41:58<2:07:33,  3.22s/it, lr: 1.0e-04 loss: 1.719e-01]mindexpander_qwen_v1:  21%|##        | 623/3000 [41:58<2:07:33,  3.22s/it, lr: 1.0e-04 loss: 1.719e-01]mindexpander_qwen_v1:  21%|##        | 624/3000 [41:58<1:59:11,  3.01s/it, lr: 1.0e-04 loss: 1.719e-01]mindexpander_qwen_v1:  21%|##        | 624/3000 [41:58<1:59:11,  3.01s/it, lr: 1.0e-04 loss: 1.719e-01]mindexpander_qwen_v1:  21%|##        | 624/3000 [42:03<1:59:11,  3.01s/it, lr: 1.0e-04 loss: 1.427e-01]mindexpander_qwen_v1:  21%|##        | 624/3000 [42:03<1:59:11,  3.01s/it, lr: 1.0e-04 loss: 1.427e-01]mindexpander_qwen_v1:  21%|##        | 625/3000 [42:03<2:29:25,  3.77s/it, lr: 1.0e-04 loss: 1.427e-01]mindexpander_qwen_v1:  21%|##        | 625/3000 [42:03<2:29:25,  3.77s/it, lr: 1.0e-04 loss: 1.427e-01]mindexpander_qwen_v1:  21%|##        | 625/3000 [42:07<2:29:25,  3.77s/it, lr: 1.0e-04 loss: 1.282e-01]mindexpander_qwen_v1:  21%|##        | 625/3000 [42:07<2:29:25,  3.77s/it, lr: 1.0e-04 loss: 1.282e-01]mindexpander_qwen_v1:  21%|##        | 626/3000 [42:07<2:30:51,  3.81s/it, lr: 1.0e-04 loss: 1.282e-01]mindexpander_qwen_v1:  21%|##        | 626/3000 [42:07<2:30:51,  3.81s/it, lr: 1.0e-04 loss: 1.282e-01]mindexpander_qwen_v1:  21%|##        | 626/3000 [42:13<2:30:51,  3.81s/it, lr: 1.0e-04 loss: 9.846e-02]mindexpander_qwen_v1:  21%|##        | 626/3000 [42:13<2:30:51,  3.81s/it, lr: 1.0e-04 loss: 9.846e-02]mindexpander_qwen_v1:  21%|##        | 627/3000 [42:13<2:53:00,  4.37s/it, lr: 1.0e-04 loss: 9.846e-02]mindexpander_qwen_v1:  21%|##        | 627/3000 [42:13<2:53:00,  4.37s/it, lr: 1.0e-04 loss: 9.846e-02]mindexpander_qwen_v1:  21%|##        | 627/3000 [42:17<2:53:00,  4.37s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  21%|##        | 627/3000 [42:17<2:53:00,  4.37s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  21%|##        | 628/3000 [42:17<2:45:34,  4.19s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  21%|##        | 628/3000 [42:17<2:45:34,  4.19s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  21%|##        | 628/3000 [42:22<2:45:34,  4.19s/it, lr: 1.0e-04 loss: 1.603e-01]mindexpander_qwen_v1:  21%|##        | 628/3000 [42:22<2:45:34,  4.19s/it, lr: 1.0e-04 loss: 1.603e-01]mindexpander_qwen_v1:  21%|##        | 629/3000 [42:22<3:03:44,  4.65s/it, lr: 1.0e-04 loss: 1.603e-01]mindexpander_qwen_v1:  21%|##        | 629/3000 [42:22<3:03:44,  4.65s/it, lr: 1.0e-04 loss: 1.603e-01]mindexpander_qwen_v1:  21%|##        | 629/3000 [42:26<3:03:44,  4.65s/it, lr: 1.0e-04 loss: 1.772e-01]mindexpander_qwen_v1:  21%|##        | 629/3000 [42:26<3:03:44,  4.65s/it, lr: 1.0e-04 loss: 1.772e-01]mindexpander_qwen_v1:  21%|##1       | 630/3000 [42:29<3:03:39,  4.65s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  21%|##1       | 630/3000 [42:29<3:03:39,  4.65s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  21%|##1       | 631/3000 [42:29<2:13:26,  3.38s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  21%|##1       | 631/3000 [42:29<2:13:26,  3.38s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  21%|##1       | 631/3000 [42:32<2:13:26,  3.38s/it, lr: 1.0e-04 loss: 5.908e-02]mindexpander_qwen_v1:  21%|##1       | 631/3000 [42:32<2:13:26,  3.38s/it, lr: 1.0e-04 loss: 5.908e-02]mindexpander_qwen_v1:  21%|##1       | 632/3000 [42:32<2:04:25,  3.15s/it, lr: 1.0e-04 loss: 5.908e-02]mindexpander_qwen_v1:  21%|##1       | 632/3000 [42:32<2:04:25,  3.15s/it, lr: 1.0e-04 loss: 5.908e-02]mindexpander_qwen_v1:  21%|##1       | 632/3000 [42:34<2:04:25,  3.15s/it, lr: 1.0e-04 loss: 3.385e-02]mindexpander_qwen_v1:  21%|##1       | 632/3000 [42:34<2:04:25,  3.15s/it, lr: 1.0e-04 loss: 3.385e-02]mindexpander_qwen_v1:  21%|##1       | 633/3000 [42:34<1:57:14,  2.97s/it, lr: 1.0e-04 loss: 3.385e-02]mindexpander_qwen_v1:  21%|##1       | 633/3000 [42:34<1:57:14,  2.97s/it, lr: 1.0e-04 loss: 3.385e-02]mindexpander_qwen_v1:  21%|##1       | 633/3000 [42:38<1:57:14,  2.97s/it, lr: 1.0e-04 loss: 1.779e-01]mindexpander_qwen_v1:  21%|##1       | 633/3000 [42:38<1:57:14,  2.97s/it, lr: 1.0e-04 loss: 1.779e-01]mindexpander_qwen_v1:  21%|##1       | 634/3000 [42:38<2:07:08,  3.22s/it, lr: 1.0e-04 loss: 1.779e-01]mindexpander_qwen_v1:  21%|##1       | 634/3000 [42:38<2:07:08,  3.22s/it, lr: 1.0e-04 loss: 1.779e-01]mindexpander_qwen_v1:  21%|##1       | 634/3000 [42:41<2:07:08,  3.22s/it, lr: 1.0e-04 loss: 1.981e-01]mindexpander_qwen_v1:  21%|##1       | 634/3000 [42:41<2:07:08,  3.22s/it, lr: 1.0e-04 loss: 1.981e-01]mindexpander_qwen_v1:  21%|##1       | 635/3000 [42:41<1:58:36,  3.01s/it, lr: 1.0e-04 loss: 1.981e-01]mindexpander_qwen_v1:  21%|##1       | 635/3000 [42:41<1:58:36,  3.01s/it, lr: 1.0e-04 loss: 1.981e-01]mindexpander_qwen_v1:  21%|##1       | 635/3000 [42:44<1:58:36,  3.01s/it, lr: 1.0e-04 loss: 2.326e-02]mindexpander_qwen_v1:  21%|##1       | 635/3000 [42:44<1:58:36,  3.01s/it, lr: 1.0e-04 loss: 2.326e-02]mindexpander_qwen_v1:  21%|##1       | 636/3000 [42:44<2:06:47,  3.22s/it, lr: 1.0e-04 loss: 2.326e-02]mindexpander_qwen_v1:  21%|##1       | 636/3000 [42:44<2:06:47,  3.22s/it, lr: 1.0e-04 loss: 2.326e-02]mindexpander_qwen_v1:  21%|##1       | 636/3000 [42:47<2:06:47,  3.22s/it, lr: 1.0e-04 loss: 1.506e-01]mindexpander_qwen_v1:  21%|##1       | 636/3000 [42:47<2:06:47,  3.22s/it, lr: 1.0e-04 loss: 1.506e-01]mindexpander_qwen_v1:  21%|##1       | 637/3000 [42:47<1:58:00,  3.00s/it, lr: 1.0e-04 loss: 1.506e-01]mindexpander_qwen_v1:  21%|##1       | 637/3000 [42:47<1:58:00,  3.00s/it, lr: 1.0e-04 loss: 1.506e-01]mindexpander_qwen_v1:  21%|##1       | 637/3000 [42:53<1:58:00,  3.00s/it, lr: 1.0e-04 loss: 7.182e-02]mindexpander_qwen_v1:  21%|##1       | 637/3000 [42:53<1:58:00,  3.00s/it, lr: 1.0e-04 loss: 7.182e-02]mindexpander_qwen_v1:  21%|##1       | 638/3000 [42:53<2:31:17,  3.84s/it, lr: 1.0e-04 loss: 7.182e-02]mindexpander_qwen_v1:  21%|##1       | 638/3000 [42:53<2:31:17,  3.84s/it, lr: 1.0e-04 loss: 7.182e-02]mindexpander_qwen_v1:  21%|##1       | 638/3000 [42:58<2:31:17,  3.84s/it, lr: 1.0e-04 loss: 4.227e-02]mindexpander_qwen_v1:  21%|##1       | 638/3000 [42:58<2:31:17,  3.84s/it, lr: 1.0e-04 loss: 4.227e-02]mindexpander_qwen_v1:  21%|##1       | 639/3000 [42:58<2:53:20,  4.41s/it, lr: 1.0e-04 loss: 4.227e-02]mindexpander_qwen_v1:  21%|##1       | 639/3000 [42:58<2:53:20,  4.41s/it, lr: 1.0e-04 loss: 4.227e-02]mindexpander_qwen_v1:  21%|##1       | 639/3000 [43:02<2:53:20,  4.41s/it, lr: 1.0e-04 loss: 2.874e-02]mindexpander_qwen_v1:  21%|##1       | 639/3000 [43:02<2:53:20,  4.41s/it, lr: 1.0e-04 loss: 2.874e-02]mindexpander_qwen_v1:  21%|##1       | 640/3000 [43:06<2:53:16,  4.41s/it, lr: 1.0e-04 loss: 1.401e-01]mindexpander_qwen_v1:  21%|##1       | 640/3000 [43:06<2:53:16,  4.41s/it, lr: 1.0e-04 loss: 1.401e-01]mindexpander_qwen_v1:  21%|##1       | 641/3000 [43:06<2:07:37,  3.25s/it, lr: 1.0e-04 loss: 1.401e-01]mindexpander_qwen_v1:  21%|##1       | 641/3000 [43:06<2:07:37,  3.25s/it, lr: 1.0e-04 loss: 1.401e-01]mindexpander_qwen_v1:  21%|##1       | 641/3000 [43:12<2:07:37,  3.25s/it, lr: 1.0e-04 loss: 1.811e-01]mindexpander_qwen_v1:  21%|##1       | 641/3000 [43:12<2:07:37,  3.25s/it, lr: 1.0e-04 loss: 1.811e-01]mindexpander_qwen_v1:  21%|##1       | 642/3000 [43:12<2:32:55,  3.89s/it, lr: 1.0e-04 loss: 1.811e-01]mindexpander_qwen_v1:  21%|##1       | 642/3000 [43:12<2:32:55,  3.89s/it, lr: 1.0e-04 loss: 1.811e-01]mindexpander_qwen_v1:  21%|##1       | 642/3000 [43:18<2:32:55,  3.89s/it, lr: 1.0e-04 loss: 2.444e-02]mindexpander_qwen_v1:  21%|##1       | 642/3000 [43:18<2:32:55,  3.89s/it, lr: 1.0e-04 loss: 2.444e-02]mindexpander_qwen_v1:  21%|##1       | 643/3000 [43:18<2:51:54,  4.38s/it, lr: 1.0e-04 loss: 2.444e-02]mindexpander_qwen_v1:  21%|##1       | 643/3000 [43:18<2:51:54,  4.38s/it, lr: 1.0e-04 loss: 2.444e-02]mindexpander_qwen_v1:  21%|##1       | 643/3000 [43:21<2:51:54,  4.38s/it, lr: 1.0e-04 loss: 4.399e-02]mindexpander_qwen_v1:  21%|##1       | 643/3000 [43:21<2:51:54,  4.38s/it, lr: 1.0e-04 loss: 4.399e-02]mindexpander_qwen_v1:  21%|##1       | 644/3000 [43:21<2:45:06,  4.20s/it, lr: 1.0e-04 loss: 4.399e-02]mindexpander_qwen_v1:  21%|##1       | 644/3000 [43:21<2:45:06,  4.20s/it, lr: 1.0e-04 loss: 4.399e-02]mindexpander_qwen_v1:  21%|##1       | 644/3000 [43:27<2:45:06,  4.20s/it, lr: 1.0e-04 loss: 1.779e-01]mindexpander_qwen_v1:  21%|##1       | 644/3000 [43:27<2:45:06,  4.20s/it, lr: 1.0e-04 loss: 1.779e-01]mindexpander_qwen_v1:  22%|##1       | 645/3000 [43:27<3:01:59,  4.64s/it, lr: 1.0e-04 loss: 1.779e-01]mindexpander_qwen_v1:  22%|##1       | 645/3000 [43:27<3:01:59,  4.64s/it, lr: 1.0e-04 loss: 1.779e-01]mindexpander_qwen_v1:  22%|##1       | 645/3000 [43:30<3:01:59,  4.64s/it, lr: 1.0e-04 loss: 1.688e-01]mindexpander_qwen_v1:  22%|##1       | 645/3000 [43:30<3:01:59,  4.64s/it, lr: 1.0e-04 loss: 1.688e-01]mindexpander_qwen_v1:  22%|##1       | 646/3000 [43:30<2:39:31,  4.07s/it, lr: 1.0e-04 loss: 1.688e-01]mindexpander_qwen_v1:  22%|##1       | 646/3000 [43:30<2:39:31,  4.07s/it, lr: 1.0e-04 loss: 1.688e-01]mindexpander_qwen_v1:  22%|##1       | 646/3000 [43:35<2:39:31,  4.07s/it, lr: 1.0e-04 loss: 1.532e-01]mindexpander_qwen_v1:  22%|##1       | 646/3000 [43:35<2:39:31,  4.07s/it, lr: 1.0e-04 loss: 1.532e-01]mindexpander_qwen_v1:  22%|##1       | 647/3000 [43:35<2:58:39,  4.56s/it, lr: 1.0e-04 loss: 1.532e-01]mindexpander_qwen_v1:  22%|##1       | 647/3000 [43:35<2:58:39,  4.56s/it, lr: 1.0e-04 loss: 1.532e-01]mindexpander_qwen_v1:  22%|##1       | 647/3000 [43:41<2:58:39,  4.56s/it, lr: 1.0e-04 loss: 3.185e-02]mindexpander_qwen_v1:  22%|##1       | 647/3000 [43:41<2:58:39,  4.56s/it, lr: 1.0e-04 loss: 3.185e-02]mindexpander_qwen_v1:  22%|##1       | 648/3000 [43:41<3:12:23,  4.91s/it, lr: 1.0e-04 loss: 3.185e-02]mindexpander_qwen_v1:  22%|##1       | 648/3000 [43:41<3:12:23,  4.91s/it, lr: 1.0e-04 loss: 3.185e-02]mindexpander_qwen_v1:  22%|##1       | 648/3000 [43:45<3:12:23,  4.91s/it, lr: 1.0e-04 loss: 2.088e-02]mindexpander_qwen_v1:  22%|##1       | 648/3000 [43:45<3:12:23,  4.91s/it, lr: 1.0e-04 loss: 2.088e-02]mindexpander_qwen_v1:  22%|##1       | 649/3000 [43:45<2:58:59,  4.57s/it, lr: 1.0e-04 loss: 2.088e-02]mindexpander_qwen_v1:  22%|##1       | 649/3000 [43:45<2:58:59,  4.57s/it, lr: 1.0e-04 loss: 2.088e-02]mindexpander_qwen_v1:  22%|##1       | 649/3000 [43:49<2:58:59,  4.57s/it, lr: 1.0e-04 loss: 1.478e-01]mindexpander_qwen_v1:  22%|##1       | 649/3000 [43:49<2:58:59,  4.57s/it, lr: 1.0e-04 loss: 1.478e-01]mindexpander_qwen_v1:  22%|##1       | 650/3000 [43:51<2:58:54,  4.57s/it, lr: 1.0e-04 loss: 7.743e-02]mindexpander_qwen_v1:  22%|##1       | 650/3000 [43:51<2:58:54,  4.57s/it, lr: 1.0e-04 loss: 7.743e-02]mindexpander_qwen_v1:  22%|##1       | 651/3000 [43:51<1:59:00,  3.04s/it, lr: 1.0e-04 loss: 7.743e-02]mindexpander_qwen_v1:  22%|##1       | 651/3000 [43:51<1:59:00,  3.04s/it, lr: 1.0e-04 loss: 7.743e-02]mindexpander_qwen_v1:  22%|##1       | 651/3000 [43:55<1:59:00,  3.04s/it, lr: 1.0e-04 loss: 2.057e-02]mindexpander_qwen_v1:  22%|##1       | 651/3000 [43:55<1:59:00,  3.04s/it, lr: 1.0e-04 loss: 2.057e-02]mindexpander_qwen_v1:  22%|##1       | 652/3000 [43:55<2:05:35,  3.21s/it, lr: 1.0e-04 loss: 2.057e-02]mindexpander_qwen_v1:  22%|##1       | 652/3000 [43:55<2:05:35,  3.21s/it, lr: 1.0e-04 loss: 2.057e-02]mindexpander_qwen_v1:  22%|##1       | 652/3000 [43:57<2:05:35,  3.21s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  22%|##1       | 652/3000 [43:57<2:05:35,  3.21s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  22%|##1       | 653/3000 [43:57<1:57:48,  3.01s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  22%|##1       | 653/3000 [43:57<1:57:48,  3.01s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  22%|##1       | 653/3000 [44:03<1:57:48,  3.01s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  22%|##1       | 653/3000 [44:03<1:57:48,  3.01s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  22%|##1       | 654/3000 [44:03<2:28:44,  3.80s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  22%|##1       | 654/3000 [44:03<2:28:44,  3.80s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  22%|##1       | 654/3000 [44:07<2:28:44,  3.80s/it, lr: 1.0e-04 loss: 1.696e-01]mindexpander_qwen_v1:  22%|##1       | 654/3000 [44:07<2:28:44,  3.80s/it, lr: 1.0e-04 loss: 1.696e-01]mindexpander_qwen_v1:  22%|##1       | 655/3000 [44:07<2:28:01,  3.79s/it, lr: 1.0e-04 loss: 1.696e-01]mindexpander_qwen_v1:  22%|##1       | 655/3000 [44:07<2:28:01,  3.79s/it, lr: 1.0e-04 loss: 1.696e-01]mindexpander_qwen_v1:  22%|##1       | 655/3000 [44:10<2:28:01,  3.79s/it, lr: 1.0e-04 loss: 2.067e-02]mindexpander_qwen_v1:  22%|##1       | 655/3000 [44:10<2:28:01,  3.79s/it, lr: 1.0e-04 loss: 2.067e-02]mindexpander_qwen_v1:  22%|##1       | 656/3000 [44:10<2:13:02,  3.41s/it, lr: 1.0e-04 loss: 2.067e-02]mindexpander_qwen_v1:  22%|##1       | 656/3000 [44:10<2:13:02,  3.41s/it, lr: 1.0e-04 loss: 2.067e-02]mindexpander_qwen_v1:  22%|##1       | 656/3000 [44:15<2:13:02,  3.41s/it, lr: 1.0e-04 loss: 1.788e-01]mindexpander_qwen_v1:  22%|##1       | 656/3000 [44:15<2:13:02,  3.41s/it, lr: 1.0e-04 loss: 1.788e-01]mindexpander_qwen_v1:  22%|##1       | 657/3000 [44:15<2:40:59,  4.12s/it, lr: 1.0e-04 loss: 1.788e-01]mindexpander_qwen_v1:  22%|##1       | 657/3000 [44:15<2:40:59,  4.12s/it, lr: 1.0e-04 loss: 1.788e-01]mindexpander_qwen_v1:  22%|##1       | 657/3000 [44:21<2:40:59,  4.12s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  22%|##1       | 657/3000 [44:21<2:40:59,  4.12s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  22%|##1       | 658/3000 [44:21<2:59:31,  4.60s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  22%|##1       | 658/3000 [44:21<2:59:31,  4.60s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  22%|##1       | 658/3000 [44:24<2:59:31,  4.60s/it, lr: 1.0e-04 loss: 1.055e-01]mindexpander_qwen_v1:  22%|##1       | 658/3000 [44:24<2:59:31,  4.60s/it, lr: 1.0e-04 loss: 1.055e-01]mindexpander_qwen_v1:  22%|##1       | 659/3000 [44:24<2:34:43,  3.97s/it, lr: 1.0e-04 loss: 1.055e-01]mindexpander_qwen_v1:  22%|##1       | 659/3000 [44:24<2:34:43,  3.97s/it, lr: 1.0e-04 loss: 1.055e-01]mindexpander_qwen_v1:  22%|##1       | 659/3000 [44:30<2:34:43,  3.97s/it, lr: 1.0e-04 loss: 9.762e-02]mindexpander_qwen_v1:  22%|##1       | 659/3000 [44:30<2:34:43,  3.97s/it, lr: 1.0e-04 loss: 9.762e-02]mindexpander_qwen_v1:  22%|##2       | 660/3000 [44:36<2:34:39,  3.97s/it, lr: 1.0e-04 loss: 7.298e-02]mindexpander_qwen_v1:  22%|##2       | 660/3000 [44:36<2:34:39,  3.97s/it, lr: 1.0e-04 loss: 7.298e-02]mindexpander_qwen_v1:  22%|##2       | 661/3000 [44:36<2:17:09,  3.52s/it, lr: 1.0e-04 loss: 7.298e-02]mindexpander_qwen_v1:  22%|##2       | 661/3000 [44:36<2:17:09,  3.52s/it, lr: 1.0e-04 loss: 7.298e-02]mindexpander_qwen_v1:  22%|##2       | 661/3000 [44:39<2:17:09,  3.52s/it, lr: 1.0e-04 loss: 6.588e-02]mindexpander_qwen_v1:  22%|##2       | 661/3000 [44:39<2:17:09,  3.52s/it, lr: 1.0e-04 loss: 6.588e-02]mindexpander_qwen_v1:  22%|##2       | 662/3000 [44:39<2:19:13,  3.57s/it, lr: 1.0e-04 loss: 6.588e-02]mindexpander_qwen_v1:  22%|##2       | 662/3000 [44:39<2:19:13,  3.57s/it, lr: 1.0e-04 loss: 6.588e-02]mindexpander_qwen_v1:  22%|##2       | 662/3000 [44:45<2:19:13,  3.57s/it, lr: 1.0e-04 loss: 1.518e-01]mindexpander_qwen_v1:  22%|##2       | 662/3000 [44:45<2:19:13,  3.57s/it, lr: 1.0e-04 loss: 1.518e-01]mindexpander_qwen_v1:  22%|##2       | 663/3000 [44:45<2:41:17,  4.14s/it, lr: 1.0e-04 loss: 1.518e-01]mindexpander_qwen_v1:  22%|##2       | 663/3000 [44:45<2:41:17,  4.14s/it, lr: 1.0e-04 loss: 1.518e-01]mindexpander_qwen_v1:  22%|##2       | 663/3000 [44:49<2:41:17,  4.14s/it, lr: 1.0e-04 loss: 3.540e-02]mindexpander_qwen_v1:  22%|##2       | 663/3000 [44:49<2:41:17,  4.14s/it, lr: 1.0e-04 loss: 3.540e-02]mindexpander_qwen_v1:  22%|##2       | 664/3000 [44:49<2:37:08,  4.04s/it, lr: 1.0e-04 loss: 3.540e-02]mindexpander_qwen_v1:  22%|##2       | 664/3000 [44:49<2:37:08,  4.04s/it, lr: 1.0e-04 loss: 3.540e-02]mindexpander_qwen_v1:  22%|##2       | 664/3000 [44:52<2:37:08,  4.04s/it, lr: 1.0e-04 loss: 6.939e-02]mindexpander_qwen_v1:  22%|##2       | 664/3000 [44:52<2:37:08,  4.04s/it, lr: 1.0e-04 loss: 6.939e-02]mindexpander_qwen_v1:  22%|##2       | 665/3000 [44:52<2:22:15,  3.66s/it, lr: 1.0e-04 loss: 6.939e-02]mindexpander_qwen_v1:  22%|##2       | 665/3000 [44:52<2:22:15,  3.66s/it, lr: 1.0e-04 loss: 6.939e-02]mindexpander_qwen_v1:  22%|##2       | 665/3000 [44:57<2:22:15,  3.66s/it, lr: 1.0e-04 loss: 1.247e-01]mindexpander_qwen_v1:  22%|##2       | 665/3000 [44:57<2:22:15,  3.66s/it, lr: 1.0e-04 loss: 1.247e-01]mindexpander_qwen_v1:  22%|##2       | 666/3000 [44:57<2:45:26,  4.25s/it, lr: 1.0e-04 loss: 1.247e-01]mindexpander_qwen_v1:  22%|##2       | 666/3000 [44:57<2:45:26,  4.25s/it, lr: 1.0e-04 loss: 1.247e-01]mindexpander_qwen_v1:  22%|##2       | 666/3000 [45:01<2:45:26,  4.25s/it, lr: 1.0e-04 loss: 1.082e-01]mindexpander_qwen_v1:  22%|##2       | 666/3000 [45:01<2:45:26,  4.25s/it, lr: 1.0e-04 loss: 1.082e-01]mindexpander_qwen_v1:  22%|##2       | 667/3000 [45:01<2:39:26,  4.10s/it, lr: 1.0e-04 loss: 1.082e-01]mindexpander_qwen_v1:  22%|##2       | 667/3000 [45:01<2:39:26,  4.10s/it, lr: 1.0e-04 loss: 1.082e-01]mindexpander_qwen_v1:  22%|##2       | 667/3000 [45:04<2:39:26,  4.10s/it, lr: 1.0e-04 loss: 3.389e-02]mindexpander_qwen_v1:  22%|##2       | 667/3000 [45:04<2:39:26,  4.10s/it, lr: 1.0e-04 loss: 3.389e-02]mindexpander_qwen_v1:  22%|##2       | 668/3000 [45:04<2:20:42,  3.62s/it, lr: 1.0e-04 loss: 3.389e-02]mindexpander_qwen_v1:  22%|##2       | 668/3000 [45:04<2:20:42,  3.62s/it, lr: 1.0e-04 loss: 3.389e-02]mindexpander_qwen_v1:  22%|##2       | 668/3000 [45:09<2:20:42,  3.62s/it, lr: 1.0e-04 loss: 1.494e-01]mindexpander_qwen_v1:  22%|##2       | 668/3000 [45:09<2:20:42,  3.62s/it, lr: 1.0e-04 loss: 1.494e-01]mindexpander_qwen_v1:  22%|##2       | 669/3000 [45:09<2:46:29,  4.29s/it, lr: 1.0e-04 loss: 1.494e-01]mindexpander_qwen_v1:  22%|##2       | 669/3000 [45:09<2:46:29,  4.29s/it, lr: 1.0e-04 loss: 1.494e-01]mindexpander_qwen_v1:  22%|##2       | 669/3000 [45:12<2:46:29,  4.29s/it, lr: 1.0e-04 loss: 3.611e-02]mindexpander_qwen_v1:  22%|##2       | 669/3000 [45:12<2:46:29,  4.29s/it, lr: 1.0e-04 loss: 3.611e-02]mindexpander_qwen_v1:  22%|##2       | 670/3000 [45:18<2:46:25,  4.29s/it, lr: 1.0e-04 loss: 1.626e-01]mindexpander_qwen_v1:  22%|##2       | 670/3000 [45:18<2:46:25,  4.29s/it, lr: 1.0e-04 loss: 1.626e-01]mindexpander_qwen_v1:  22%|##2       | 671/3000 [45:18<2:21:21,  3.64s/it, lr: 1.0e-04 loss: 1.626e-01]mindexpander_qwen_v1:  22%|##2       | 671/3000 [45:18<2:21:21,  3.64s/it, lr: 1.0e-04 loss: 1.626e-01]mindexpander_qwen_v1:  22%|##2       | 671/3000 [45:23<2:21:21,  3.64s/it, lr: 1.0e-04 loss: 3.258e-03]mindexpander_qwen_v1:  22%|##2       | 671/3000 [45:23<2:21:21,  3.64s/it, lr: 1.0e-04 loss: 3.258e-03]mindexpander_qwen_v1:  22%|##2       | 672/3000 [45:23<2:41:25,  4.16s/it, lr: 1.0e-04 loss: 3.258e-03]mindexpander_qwen_v1:  22%|##2       | 672/3000 [45:23<2:41:25,  4.16s/it, lr: 1.0e-04 loss: 3.258e-03]mindexpander_qwen_v1:  22%|##2       | 672/3000 [45:27<2:41:25,  4.16s/it, lr: 1.0e-04 loss: 9.976e-02]mindexpander_qwen_v1:  22%|##2       | 672/3000 [45:27<2:41:25,  4.16s/it, lr: 1.0e-04 loss: 9.976e-02]mindexpander_qwen_v1:  22%|##2       | 673/3000 [45:27<2:38:47,  4.09s/it, lr: 1.0e-04 loss: 9.976e-02]mindexpander_qwen_v1:  22%|##2       | 673/3000 [45:27<2:38:47,  4.09s/it, lr: 1.0e-04 loss: 9.976e-02]mindexpander_qwen_v1:  22%|##2       | 673/3000 [45:31<2:38:47,  4.09s/it, lr: 1.0e-04 loss: 3.407e-02]mindexpander_qwen_v1:  22%|##2       | 673/3000 [45:31<2:38:47,  4.09s/it, lr: 1.0e-04 loss: 3.407e-02]mindexpander_qwen_v1:  22%|##2       | 674/3000 [45:31<2:34:52,  4.00s/it, lr: 1.0e-04 loss: 3.407e-02]mindexpander_qwen_v1:  22%|##2       | 674/3000 [45:31<2:34:52,  4.00s/it, lr: 1.0e-04 loss: 3.407e-02]mindexpander_qwen_v1:  22%|##2       | 674/3000 [45:33<2:34:52,  4.00s/it, lr: 1.0e-04 loss: 6.886e-02]mindexpander_qwen_v1:  22%|##2       | 674/3000 [45:33<2:34:52,  4.00s/it, lr: 1.0e-04 loss: 6.886e-02]mindexpander_qwen_v1:  22%|##2       | 675/3000 [45:33<2:18:17,  3.57s/it, lr: 1.0e-04 loss: 6.886e-02]mindexpander_qwen_v1:  22%|##2       | 675/3000 [45:33<2:18:17,  3.57s/it, lr: 1.0e-04 loss: 6.886e-02]mindexpander_qwen_v1:  22%|##2       | 675/3000 [45:37<2:18:17,  3.57s/it, lr: 1.0e-04 loss: 1.305e-02]mindexpander_qwen_v1:  22%|##2       | 675/3000 [45:37<2:18:17,  3.57s/it, lr: 1.0e-04 loss: 1.305e-02]mindexpander_qwen_v1:  23%|##2       | 676/3000 [45:37<2:20:20,  3.62s/it, lr: 1.0e-04 loss: 1.305e-02]mindexpander_qwen_v1:  23%|##2       | 676/3000 [45:37<2:20:20,  3.62s/it, lr: 1.0e-04 loss: 1.305e-02]mindexpander_qwen_v1:  23%|##2       | 676/3000 [45:40<2:20:20,  3.62s/it, lr: 1.0e-04 loss: 5.359e-03]mindexpander_qwen_v1:  23%|##2       | 676/3000 [45:40<2:20:20,  3.62s/it, lr: 1.0e-04 loss: 5.359e-03]mindexpander_qwen_v1:  23%|##2       | 677/3000 [45:40<2:09:33,  3.35s/it, lr: 1.0e-04 loss: 5.359e-03]mindexpander_qwen_v1:  23%|##2       | 677/3000 [45:40<2:09:33,  3.35s/it, lr: 1.0e-04 loss: 5.359e-03]mindexpander_qwen_v1:  23%|##2       | 677/3000 [45:44<2:09:33,  3.35s/it, lr: 1.0e-04 loss: 1.275e-01]mindexpander_qwen_v1:  23%|##2       | 677/3000 [45:44<2:09:33,  3.35s/it, lr: 1.0e-04 loss: 1.275e-01]mindexpander_qwen_v1:  23%|##2       | 678/3000 [45:44<2:14:17,  3.47s/it, lr: 1.0e-04 loss: 1.275e-01]mindexpander_qwen_v1:  23%|##2       | 678/3000 [45:44<2:14:17,  3.47s/it, lr: 1.0e-04 loss: 1.275e-01]mindexpander_qwen_v1:  23%|##2       | 678/3000 [45:49<2:14:17,  3.47s/it, lr: 1.0e-04 loss: 1.874e-01]mindexpander_qwen_v1:  23%|##2       | 678/3000 [45:49<2:14:17,  3.47s/it, lr: 1.0e-04 loss: 1.874e-01]mindexpander_qwen_v1:  23%|##2       | 679/3000 [45:49<2:40:33,  4.15s/it, lr: 1.0e-04 loss: 1.874e-01]mindexpander_qwen_v1:  23%|##2       | 679/3000 [45:49<2:40:33,  4.15s/it, lr: 1.0e-04 loss: 1.874e-01]mindexpander_qwen_v1:  23%|##2       | 679/3000 [45:53<2:40:33,  4.15s/it, lr: 1.0e-04 loss: 1.731e-02]mindexpander_qwen_v1:  23%|##2       | 679/3000 [45:53<2:40:33,  4.15s/it, lr: 1.0e-04 loss: 1.731e-02]mindexpander_qwen_v1:  23%|##2       | 680/3000 [45:56<2:40:28,  4.15s/it, lr: 1.0e-04 loss: 1.293e-01]mindexpander_qwen_v1:  23%|##2       | 680/3000 [45:56<2:40:28,  4.15s/it, lr: 1.0e-04 loss: 1.293e-01]mindexpander_qwen_v1:  23%|##2       | 681/3000 [45:56<1:50:28,  2.86s/it, lr: 1.0e-04 loss: 1.293e-01]mindexpander_qwen_v1:  23%|##2       | 681/3000 [45:56<1:50:28,  2.86s/it, lr: 1.0e-04 loss: 1.293e-01]mindexpander_qwen_v1:  23%|##2       | 681/3000 [45:58<1:50:28,  2.86s/it, lr: 1.0e-04 loss: 2.006e-01]mindexpander_qwen_v1:  23%|##2       | 681/3000 [45:58<1:50:28,  2.86s/it, lr: 1.0e-04 loss: 2.006e-01]mindexpander_qwen_v1:  23%|##2       | 682/3000 [45:58<1:46:47,  2.76s/it, lr: 1.0e-04 loss: 2.006e-01]mindexpander_qwen_v1:  23%|##2       | 682/3000 [45:58<1:46:47,  2.76s/it, lr: 1.0e-04 loss: 2.006e-01]mindexpander_qwen_v1:  23%|##2       | 682/3000 [46:01<1:46:47,  2.76s/it, lr: 1.0e-04 loss: 1.546e-01]mindexpander_qwen_v1:  23%|##2       | 682/3000 [46:01<1:46:47,  2.76s/it, lr: 1.0e-04 loss: 1.546e-01]mindexpander_qwen_v1:  23%|##2       | 683/3000 [46:01<1:43:38,  2.68s/it, lr: 1.0e-04 loss: 1.546e-01]mindexpander_qwen_v1:  23%|##2       | 683/3000 [46:01<1:43:38,  2.68s/it, lr: 1.0e-04 loss: 1.546e-01]mindexpander_qwen_v1:  23%|##2       | 683/3000 [46:07<1:43:38,  2.68s/it, lr: 1.0e-04 loss: 2.793e-02]mindexpander_qwen_v1:  23%|##2       | 683/3000 [46:07<1:43:38,  2.68s/it, lr: 1.0e-04 loss: 2.793e-02]mindexpander_qwen_v1:  23%|##2       | 684/3000 [46:07<2:15:50,  3.52s/it, lr: 1.0e-04 loss: 2.793e-02]mindexpander_qwen_v1:  23%|##2       | 684/3000 [46:07<2:15:50,  3.52s/it, lr: 1.0e-04 loss: 2.793e-02]mindexpander_qwen_v1:  23%|##2       | 684/3000 [46:09<2:15:50,  3.52s/it, lr: 1.0e-04 loss: 1.326e-01]mindexpander_qwen_v1:  23%|##2       | 684/3000 [46:09<2:15:50,  3.52s/it, lr: 1.0e-04 loss: 1.326e-01]mindexpander_qwen_v1:  23%|##2       | 685/3000 [46:09<2:06:24,  3.28s/it, lr: 1.0e-04 loss: 1.326e-01]mindexpander_qwen_v1:  23%|##2       | 685/3000 [46:09<2:06:24,  3.28s/it, lr: 1.0e-04 loss: 1.326e-01]mindexpander_qwen_v1:  23%|##2       | 685/3000 [46:15<2:06:24,  3.28s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  23%|##2       | 685/3000 [46:15<2:06:24,  3.28s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  23%|##2       | 686/3000 [46:15<2:33:40,  3.98s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  23%|##2       | 686/3000 [46:15<2:33:40,  3.98s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  23%|##2       | 686/3000 [46:19<2:33:40,  3.98s/it, lr: 1.0e-04 loss: 1.388e-01]mindexpander_qwen_v1:  23%|##2       | 686/3000 [46:19<2:33:40,  3.98s/it, lr: 1.0e-04 loss: 1.388e-01]mindexpander_qwen_v1:  23%|##2       | 687/3000 [46:19<2:30:58,  3.92s/it, lr: 1.0e-04 loss: 1.388e-01]mindexpander_qwen_v1:  23%|##2       | 687/3000 [46:19<2:30:58,  3.92s/it, lr: 1.0e-04 loss: 1.388e-01]mindexpander_qwen_v1:  23%|##2       | 687/3000 [46:21<2:30:58,  3.92s/it, lr: 1.0e-04 loss: 1.866e-02]mindexpander_qwen_v1:  23%|##2       | 687/3000 [46:21<2:30:58,  3.92s/it, lr: 1.0e-04 loss: 1.866e-02]mindexpander_qwen_v1:  23%|##2       | 688/3000 [46:21<2:14:32,  3.49s/it, lr: 1.0e-04 loss: 1.866e-02]mindexpander_qwen_v1:  23%|##2       | 688/3000 [46:21<2:14:32,  3.49s/it, lr: 1.0e-04 loss: 1.866e-02]mindexpander_qwen_v1:  23%|##2       | 688/3000 [46:25<2:14:32,  3.49s/it, lr: 1.0e-04 loss: 4.448e-02]mindexpander_qwen_v1:  23%|##2       | 688/3000 [46:25<2:14:32,  3.49s/it, lr: 1.0e-04 loss: 4.448e-02]mindexpander_qwen_v1:  23%|##2       | 689/3000 [46:25<2:18:55,  3.61s/it, lr: 1.0e-04 loss: 4.448e-02]mindexpander_qwen_v1:  23%|##2       | 689/3000 [46:25<2:18:55,  3.61s/it, lr: 1.0e-04 loss: 4.448e-02]mindexpander_qwen_v1:  23%|##2       | 689/3000 [46:29<2:18:55,  3.61s/it, lr: 1.0e-04 loss: 6.818e-02]mindexpander_qwen_v1:  23%|##2       | 689/3000 [46:29<2:18:55,  3.61s/it, lr: 1.0e-04 loss: 6.818e-02]mindexpander_qwen_v1:  23%|##3       | 690/3000 [46:35<2:18:52,  3.61s/it, lr: 1.0e-04 loss: 5.699e-02]mindexpander_qwen_v1:  23%|##3       | 690/3000 [46:35<2:18:52,  3.61s/it, lr: 1.0e-04 loss: 5.699e-02]mindexpander_qwen_v1:  23%|##3       | 691/3000 [46:35<2:06:00,  3.27s/it, lr: 1.0e-04 loss: 5.699e-02]mindexpander_qwen_v1:  23%|##3       | 691/3000 [46:35<2:06:00,  3.27s/it, lr: 1.0e-04 loss: 5.699e-02]mindexpander_qwen_v1:  23%|##3       | 691/3000 [46:39<2:06:00,  3.27s/it, lr: 1.0e-04 loss: 1.569e-01]mindexpander_qwen_v1:  23%|##3       | 691/3000 [46:39<2:06:00,  3.27s/it, lr: 1.0e-04 loss: 1.569e-01]mindexpander_qwen_v1:  23%|##3       | 692/3000 [46:39<2:10:19,  3.39s/it, lr: 1.0e-04 loss: 1.569e-01]mindexpander_qwen_v1:  23%|##3       | 692/3000 [46:39<2:10:19,  3.39s/it, lr: 1.0e-04 loss: 1.569e-01]mindexpander_qwen_v1:  23%|##3       | 692/3000 [46:43<2:10:19,  3.39s/it, lr: 1.0e-04 loss: 8.863e-02]mindexpander_qwen_v1:  23%|##3       | 692/3000 [46:43<2:10:19,  3.39s/it, lr: 1.0e-04 loss: 8.863e-02]mindexpander_qwen_v1:  23%|##3       | 693/3000 [46:43<2:16:01,  3.54s/it, lr: 1.0e-04 loss: 8.863e-02]mindexpander_qwen_v1:  23%|##3       | 693/3000 [46:43<2:16:01,  3.54s/it, lr: 1.0e-04 loss: 8.863e-02]mindexpander_qwen_v1:  23%|##3       | 693/3000 [46:46<2:16:01,  3.54s/it, lr: 1.0e-04 loss: 9.581e-02]mindexpander_qwen_v1:  23%|##3       | 693/3000 [46:46<2:16:01,  3.54s/it, lr: 1.0e-04 loss: 9.581e-02]mindexpander_qwen_v1:  23%|##3       | 694/3000 [46:46<2:18:03,  3.59s/it, lr: 1.0e-04 loss: 9.581e-02]mindexpander_qwen_v1:  23%|##3       | 694/3000 [46:46<2:18:03,  3.59s/it, lr: 1.0e-04 loss: 9.581e-02]mindexpander_qwen_v1:  23%|##3       | 694/3000 [46:49<2:18:03,  3.59s/it, lr: 1.0e-04 loss: 6.886e-02]mindexpander_qwen_v1:  23%|##3       | 694/3000 [46:49<2:18:03,  3.59s/it, lr: 1.0e-04 loss: 6.886e-02]mindexpander_qwen_v1:  23%|##3       | 695/3000 [46:49<2:06:03,  3.28s/it, lr: 1.0e-04 loss: 6.886e-02]mindexpander_qwen_v1:  23%|##3       | 695/3000 [46:49<2:06:03,  3.28s/it, lr: 1.0e-04 loss: 6.886e-02]mindexpander_qwen_v1:  23%|##3       | 695/3000 [46:51<2:06:03,  3.28s/it, lr: 1.0e-04 loss: 3.392e-02]mindexpander_qwen_v1:  23%|##3       | 695/3000 [46:51<2:06:03,  3.28s/it, lr: 1.0e-04 loss: 3.392e-02]mindexpander_qwen_v1:  23%|##3       | 696/3000 [46:51<1:59:19,  3.11s/it, lr: 1.0e-04 loss: 3.392e-02]mindexpander_qwen_v1:  23%|##3       | 696/3000 [46:51<1:59:19,  3.11s/it, lr: 1.0e-04 loss: 3.392e-02]mindexpander_qwen_v1:  23%|##3       | 696/3000 [46:55<1:59:19,  3.11s/it, lr: 1.0e-04 loss: 1.947e-01]mindexpander_qwen_v1:  23%|##3       | 696/3000 [46:55<1:59:19,  3.11s/it, lr: 1.0e-04 loss: 1.947e-01]mindexpander_qwen_v1:  23%|##3       | 697/3000 [46:55<2:06:26,  3.29s/it, lr: 1.0e-04 loss: 1.947e-01]mindexpander_qwen_v1:  23%|##3       | 697/3000 [46:55<2:06:26,  3.29s/it, lr: 1.0e-04 loss: 1.947e-01]mindexpander_qwen_v1:  23%|##3       | 697/3000 [47:01<2:06:26,  3.29s/it, lr: 1.0e-04 loss: 1.095e-01]mindexpander_qwen_v1:  23%|##3       | 697/3000 [47:01<2:06:26,  3.29s/it, lr: 1.0e-04 loss: 1.095e-01]mindexpander_qwen_v1:  23%|##3       | 698/3000 [47:01<2:34:14,  4.02s/it, lr: 1.0e-04 loss: 1.095e-01]mindexpander_qwen_v1:  23%|##3       | 698/3000 [47:01<2:34:14,  4.02s/it, lr: 1.0e-04 loss: 1.095e-01]mindexpander_qwen_v1:  23%|##3       | 698/3000 [47:05<2:34:14,  4.02s/it, lr: 1.0e-04 loss: 3.226e-02]mindexpander_qwen_v1:  23%|##3       | 698/3000 [47:05<2:34:14,  4.02s/it, lr: 1.0e-04 loss: 3.226e-02]mindexpander_qwen_v1:  23%|##3       | 699/3000 [47:05<2:31:02,  3.94s/it, lr: 1.0e-04 loss: 3.226e-02]mindexpander_qwen_v1:  23%|##3       | 699/3000 [47:05<2:31:02,  3.94s/it, lr: 1.0e-04 loss: 3.226e-02]mindexpander_qwen_v1:  23%|##3       | 699/3000 [47:11<2:31:02,  3.94s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  23%|##3       | 699/3000 [47:11<2:31:02,  3.94s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  23%|##3       | 700/3000 [47:16<2:30:58,  3.94s/it, lr: 1.0e-04 loss: 2.439e-02]mindexpander_qwen_v1:  23%|##3       | 700/3000 [47:16<2:30:58,  3.94s/it, lr: 1.0e-04 loss: 2.439e-02]mindexpander_qwen_v1:  23%|##3       | 701/3000 [47:16<2:12:24,  3.46s/it, lr: 1.0e-04 loss: 2.439e-02]mindexpander_qwen_v1:  23%|##3       | 701/3000 [47:16<2:12:24,  3.46s/it, lr: 1.0e-04 loss: 2.439e-02]mindexpander_qwen_v1:  23%|##3       | 701/3000 [47:22<2:12:24,  3.46s/it, lr: 1.0e-04 loss: 1.872e-01]mindexpander_qwen_v1:  23%|##3       | 701/3000 [47:22<2:12:24,  3.46s/it, lr: 1.0e-04 loss: 1.872e-01]mindexpander_qwen_v1:  23%|##3       | 702/3000 [47:22<2:34:04,  4.02s/it, lr: 1.0e-04 loss: 1.872e-01]mindexpander_qwen_v1:  23%|##3       | 702/3000 [47:22<2:34:04,  4.02s/it, lr: 1.0e-04 loss: 1.872e-01]mindexpander_qwen_v1:  23%|##3       | 702/3000 [47:28<2:34:04,  4.02s/it, lr: 1.0e-04 loss: 9.381e-02]mindexpander_qwen_v1:  23%|##3       | 702/3000 [47:28<2:34:04,  4.02s/it, lr: 1.0e-04 loss: 9.381e-02]mindexpander_qwen_v1:  23%|##3       | 703/3000 [47:28<2:51:18,  4.47s/it, lr: 1.0e-04 loss: 9.381e-02]mindexpander_qwen_v1:  23%|##3       | 703/3000 [47:28<2:51:18,  4.47s/it, lr: 1.0e-04 loss: 9.381e-02]mindexpander_qwen_v1:  23%|##3       | 703/3000 [47:34<2:51:18,  4.47s/it, lr: 1.0e-04 loss: 1.311e-01]mindexpander_qwen_v1:  23%|##3       | 703/3000 [47:34<2:51:18,  4.47s/it, lr: 1.0e-04 loss: 1.311e-01]mindexpander_qwen_v1:  23%|##3       | 704/3000 [47:34<3:06:06,  4.86s/it, lr: 1.0e-04 loss: 1.311e-01]mindexpander_qwen_v1:  23%|##3       | 704/3000 [47:34<3:06:06,  4.86s/it, lr: 1.0e-04 loss: 1.311e-01]mindexpander_qwen_v1:  23%|##3       | 704/3000 [47:38<3:06:06,  4.86s/it, lr: 1.0e-04 loss: 7.000e-02]mindexpander_qwen_v1:  23%|##3       | 704/3000 [47:38<3:06:06,  4.86s/it, lr: 1.0e-04 loss: 7.000e-02]mindexpander_qwen_v1:  24%|##3       | 705/3000 [47:38<2:53:58,  4.55s/it, lr: 1.0e-04 loss: 7.000e-02]mindexpander_qwen_v1:  24%|##3       | 705/3000 [47:38<2:53:58,  4.55s/it, lr: 1.0e-04 loss: 7.000e-02]mindexpander_qwen_v1:  24%|##3       | 705/3000 [47:43<2:53:58,  4.55s/it, lr: 1.0e-04 loss: 3.641e-02]mindexpander_qwen_v1:  24%|##3       | 705/3000 [47:43<2:53:58,  4.55s/it, lr: 1.0e-04 loss: 3.641e-02]mindexpander_qwen_v1:  24%|##3       | 706/3000 [47:43<3:07:03,  4.89s/it, lr: 1.0e-04 loss: 3.641e-02]mindexpander_qwen_v1:  24%|##3       | 706/3000 [47:43<3:07:03,  4.89s/it, lr: 1.0e-04 loss: 3.641e-02]mindexpander_qwen_v1:  24%|##3       | 706/3000 [47:46<3:07:03,  4.89s/it, lr: 1.0e-04 loss: 3.519e-02]mindexpander_qwen_v1:  24%|##3       | 706/3000 [47:46<3:07:03,  4.89s/it, lr: 1.0e-04 loss: 3.519e-02]mindexpander_qwen_v1:  24%|##3       | 707/3000 [47:46<2:39:57,  4.19s/it, lr: 1.0e-04 loss: 3.519e-02]mindexpander_qwen_v1:  24%|##3       | 707/3000 [47:46<2:39:57,  4.19s/it, lr: 1.0e-04 loss: 3.519e-02]mindexpander_qwen_v1:  24%|##3       | 707/3000 [47:52<2:39:57,  4.19s/it, lr: 1.0e-04 loss: 1.064e-01]mindexpander_qwen_v1:  24%|##3       | 707/3000 [47:52<2:39:57,  4.19s/it, lr: 1.0e-04 loss: 1.064e-01]mindexpander_qwen_v1:  24%|##3       | 708/3000 [47:52<2:59:05,  4.69s/it, lr: 1.0e-04 loss: 1.064e-01]mindexpander_qwen_v1:  24%|##3       | 708/3000 [47:52<2:59:05,  4.69s/it, lr: 1.0e-04 loss: 1.064e-01]mindexpander_qwen_v1:  24%|##3       | 708/3000 [47:57<2:59:05,  4.69s/it, lr: 1.0e-04 loss: 4.276e-02]mindexpander_qwen_v1:  24%|##3       | 708/3000 [47:57<2:59:05,  4.69s/it, lr: 1.0e-04 loss: 4.276e-02]mindexpander_qwen_v1:  24%|##3       | 709/3000 [47:57<3:11:05,  5.00s/it, lr: 1.0e-04 loss: 4.276e-02]mindexpander_qwen_v1:  24%|##3       | 709/3000 [47:57<3:11:05,  5.00s/it, lr: 1.0e-04 loss: 4.276e-02]mindexpander_qwen_v1:  24%|##3       | 709/3000 [48:01<3:11:05,  5.00s/it, lr: 1.0e-04 loss: 4.449e-02]mindexpander_qwen_v1:  24%|##3       | 709/3000 [48:01<3:11:05,  5.00s/it, lr: 1.0e-04 loss: 4.449e-02]mindexpander_qwen_v1:  24%|##3       | 710/3000 [48:04<3:11:00,  5.00s/it, lr: 1.0e-04 loss: 1.587e-01]mindexpander_qwen_v1:  24%|##3       | 710/3000 [48:04<3:11:00,  5.00s/it, lr: 1.0e-04 loss: 1.587e-01]mindexpander_qwen_v1:  24%|##3       | 711/3000 [48:04<2:05:04,  3.28s/it, lr: 1.0e-04 loss: 1.587e-01]mindexpander_qwen_v1:  24%|##3       | 711/3000 [48:04<2:05:04,  3.28s/it, lr: 1.0e-04 loss: 1.587e-01]mindexpander_qwen_v1:  24%|##3       | 711/3000 [48:06<2:05:04,  3.28s/it, lr: 1.0e-04 loss: 3.294e-02]mindexpander_qwen_v1:  24%|##3       | 711/3000 [48:06<2:05:04,  3.28s/it, lr: 1.0e-04 loss: 3.294e-02]mindexpander_qwen_v1:  24%|##3       | 712/3000 [48:06<1:59:02,  3.12s/it, lr: 1.0e-04 loss: 3.294e-02]mindexpander_qwen_v1:  24%|##3       | 712/3000 [48:06<1:59:02,  3.12s/it, lr: 1.0e-04 loss: 3.294e-02]mindexpander_qwen_v1:  24%|##3       | 712/3000 [48:09<1:59:02,  3.12s/it, lr: 1.0e-04 loss: 1.888e-01]mindexpander_qwen_v1:  24%|##3       | 712/3000 [48:09<1:59:02,  3.12s/it, lr: 1.0e-04 loss: 1.888e-01]mindexpander_qwen_v1:  24%|##3       | 713/3000 [48:09<1:52:21,  2.95s/it, lr: 1.0e-04 loss: 1.888e-01]mindexpander_qwen_v1:  24%|##3       | 713/3000 [48:09<1:52:21,  2.95s/it, lr: 1.0e-04 loss: 1.888e-01]mindexpander_qwen_v1:  24%|##3       | 713/3000 [48:12<1:52:21,  2.95s/it, lr: 1.0e-04 loss: 1.012e-01]mindexpander_qwen_v1:  24%|##3       | 713/3000 [48:12<1:52:21,  2.95s/it, lr: 1.0e-04 loss: 1.012e-01]mindexpander_qwen_v1:  24%|##3       | 714/3000 [48:12<2:00:31,  3.16s/it, lr: 1.0e-04 loss: 1.012e-01]mindexpander_qwen_v1:  24%|##3       | 714/3000 [48:12<2:00:31,  3.16s/it, lr: 1.0e-04 loss: 1.012e-01]mindexpander_qwen_v1:  24%|##3       | 714/3000 [48:16<2:00:31,  3.16s/it, lr: 1.0e-04 loss: 1.370e-03]mindexpander_qwen_v1:  24%|##3       | 714/3000 [48:16<2:00:31,  3.16s/it, lr: 1.0e-04 loss: 1.370e-03]mindexpander_qwen_v1:  24%|##3       | 715/3000 [48:16<2:06:39,  3.33s/it, lr: 1.0e-04 loss: 1.370e-03]mindexpander_qwen_v1:  24%|##3       | 715/3000 [48:16<2:06:39,  3.33s/it, lr: 1.0e-04 loss: 1.370e-03]mindexpander_qwen_v1:  24%|##3       | 715/3000 [48:19<2:06:39,  3.33s/it, lr: 1.0e-04 loss: 1.360e-01]mindexpander_qwen_v1:  24%|##3       | 715/3000 [48:19<2:06:39,  3.33s/it, lr: 1.0e-04 loss: 1.360e-01]mindexpander_qwen_v1:  24%|##3       | 716/3000 [48:19<1:59:17,  3.13s/it, lr: 1.0e-04 loss: 1.360e-01]mindexpander_qwen_v1:  24%|##3       | 716/3000 [48:19<1:59:17,  3.13s/it, lr: 1.0e-04 loss: 1.360e-01]mindexpander_qwen_v1:  24%|##3       | 716/3000 [48:21<1:59:17,  3.13s/it, lr: 1.0e-04 loss: 3.806e-02]mindexpander_qwen_v1:  24%|##3       | 716/3000 [48:21<1:59:17,  3.13s/it, lr: 1.0e-04 loss: 3.806e-02]mindexpander_qwen_v1:  24%|##3       | 717/3000 [48:21<1:51:42,  2.94s/it, lr: 1.0e-04 loss: 3.806e-02]mindexpander_qwen_v1:  24%|##3       | 717/3000 [48:21<1:51:42,  2.94s/it, lr: 1.0e-04 loss: 3.806e-02]mindexpander_qwen_v1:  24%|##3       | 717/3000 [48:24<1:51:42,  2.94s/it, lr: 1.0e-04 loss: 1.894e-01]mindexpander_qwen_v1:  24%|##3       | 717/3000 [48:24<1:51:42,  2.94s/it, lr: 1.0e-04 loss: 1.894e-01]mindexpander_qwen_v1:  24%|##3       | 718/3000 [48:24<1:46:12,  2.79s/it, lr: 1.0e-04 loss: 1.894e-01]mindexpander_qwen_v1:  24%|##3       | 718/3000 [48:24<1:46:12,  2.79s/it, lr: 1.0e-04 loss: 1.894e-01]mindexpander_qwen_v1:  24%|##3       | 718/3000 [48:26<1:46:12,  2.79s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  24%|##3       | 718/3000 [48:26<1:46:12,  2.79s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  24%|##3       | 719/3000 [48:26<1:42:19,  2.69s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  24%|##3       | 719/3000 [48:26<1:42:19,  2.69s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  24%|##3       | 719/3000 [48:29<1:42:19,  2.69s/it, lr: 1.0e-04 loss: 6.002e-02]mindexpander_qwen_v1:  24%|##3       | 719/3000 [48:29<1:42:19,  2.69s/it, lr: 1.0e-04 loss: 6.002e-02]mindexpander_qwen_v1:  24%|##4       | 720/3000 [48:33<1:42:16,  2.69s/it, lr: 1.0e-04 loss: 2.993e-02]mindexpander_qwen_v1:  24%|##4       | 720/3000 [48:33<1:42:16,  2.69s/it, lr: 1.0e-04 loss: 2.993e-02]mindexpander_qwen_v1:  24%|##4       | 721/3000 [48:33<1:28:05,  2.32s/it, lr: 1.0e-04 loss: 2.993e-02]mindexpander_qwen_v1:  24%|##4       | 721/3000 [48:33<1:28:05,  2.32s/it, lr: 1.0e-04 loss: 2.993e-02]mindexpander_qwen_v1:  24%|##4       | 721/3000 [48:37<1:28:05,  2.32s/it, lr: 1.0e-04 loss: 1.091e-01]mindexpander_qwen_v1:  24%|##4       | 721/3000 [48:37<1:28:05,  2.32s/it, lr: 1.0e-04 loss: 1.091e-01]mindexpander_qwen_v1:  24%|##4       | 722/3000 [48:37<1:41:22,  2.67s/it, lr: 1.0e-04 loss: 1.091e-01]mindexpander_qwen_v1:  24%|##4       | 722/3000 [48:37<1:41:22,  2.67s/it, lr: 1.0e-04 loss: 1.091e-01]mindexpander_qwen_v1:  24%|##4       | 722/3000 [48:43<1:41:22,  2.67s/it, lr: 1.0e-04 loss: 2.484e-02]mindexpander_qwen_v1:  24%|##4       | 722/3000 [48:43<1:41:22,  2.67s/it, lr: 1.0e-04 loss: 2.484e-02]mindexpander_qwen_v1:  24%|##4       | 723/3000 [48:43<2:11:54,  3.48s/it, lr: 1.0e-04 loss: 2.484e-02]mindexpander_qwen_v1:  24%|##4       | 723/3000 [48:43<2:11:54,  3.48s/it, lr: 1.0e-04 loss: 2.484e-02]mindexpander_qwen_v1:  24%|##4       | 723/3000 [48:45<2:11:54,  3.48s/it, lr: 1.0e-04 loss: 8.549e-02]mindexpander_qwen_v1:  24%|##4       | 723/3000 [48:45<2:11:54,  3.48s/it, lr: 1.0e-04 loss: 8.549e-02]mindexpander_qwen_v1:  24%|##4       | 724/3000 [48:45<2:03:21,  3.25s/it, lr: 1.0e-04 loss: 8.549e-02]mindexpander_qwen_v1:  24%|##4       | 724/3000 [48:45<2:03:21,  3.25s/it, lr: 1.0e-04 loss: 8.549e-02]mindexpander_qwen_v1:  24%|##4       | 724/3000 [48:48<2:03:21,  3.25s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:  24%|##4       | 724/3000 [48:48<2:03:21,  3.25s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:  24%|##4       | 725/3000 [48:48<1:54:52,  3.03s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:  24%|##4       | 725/3000 [48:48<1:54:52,  3.03s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:  24%|##4       | 725/3000 [48:50<1:54:52,  3.03s/it, lr: 1.0e-04 loss: 1.163e-02]mindexpander_qwen_v1:  24%|##4       | 725/3000 [48:50<1:54:52,  3.03s/it, lr: 1.0e-04 loss: 1.163e-02]mindexpander_qwen_v1:  24%|##4       | 726/3000 [48:50<1:48:31,  2.86s/it, lr: 1.0e-04 loss: 1.163e-02]mindexpander_qwen_v1:  24%|##4       | 726/3000 [48:50<1:48:31,  2.86s/it, lr: 1.0e-04 loss: 1.163e-02]mindexpander_qwen_v1:  24%|##4       | 726/3000 [48:56<1:48:31,  2.86s/it, lr: 1.0e-04 loss: 4.676e-02]mindexpander_qwen_v1:  24%|##4       | 726/3000 [48:56<1:48:31,  2.86s/it, lr: 1.0e-04 loss: 4.676e-02]mindexpander_qwen_v1:  24%|##4       | 727/3000 [48:56<2:20:13,  3.70s/it, lr: 1.0e-04 loss: 4.676e-02]mindexpander_qwen_v1:  24%|##4       | 727/3000 [48:56<2:20:13,  3.70s/it, lr: 1.0e-04 loss: 4.676e-02]mindexpander_qwen_v1:  24%|##4       | 727/3000 [49:00<2:20:13,  3.70s/it, lr: 1.0e-04 loss: 1.744e-01]mindexpander_qwen_v1:  24%|##4       | 727/3000 [49:00<2:20:13,  3.70s/it, lr: 1.0e-04 loss: 1.744e-01]mindexpander_qwen_v1:  24%|##4       | 728/3000 [49:00<2:22:33,  3.76s/it, lr: 1.0e-04 loss: 1.744e-01]mindexpander_qwen_v1:  24%|##4       | 728/3000 [49:00<2:22:33,  3.76s/it, lr: 1.0e-04 loss: 1.744e-01]mindexpander_qwen_v1:  24%|##4       | 728/3000 [49:04<2:22:33,  3.76s/it, lr: 1.0e-04 loss: 1.642e-02]mindexpander_qwen_v1:  24%|##4       | 728/3000 [49:04<2:22:33,  3.76s/it, lr: 1.0e-04 loss: 1.642e-02]mindexpander_qwen_v1:  24%|##4       | 729/3000 [49:04<2:22:16,  3.76s/it, lr: 1.0e-04 loss: 1.642e-02]mindexpander_qwen_v1:  24%|##4       | 729/3000 [49:04<2:22:16,  3.76s/it, lr: 1.0e-04 loss: 1.642e-02]mindexpander_qwen_v1:  24%|##4       | 729/3000 [49:07<2:22:16,  3.76s/it, lr: 1.0e-04 loss: 3.462e-02]mindexpander_qwen_v1:  24%|##4       | 729/3000 [49:07<2:22:16,  3.76s/it, lr: 1.0e-04 loss: 3.462e-02]mindexpander_qwen_v1:  24%|##4       | 730/3000 [49:11<2:22:12,  3.76s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  24%|##4       | 730/3000 [49:11<2:22:12,  3.76s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  24%|##4       | 731/3000 [49:11<1:49:32,  2.90s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  24%|##4       | 731/3000 [49:11<1:49:32,  2.90s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  24%|##4       | 731/3000 [49:17<1:49:32,  2.90s/it, lr: 1.0e-04 loss: 1.770e-02]mindexpander_qwen_v1:  24%|##4       | 731/3000 [49:17<1:49:32,  2.90s/it, lr: 1.0e-04 loss: 1.770e-02]mindexpander_qwen_v1:  24%|##4       | 732/3000 [49:17<2:17:13,  3.63s/it, lr: 1.0e-04 loss: 1.770e-02]mindexpander_qwen_v1:  24%|##4       | 732/3000 [49:17<2:17:13,  3.63s/it, lr: 1.0e-04 loss: 1.770e-02]mindexpander_qwen_v1:  24%|##4       | 732/3000 [49:19<2:17:13,  3.63s/it, lr: 1.0e-04 loss: 5.064e-03]mindexpander_qwen_v1:  24%|##4       | 732/3000 [49:19<2:17:13,  3.63s/it, lr: 1.0e-04 loss: 5.064e-03]mindexpander_qwen_v1:  24%|##4       | 733/3000 [49:19<2:05:35,  3.32s/it, lr: 1.0e-04 loss: 5.064e-03]mindexpander_qwen_v1:  24%|##4       | 733/3000 [49:19<2:05:35,  3.32s/it, lr: 1.0e-04 loss: 5.064e-03]mindexpander_qwen_v1:  24%|##4       | 733/3000 [49:22<2:05:35,  3.32s/it, lr: 1.0e-04 loss: 6.196e-02]mindexpander_qwen_v1:  24%|##4       | 733/3000 [49:22<2:05:35,  3.32s/it, lr: 1.0e-04 loss: 6.196e-02]mindexpander_qwen_v1:  24%|##4       | 734/3000 [49:22<1:56:35,  3.09s/it, lr: 1.0e-04 loss: 6.196e-02]mindexpander_qwen_v1:  24%|##4       | 734/3000 [49:22<1:56:35,  3.09s/it, lr: 1.0e-04 loss: 6.196e-02]mindexpander_qwen_v1:  24%|##4       | 734/3000 [49:26<1:56:35,  3.09s/it, lr: 1.0e-04 loss: 1.589e-01]mindexpander_qwen_v1:  24%|##4       | 734/3000 [49:26<1:56:35,  3.09s/it, lr: 1.0e-04 loss: 1.589e-01]mindexpander_qwen_v1:  24%|##4       | 735/3000 [49:26<2:03:31,  3.27s/it, lr: 1.0e-04 loss: 1.589e-01]mindexpander_qwen_v1:  24%|##4       | 735/3000 [49:26<2:03:31,  3.27s/it, lr: 1.0e-04 loss: 1.589e-01]mindexpander_qwen_v1:  24%|##4       | 735/3000 [49:29<2:03:31,  3.27s/it, lr: 1.0e-04 loss: 1.062e-01]mindexpander_qwen_v1:  24%|##4       | 735/3000 [49:29<2:03:31,  3.27s/it, lr: 1.0e-04 loss: 1.062e-01]mindexpander_qwen_v1:  25%|##4       | 736/3000 [49:29<2:10:22,  3.45s/it, lr: 1.0e-04 loss: 1.062e-01]mindexpander_qwen_v1:  25%|##4       | 736/3000 [49:29<2:10:22,  3.45s/it, lr: 1.0e-04 loss: 1.062e-01]mindexpander_qwen_v1:  25%|##4       | 736/3000 [49:32<2:10:22,  3.45s/it, lr: 1.0e-04 loss: 9.972e-03]mindexpander_qwen_v1:  25%|##4       | 736/3000 [49:32<2:10:22,  3.45s/it, lr: 1.0e-04 loss: 9.972e-03]mindexpander_qwen_v1:  25%|##4       | 737/3000 [49:32<1:59:22,  3.16s/it, lr: 1.0e-04 loss: 9.972e-03]mindexpander_qwen_v1:  25%|##4       | 737/3000 [49:32<1:59:22,  3.16s/it, lr: 1.0e-04 loss: 9.972e-03]mindexpander_qwen_v1:  25%|##4       | 737/3000 [49:38<1:59:22,  3.16s/it, lr: 1.0e-04 loss: 1.530e-01]mindexpander_qwen_v1:  25%|##4       | 737/3000 [49:38<1:59:22,  3.16s/it, lr: 1.0e-04 loss: 1.530e-01]mindexpander_qwen_v1:  25%|##4       | 738/3000 [49:38<2:27:55,  3.92s/it, lr: 1.0e-04 loss: 1.530e-01]mindexpander_qwen_v1:  25%|##4       | 738/3000 [49:38<2:27:55,  3.92s/it, lr: 1.0e-04 loss: 1.530e-01]mindexpander_qwen_v1:  25%|##4       | 738/3000 [49:43<2:27:55,  3.92s/it, lr: 1.0e-04 loss: 3.933e-02]mindexpander_qwen_v1:  25%|##4       | 738/3000 [49:43<2:27:55,  3.92s/it, lr: 1.0e-04 loss: 3.933e-02]mindexpander_qwen_v1:  25%|##4       | 739/3000 [49:43<2:48:14,  4.46s/it, lr: 1.0e-04 loss: 3.933e-02]mindexpander_qwen_v1:  25%|##4       | 739/3000 [49:43<2:48:14,  4.46s/it, lr: 1.0e-04 loss: 3.933e-02]mindexpander_qwen_v1:  25%|##4       | 739/3000 [49:49<2:48:14,  4.46s/it, lr: 1.0e-04 loss: 1.186e-01]mindexpander_qwen_v1:  25%|##4       | 739/3000 [49:49<2:48:14,  4.46s/it, lr: 1.0e-04 loss: 1.186e-01]mindexpander_qwen_v1:  25%|##4       | 740/3000 [49:55<2:48:09,  4.46s/it, lr: 1.0e-04 loss: 3.534e-02]mindexpander_qwen_v1:  25%|##4       | 740/3000 [49:55<2:48:09,  4.46s/it, lr: 1.0e-04 loss: 3.534e-02]mindexpander_qwen_v1:  25%|##4       | 741/3000 [49:55<2:20:50,  3.74s/it, lr: 1.0e-04 loss: 3.534e-02]mindexpander_qwen_v1:  25%|##4       | 741/3000 [49:55<2:20:50,  3.74s/it, lr: 1.0e-04 loss: 3.534e-02]mindexpander_qwen_v1:  25%|##4       | 741/3000 [50:01<2:20:50,  3.74s/it, lr: 1.0e-04 loss: 1.731e-01]mindexpander_qwen_v1:  25%|##4       | 741/3000 [50:01<2:20:50,  3.74s/it, lr: 1.0e-04 loss: 1.731e-01]mindexpander_qwen_v1:  25%|##4       | 742/3000 [50:01<2:39:26,  4.24s/it, lr: 1.0e-04 loss: 1.731e-01]mindexpander_qwen_v1:  25%|##4       | 742/3000 [50:01<2:39:26,  4.24s/it, lr: 1.0e-04 loss: 1.731e-01]mindexpander_qwen_v1:  25%|##4       | 742/3000 [50:07<2:39:26,  4.24s/it, lr: 1.0e-04 loss: 1.619e-02]mindexpander_qwen_v1:  25%|##4       | 742/3000 [50:07<2:39:26,  4.24s/it, lr: 1.0e-04 loss: 1.619e-02]mindexpander_qwen_v1:  25%|##4       | 743/3000 [50:07<2:55:44,  4.67s/it, lr: 1.0e-04 loss: 1.619e-02]mindexpander_qwen_v1:  25%|##4       | 743/3000 [50:07<2:55:44,  4.67s/it, lr: 1.0e-04 loss: 1.619e-02]mindexpander_qwen_v1:  25%|##4       | 743/3000 [50:09<2:55:44,  4.67s/it, lr: 1.0e-04 loss: 4.498e-02]mindexpander_qwen_v1:  25%|##4       | 743/3000 [50:09<2:55:44,  4.67s/it, lr: 1.0e-04 loss: 4.498e-02]mindexpander_qwen_v1:  25%|##4       | 744/3000 [50:09<2:33:02,  4.07s/it, lr: 1.0e-04 loss: 4.498e-02]mindexpander_qwen_v1:  25%|##4       | 744/3000 [50:09<2:33:02,  4.07s/it, lr: 1.0e-04 loss: 4.498e-02]mindexpander_qwen_v1:  25%|##4       | 744/3000 [50:13<2:33:02,  4.07s/it, lr: 1.0e-04 loss: 1.762e-02]mindexpander_qwen_v1:  25%|##4       | 744/3000 [50:13<2:33:02,  4.07s/it, lr: 1.0e-04 loss: 1.762e-02]mindexpander_qwen_v1:  25%|##4       | 745/3000 [50:13<2:29:35,  3.98s/it, lr: 1.0e-04 loss: 1.762e-02]mindexpander_qwen_v1:  25%|##4       | 745/3000 [50:13<2:29:35,  3.98s/it, lr: 1.0e-04 loss: 1.762e-02]mindexpander_qwen_v1:  25%|##4       | 745/3000 [50:15<2:29:35,  3.98s/it, lr: 1.0e-04 loss: 2.650e-02]mindexpander_qwen_v1:  25%|##4       | 745/3000 [50:15<2:29:35,  3.98s/it, lr: 1.0e-04 loss: 2.650e-02]mindexpander_qwen_v1:  25%|##4       | 746/3000 [50:15<2:13:10,  3.54s/it, lr: 1.0e-04 loss: 2.650e-02]mindexpander_qwen_v1:  25%|##4       | 746/3000 [50:15<2:13:10,  3.54s/it, lr: 1.0e-04 loss: 2.650e-02]mindexpander_qwen_v1:  25%|##4       | 746/3000 [50:19<2:13:10,  3.54s/it, lr: 1.0e-04 loss: 3.651e-02]mindexpander_qwen_v1:  25%|##4       | 746/3000 [50:19<2:13:10,  3.54s/it, lr: 1.0e-04 loss: 3.651e-02]mindexpander_qwen_v1:  25%|##4       | 747/3000 [50:19<2:17:05,  3.65s/it, lr: 1.0e-04 loss: 3.651e-02]mindexpander_qwen_v1:  25%|##4       | 747/3000 [50:19<2:17:05,  3.65s/it, lr: 1.0e-04 loss: 3.651e-02]mindexpander_qwen_v1:  25%|##4       | 747/3000 [50:25<2:17:05,  3.65s/it, lr: 1.0e-04 loss: 1.299e-01]mindexpander_qwen_v1:  25%|##4       | 747/3000 [50:25<2:17:05,  3.65s/it, lr: 1.0e-04 loss: 1.299e-01]mindexpander_qwen_v1:  25%|##4       | 748/3000 [50:25<2:40:10,  4.27s/it, lr: 1.0e-04 loss: 1.299e-01]mindexpander_qwen_v1:  25%|##4       | 748/3000 [50:25<2:40:10,  4.27s/it, lr: 1.0e-04 loss: 1.299e-01]mindexpander_qwen_v1:  25%|##4       | 748/3000 [50:28<2:40:10,  4.27s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  25%|##4       | 748/3000 [50:28<2:40:10,  4.27s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  25%|##4       | 749/3000 [50:28<2:20:01,  3.73s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  25%|##4       | 749/3000 [50:28<2:20:01,  3.73s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  25%|##4       | 749/3000 [50:34<2:20:01,  3.73s/it, lr: 1.0e-04 loss: 4.967e-02]mindexpander_qwen_v1:  25%|##4       | 749/3000 [50:34<2:20:01,  3.73s/it, lr: 1.0e-04 loss: 4.967e-02]
+Saving at step 750
+Saved checkpoint to /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000000750.safetensors
+Saved optimizer to /app/ai-toolkit/output/mindexpander_qwen_v1/optimizer.pt
+
+
+Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:   0%|          | 0/2 [00:00<?, ?it/s][A[A
+
+Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.61s/it]Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.61s/it][A[A
+
+Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.86s/it]Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.86s/it][A[A
+
+                                                                                                                                [A[Amindexpander_qwen_v1:  25%|##5       | 750/3000 [50:36<2:19:57,  3.73s/it, lr: 1.0e-04 loss: 9.515e-02]mindexpander_qwen_v1:  25%|##5       | 750/3000 [50:36<2:19:57,  3.73s/it, lr: 1.0e-04 loss: 9.515e-02]mindexpander_qwen_v1:  25%|##5       | 751/3000 [50:36<1:38:50,  2.64s/it, lr: 1.0e-04 loss: 9.515e-02]mindexpander_qwen_v1:  25%|##5       | 751/3000 [50:36<1:38:50,  2.64s/it, lr: 1.0e-04 loss: 9.515e-02]mindexpander_qwen_v1:  25%|##5       | 751/3000 [50:40<1:38:50,  2.64s/it, lr: 1.0e-04 loss: 5.525e-02]mindexpander_qwen_v1:  25%|##5       | 751/3000 [50:40<1:38:50,  2.64s/it, lr: 1.0e-04 loss: 5.525e-02]mindexpander_qwen_v1:  25%|##5       | 752/3000 [50:40<1:49:09,  2.91s/it, lr: 1.0e-04 loss: 5.525e-02]mindexpander_qwen_v1:  25%|##5       | 752/3000 [50:40<1:49:09,  2.91s/it, lr: 1.0e-04 loss: 5.525e-02]mindexpander_qwen_v1:  25%|##5       | 752/3000 [50:43<1:49:09,  2.91s/it, lr: 1.0e-04 loss: 2.259e-02]mindexpander_qwen_v1:  25%|##5       | 752/3000 [50:43<1:49:09,  2.91s/it, lr: 1.0e-04 loss: 2.259e-02]mindexpander_qwen_v1:  25%|##5       | 753/3000 [50:43<1:44:41,  2.80s/it, lr: 1.0e-04 loss: 2.259e-02]mindexpander_qwen_v1:  25%|##5       | 753/3000 [50:43<1:44:41,  2.80s/it, lr: 1.0e-04 loss: 2.259e-02]mindexpander_qwen_v1:  25%|##5       | 753/3000 [50:45<1:44:41,  2.80s/it, lr: 1.0e-04 loss: 3.391e-02]mindexpander_qwen_v1:  25%|##5       | 753/3000 [50:45<1:44:41,  2.80s/it, lr: 1.0e-04 loss: 3.391e-02]mindexpander_qwen_v1:  25%|##5       | 754/3000 [50:45<1:43:08,  2.76s/it, lr: 1.0e-04 loss: 3.391e-02]mindexpander_qwen_v1:  25%|##5       | 754/3000 [50:45<1:43:08,  2.76s/it, lr: 1.0e-04 loss: 3.391e-02]mindexpander_qwen_v1:  25%|##5       | 754/3000 [50:49<1:43:08,  2.76s/it, lr: 1.0e-04 loss: 1.206e-01]mindexpander_qwen_v1:  25%|##5       | 754/3000 [50:49<1:43:08,  2.76s/it, lr: 1.0e-04 loss: 1.206e-01]mindexpander_qwen_v1:  25%|##5       | 755/3000 [50:49<1:53:24,  3.03s/it, lr: 1.0e-04 loss: 1.206e-01]mindexpander_qwen_v1:  25%|##5       | 755/3000 [50:49<1:53:24,  3.03s/it, lr: 1.0e-04 loss: 1.206e-01]mindexpander_qwen_v1:  25%|##5       | 755/3000 [50:51<1:53:24,  3.03s/it, lr: 1.0e-04 loss: 1.590e-01]mindexpander_qwen_v1:  25%|##5       | 755/3000 [50:51<1:53:24,  3.03s/it, lr: 1.0e-04 loss: 1.590e-01]mindexpander_qwen_v1:  25%|##5       | 756/3000 [50:51<1:47:15,  2.87s/it, lr: 1.0e-04 loss: 1.590e-01]mindexpander_qwen_v1:  25%|##5       | 756/3000 [50:51<1:47:15,  2.87s/it, lr: 1.0e-04 loss: 1.590e-01]mindexpander_qwen_v1:  25%|##5       | 756/3000 [50:55<1:47:15,  2.87s/it, lr: 1.0e-04 loss: 1.146e-02]mindexpander_qwen_v1:  25%|##5       | 756/3000 [50:55<1:47:15,  2.87s/it, lr: 1.0e-04 loss: 1.146e-02]mindexpander_qwen_v1:  25%|##5       | 757/3000 [50:55<1:56:43,  3.12s/it, lr: 1.0e-04 loss: 1.146e-02]mindexpander_qwen_v1:  25%|##5       | 757/3000 [50:55<1:56:43,  3.12s/it, lr: 1.0e-04 loss: 1.146e-02]mindexpander_qwen_v1:  25%|##5       | 757/3000 [50:59<1:56:43,  3.12s/it, lr: 1.0e-04 loss: 1.340e-01]mindexpander_qwen_v1:  25%|##5       | 757/3000 [50:59<1:56:43,  3.12s/it, lr: 1.0e-04 loss: 1.340e-01]mindexpander_qwen_v1:  25%|##5       | 758/3000 [50:59<2:05:13,  3.35s/it, lr: 1.0e-04 loss: 1.340e-01]mindexpander_qwen_v1:  25%|##5       | 758/3000 [50:59<2:05:13,  3.35s/it, lr: 1.0e-04 loss: 1.340e-01]mindexpander_qwen_v1:  25%|##5       | 758/3000 [51:05<2:05:13,  3.35s/it, lr: 1.0e-04 loss: 1.417e-01]mindexpander_qwen_v1:  25%|##5       | 758/3000 [51:05<2:05:13,  3.35s/it, lr: 1.0e-04 loss: 1.417e-01]mindexpander_qwen_v1:  25%|##5       | 759/3000 [51:05<2:31:38,  4.06s/it, lr: 1.0e-04 loss: 1.417e-01]mindexpander_qwen_v1:  25%|##5       | 759/3000 [51:05<2:31:38,  4.06s/it, lr: 1.0e-04 loss: 1.417e-01]mindexpander_qwen_v1:  25%|##5       | 759/3000 [51:11<2:31:38,  4.06s/it, lr: 1.0e-04 loss: 1.498e-01]mindexpander_qwen_v1:  25%|##5       | 759/3000 [51:11<2:31:38,  4.06s/it, lr: 1.0e-04 loss: 1.498e-01]mindexpander_qwen_v1:  25%|##5       | 760/3000 [51:14<2:31:34,  4.06s/it, lr: 1.0e-04 loss: 2.543e-02]mindexpander_qwen_v1:  25%|##5       | 760/3000 [51:14<2:31:34,  4.06s/it, lr: 1.0e-04 loss: 2.543e-02]mindexpander_qwen_v1:  25%|##5       | 761/3000 [51:14<1:54:09,  3.06s/it, lr: 1.0e-04 loss: 2.543e-02]mindexpander_qwen_v1:  25%|##5       | 761/3000 [51:14<1:54:09,  3.06s/it, lr: 1.0e-04 loss: 2.543e-02]mindexpander_qwen_v1:  25%|##5       | 761/3000 [51:20<1:54:09,  3.06s/it, lr: 1.0e-04 loss: 2.699e-02]mindexpander_qwen_v1:  25%|##5       | 761/3000 [51:20<1:54:09,  3.06s/it, lr: 1.0e-04 loss: 2.699e-02]mindexpander_qwen_v1:  25%|##5       | 762/3000 [51:20<2:20:03,  3.75s/it, lr: 1.0e-04 loss: 2.699e-02]mindexpander_qwen_v1:  25%|##5       | 762/3000 [51:20<2:20:03,  3.75s/it, lr: 1.0e-04 loss: 2.699e-02]mindexpander_qwen_v1:  25%|##5       | 762/3000 [51:26<2:20:03,  3.75s/it, lr: 1.0e-04 loss: 9.345e-02]mindexpander_qwen_v1:  25%|##5       | 762/3000 [51:26<2:20:03,  3.75s/it, lr: 1.0e-04 loss: 9.345e-02]mindexpander_qwen_v1:  25%|##5       | 763/3000 [51:26<2:39:26,  4.28s/it, lr: 1.0e-04 loss: 9.345e-02]mindexpander_qwen_v1:  25%|##5       | 763/3000 [51:26<2:39:26,  4.28s/it, lr: 1.0e-04 loss: 9.345e-02]mindexpander_qwen_v1:  25%|##5       | 763/3000 [51:28<2:39:26,  4.28s/it, lr: 1.0e-04 loss: 1.891e-01]mindexpander_qwen_v1:  25%|##5       | 763/3000 [51:28<2:39:26,  4.28s/it, lr: 1.0e-04 loss: 1.891e-01]mindexpander_qwen_v1:  25%|##5       | 764/3000 [51:28<2:20:50,  3.78s/it, lr: 1.0e-04 loss: 1.891e-01]mindexpander_qwen_v1:  25%|##5       | 764/3000 [51:28<2:20:50,  3.78s/it, lr: 1.0e-04 loss: 1.891e-01]mindexpander_qwen_v1:  25%|##5       | 764/3000 [51:32<2:20:50,  3.78s/it, lr: 1.0e-04 loss: 1.473e-01]mindexpander_qwen_v1:  25%|##5       | 764/3000 [51:32<2:20:50,  3.78s/it, lr: 1.0e-04 loss: 1.473e-01]mindexpander_qwen_v1:  26%|##5       | 765/3000 [51:32<2:20:23,  3.77s/it, lr: 1.0e-04 loss: 1.473e-01]mindexpander_qwen_v1:  26%|##5       | 765/3000 [51:32<2:20:23,  3.77s/it, lr: 1.0e-04 loss: 1.473e-01]mindexpander_qwen_v1:  26%|##5       | 765/3000 [51:36<2:20:23,  3.77s/it, lr: 1.0e-04 loss: 1.257e-01]mindexpander_qwen_v1:  26%|##5       | 765/3000 [51:36<2:20:23,  3.77s/it, lr: 1.0e-04 loss: 1.257e-01]mindexpander_qwen_v1:  26%|##5       | 766/3000 [51:36<2:21:49,  3.81s/it, lr: 1.0e-04 loss: 1.257e-01]mindexpander_qwen_v1:  26%|##5       | 766/3000 [51:36<2:21:49,  3.81s/it, lr: 1.0e-04 loss: 1.257e-01]mindexpander_qwen_v1:  26%|##5       | 766/3000 [51:38<2:21:49,  3.81s/it, lr: 1.0e-04 loss: 4.289e-02]mindexpander_qwen_v1:  26%|##5       | 766/3000 [51:38<2:21:49,  3.81s/it, lr: 1.0e-04 loss: 4.289e-02]mindexpander_qwen_v1:  26%|##5       | 767/3000 [51:38<2:07:17,  3.42s/it, lr: 1.0e-04 loss: 4.289e-02]mindexpander_qwen_v1:  26%|##5       | 767/3000 [51:38<2:07:17,  3.42s/it, lr: 1.0e-04 loss: 4.289e-02]mindexpander_qwen_v1:  26%|##5       | 767/3000 [51:42<2:07:17,  3.42s/it, lr: 1.0e-04 loss: 1.801e-01]mindexpander_qwen_v1:  26%|##5       | 767/3000 [51:42<2:07:17,  3.42s/it, lr: 1.0e-04 loss: 1.801e-01]mindexpander_qwen_v1:  26%|##5       | 768/3000 [51:42<2:10:58,  3.52s/it, lr: 1.0e-04 loss: 1.801e-01]mindexpander_qwen_v1:  26%|##5       | 768/3000 [51:42<2:10:58,  3.52s/it, lr: 1.0e-04 loss: 1.801e-01]mindexpander_qwen_v1:  26%|##5       | 768/3000 [51:45<2:10:58,  3.52s/it, lr: 1.0e-04 loss: 7.293e-02]mindexpander_qwen_v1:  26%|##5       | 768/3000 [51:45<2:10:58,  3.52s/it, lr: 1.0e-04 loss: 7.293e-02]mindexpander_qwen_v1:  26%|##5       | 769/3000 [51:45<1:59:12,  3.21s/it, lr: 1.0e-04 loss: 7.293e-02]mindexpander_qwen_v1:  26%|##5       | 769/3000 [51:45<1:59:12,  3.21s/it, lr: 1.0e-04 loss: 7.293e-02]mindexpander_qwen_v1:  26%|##5       | 769/3000 [51:51<1:59:12,  3.21s/it, lr: 1.0e-04 loss: 3.783e-02]mindexpander_qwen_v1:  26%|##5       | 769/3000 [51:51<1:59:12,  3.21s/it, lr: 1.0e-04 loss: 3.783e-02]mindexpander_qwen_v1:  26%|##5       | 770/3000 [51:53<1:59:09,  3.21s/it, lr: 1.0e-04 loss: 7.039e-02]mindexpander_qwen_v1:  26%|##5       | 770/3000 [51:53<1:59:09,  3.21s/it, lr: 1.0e-04 loss: 7.039e-02]mindexpander_qwen_v1:  26%|##5       | 771/3000 [51:53<1:25:27,  2.30s/it, lr: 1.0e-04 loss: 7.039e-02]mindexpander_qwen_v1:  26%|##5       | 771/3000 [51:53<1:25:27,  2.30s/it, lr: 1.0e-04 loss: 7.039e-02]mindexpander_qwen_v1:  26%|##5       | 771/3000 [51:57<1:25:27,  2.30s/it, lr: 1.0e-04 loss: 5.568e-03]mindexpander_qwen_v1:  26%|##5       | 771/3000 [51:57<1:25:27,  2.30s/it, lr: 1.0e-04 loss: 5.568e-03]mindexpander_qwen_v1:  26%|##5       | 772/3000 [51:57<1:38:26,  2.65s/it, lr: 1.0e-04 loss: 5.568e-03]mindexpander_qwen_v1:  26%|##5       | 772/3000 [51:57<1:38:26,  2.65s/it, lr: 1.0e-04 loss: 5.568e-03]mindexpander_qwen_v1:  26%|##5       | 772/3000 [52:03<1:38:26,  2.65s/it, lr: 1.0e-04 loss: 1.840e-01]mindexpander_qwen_v1:  26%|##5       | 772/3000 [52:03<1:38:26,  2.65s/it, lr: 1.0e-04 loss: 1.840e-01]mindexpander_qwen_v1:  26%|##5       | 773/3000 [52:03<2:08:21,  3.46s/it, lr: 1.0e-04 loss: 1.840e-01]mindexpander_qwen_v1:  26%|##5       | 773/3000 [52:03<2:08:21,  3.46s/it, lr: 1.0e-04 loss: 1.840e-01]mindexpander_qwen_v1:  26%|##5       | 773/3000 [52:05<2:08:21,  3.46s/it, lr: 1.0e-04 loss: 5.319e-02]mindexpander_qwen_v1:  26%|##5       | 773/3000 [52:05<2:08:21,  3.46s/it, lr: 1.0e-04 loss: 5.319e-02]mindexpander_qwen_v1:  26%|##5       | 774/3000 [52:05<1:59:56,  3.23s/it, lr: 1.0e-04 loss: 5.319e-02]mindexpander_qwen_v1:  26%|##5       | 774/3000 [52:05<1:59:56,  3.23s/it, lr: 1.0e-04 loss: 5.319e-02]mindexpander_qwen_v1:  26%|##5       | 774/3000 [52:11<1:59:56,  3.23s/it, lr: 1.0e-04 loss: 8.023e-02]mindexpander_qwen_v1:  26%|##5       | 774/3000 [52:11<1:59:56,  3.23s/it, lr: 1.0e-04 loss: 8.023e-02]mindexpander_qwen_v1:  26%|##5       | 775/3000 [52:11<2:25:59,  3.94s/it, lr: 1.0e-04 loss: 8.023e-02]mindexpander_qwen_v1:  26%|##5       | 775/3000 [52:11<2:25:59,  3.94s/it, lr: 1.0e-04 loss: 8.023e-02]mindexpander_qwen_v1:  26%|##5       | 775/3000 [52:15<2:25:59,  3.94s/it, lr: 1.0e-04 loss: 7.520e-02]mindexpander_qwen_v1:  26%|##5       | 775/3000 [52:15<2:25:59,  3.94s/it, lr: 1.0e-04 loss: 7.520e-02]mindexpander_qwen_v1:  26%|##5       | 776/3000 [52:15<2:23:48,  3.88s/it, lr: 1.0e-04 loss: 7.520e-02]mindexpander_qwen_v1:  26%|##5       | 776/3000 [52:15<2:23:48,  3.88s/it, lr: 1.0e-04 loss: 7.520e-02]mindexpander_qwen_v1:  26%|##5       | 776/3000 [52:20<2:23:48,  3.88s/it, lr: 1.0e-04 loss: 1.600e-01]mindexpander_qwen_v1:  26%|##5       | 776/3000 [52:20<2:23:48,  3.88s/it, lr: 1.0e-04 loss: 1.600e-01]mindexpander_qwen_v1:  26%|##5       | 777/3000 [52:20<2:43:52,  4.42s/it, lr: 1.0e-04 loss: 1.600e-01]mindexpander_qwen_v1:  26%|##5       | 777/3000 [52:20<2:43:52,  4.42s/it, lr: 1.0e-04 loss: 1.600e-01]mindexpander_qwen_v1:  26%|##5       | 777/3000 [52:23<2:43:52,  4.42s/it, lr: 1.0e-04 loss: 5.795e-02]mindexpander_qwen_v1:  26%|##5       | 777/3000 [52:23<2:43:52,  4.42s/it, lr: 1.0e-04 loss: 5.795e-02]mindexpander_qwen_v1:  26%|##5       | 778/3000 [52:23<2:24:28,  3.90s/it, lr: 1.0e-04 loss: 5.795e-02]mindexpander_qwen_v1:  26%|##5       | 778/3000 [52:23<2:24:28,  3.90s/it, lr: 1.0e-04 loss: 5.795e-02]mindexpander_qwen_v1:  26%|##5       | 778/3000 [52:29<2:24:28,  3.90s/it, lr: 1.0e-04 loss: 5.252e-02]mindexpander_qwen_v1:  26%|##5       | 778/3000 [52:29<2:24:28,  3.90s/it, lr: 1.0e-04 loss: 5.252e-02]mindexpander_qwen_v1:  26%|##5       | 779/3000 [52:29<2:44:37,  4.45s/it, lr: 1.0e-04 loss: 5.252e-02]mindexpander_qwen_v1:  26%|##5       | 779/3000 [52:29<2:44:37,  4.45s/it, lr: 1.0e-04 loss: 5.252e-02]mindexpander_qwen_v1:  26%|##5       | 779/3000 [52:32<2:44:37,  4.45s/it, lr: 1.0e-04 loss: 6.462e-03]mindexpander_qwen_v1:  26%|##5       | 779/3000 [52:32<2:44:37,  4.45s/it, lr: 1.0e-04 loss: 6.462e-03]mindexpander_qwen_v1:  26%|##6       | 780/3000 [52:34<2:44:32,  4.45s/it, lr: 1.0e-04 loss: 7.018e-02]mindexpander_qwen_v1:  26%|##6       | 780/3000 [52:34<2:44:32,  4.45s/it, lr: 1.0e-04 loss: 7.018e-02]mindexpander_qwen_v1:  26%|##6       | 781/3000 [52:34<1:50:00,  2.97s/it, lr: 1.0e-04 loss: 7.018e-02]mindexpander_qwen_v1:  26%|##6       | 781/3000 [52:34<1:50:00,  2.97s/it, lr: 1.0e-04 loss: 7.018e-02]mindexpander_qwen_v1:  26%|##6       | 781/3000 [52:37<1:50:00,  2.97s/it, lr: 1.0e-04 loss: 4.303e-02]mindexpander_qwen_v1:  26%|##6       | 781/3000 [52:37<1:50:00,  2.97s/it, lr: 1.0e-04 loss: 4.303e-02]mindexpander_qwen_v1:  26%|##6       | 782/3000 [52:37<1:47:25,  2.91s/it, lr: 1.0e-04 loss: 4.303e-02]mindexpander_qwen_v1:  26%|##6       | 782/3000 [52:37<1:47:25,  2.91s/it, lr: 1.0e-04 loss: 4.303e-02]mindexpander_qwen_v1:  26%|##6       | 782/3000 [52:40<1:47:25,  2.91s/it, lr: 1.0e-04 loss: 2.880e-02]mindexpander_qwen_v1:  26%|##6       | 782/3000 [52:40<1:47:25,  2.91s/it, lr: 1.0e-04 loss: 2.880e-02]mindexpander_qwen_v1:  26%|##6       | 783/3000 [52:40<1:55:17,  3.12s/it, lr: 1.0e-04 loss: 2.880e-02]mindexpander_qwen_v1:  26%|##6       | 783/3000 [52:40<1:55:17,  3.12s/it, lr: 1.0e-04 loss: 2.880e-02]mindexpander_qwen_v1:  26%|##6       | 783/3000 [52:44<1:55:17,  3.12s/it, lr: 1.0e-04 loss: 1.219e-01]mindexpander_qwen_v1:  26%|##6       | 783/3000 [52:44<1:55:17,  3.12s/it, lr: 1.0e-04 loss: 1.219e-01]mindexpander_qwen_v1:  26%|##6       | 784/3000 [52:44<2:01:27,  3.29s/it, lr: 1.0e-04 loss: 1.219e-01]mindexpander_qwen_v1:  26%|##6       | 784/3000 [52:44<2:01:27,  3.29s/it, lr: 1.0e-04 loss: 1.219e-01]mindexpander_qwen_v1:  26%|##6       | 784/3000 [52:47<2:01:27,  3.29s/it, lr: 1.0e-04 loss: 8.292e-02]mindexpander_qwen_v1:  26%|##6       | 784/3000 [52:47<2:01:27,  3.29s/it, lr: 1.0e-04 loss: 8.292e-02]mindexpander_qwen_v1:  26%|##6       | 785/3000 [52:47<1:52:45,  3.05s/it, lr: 1.0e-04 loss: 8.292e-02]mindexpander_qwen_v1:  26%|##6       | 785/3000 [52:47<1:52:45,  3.05s/it, lr: 1.0e-04 loss: 8.292e-02]mindexpander_qwen_v1:  26%|##6       | 785/3000 [52:49<1:52:45,  3.05s/it, lr: 1.0e-04 loss: 3.970e-02]mindexpander_qwen_v1:  26%|##6       | 785/3000 [52:49<1:52:45,  3.05s/it, lr: 1.0e-04 loss: 3.970e-02]mindexpander_qwen_v1:  26%|##6       | 786/3000 [52:49<1:48:26,  2.94s/it, lr: 1.0e-04 loss: 3.970e-02]mindexpander_qwen_v1:  26%|##6       | 786/3000 [52:49<1:48:26,  2.94s/it, lr: 1.0e-04 loss: 3.970e-02]mindexpander_qwen_v1:  26%|##6       | 786/3000 [52:55<1:48:26,  2.94s/it, lr: 1.0e-04 loss: 1.377e-01]mindexpander_qwen_v1:  26%|##6       | 786/3000 [52:55<1:48:26,  2.94s/it, lr: 1.0e-04 loss: 1.377e-01]mindexpander_qwen_v1:  26%|##6       | 787/3000 [52:55<2:18:31,  3.76s/it, lr: 1.0e-04 loss: 1.377e-01]mindexpander_qwen_v1:  26%|##6       | 787/3000 [52:55<2:18:31,  3.76s/it, lr: 1.0e-04 loss: 1.377e-01]mindexpander_qwen_v1:  26%|##6       | 787/3000 [52:58<2:18:31,  3.76s/it, lr: 1.0e-04 loss: 3.885e-02]mindexpander_qwen_v1:  26%|##6       | 787/3000 [52:58<2:18:31,  3.76s/it, lr: 1.0e-04 loss: 3.885e-02]mindexpander_qwen_v1:  26%|##6       | 788/3000 [52:58<2:04:21,  3.37s/it, lr: 1.0e-04 loss: 3.885e-02]mindexpander_qwen_v1:  26%|##6       | 788/3000 [52:58<2:04:21,  3.37s/it, lr: 1.0e-04 loss: 3.885e-02]mindexpander_qwen_v1:  26%|##6       | 788/3000 [53:03<2:04:21,  3.37s/it, lr: 1.0e-04 loss: 1.566e-01]mindexpander_qwen_v1:  26%|##6       | 788/3000 [53:03<2:04:21,  3.37s/it, lr: 1.0e-04 loss: 1.566e-01]mindexpander_qwen_v1:  26%|##6       | 789/3000 [53:03<2:31:47,  4.12s/it, lr: 1.0e-04 loss: 1.566e-01]mindexpander_qwen_v1:  26%|##6       | 789/3000 [53:03<2:31:47,  4.12s/it, lr: 1.0e-04 loss: 1.566e-01]mindexpander_qwen_v1:  26%|##6       | 789/3000 [53:06<2:31:47,  4.12s/it, lr: 1.0e-04 loss: 8.627e-02]mindexpander_qwen_v1:  26%|##6       | 789/3000 [53:06<2:31:47,  4.12s/it, lr: 1.0e-04 loss: 8.627e-02]mindexpander_qwen_v1:  26%|##6       | 790/3000 [53:12<2:31:43,  4.12s/it, lr: 1.0e-04 loss: 5.161e-02]mindexpander_qwen_v1:  26%|##6       | 790/3000 [53:12<2:31:43,  4.12s/it, lr: 1.0e-04 loss: 5.161e-02]mindexpander_qwen_v1:  26%|##6       | 791/3000 [53:12<2:10:47,  3.55s/it, lr: 1.0e-04 loss: 5.161e-02]mindexpander_qwen_v1:  26%|##6       | 791/3000 [53:12<2:10:47,  3.55s/it, lr: 1.0e-04 loss: 5.161e-02]mindexpander_qwen_v1:  26%|##6       | 791/3000 [53:17<2:10:47,  3.55s/it, lr: 1.0e-04 loss: 2.180e-02]mindexpander_qwen_v1:  26%|##6       | 791/3000 [53:17<2:10:47,  3.55s/it, lr: 1.0e-04 loss: 2.180e-02]mindexpander_qwen_v1:  26%|##6       | 792/3000 [53:17<2:30:48,  4.10s/it, lr: 1.0e-04 loss: 2.180e-02]mindexpander_qwen_v1:  26%|##6       | 792/3000 [53:17<2:30:48,  4.10s/it, lr: 1.0e-04 loss: 2.180e-02]mindexpander_qwen_v1:  26%|##6       | 792/3000 [53:21<2:30:48,  4.10s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  26%|##6       | 792/3000 [53:21<2:30:48,  4.10s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  26%|##6       | 793/3000 [53:21<2:29:00,  4.05s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  26%|##6       | 793/3000 [53:21<2:29:00,  4.05s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  26%|##6       | 793/3000 [53:27<2:29:00,  4.05s/it, lr: 1.0e-04 loss: 4.126e-02]mindexpander_qwen_v1:  26%|##6       | 793/3000 [53:27<2:29:00,  4.05s/it, lr: 1.0e-04 loss: 4.126e-02]mindexpander_qwen_v1:  26%|##6       | 794/3000 [53:27<2:45:57,  4.51s/it, lr: 1.0e-04 loss: 4.126e-02]mindexpander_qwen_v1:  26%|##6       | 794/3000 [53:27<2:45:57,  4.51s/it, lr: 1.0e-04 loss: 4.126e-02]mindexpander_qwen_v1:  26%|##6       | 794/3000 [53:30<2:45:57,  4.51s/it, lr: 1.0e-04 loss: 3.976e-02]mindexpander_qwen_v1:  26%|##6       | 794/3000 [53:30<2:45:57,  4.51s/it, lr: 1.0e-04 loss: 3.976e-02]mindexpander_qwen_v1:  26%|##6       | 795/3000 [53:30<2:24:44,  3.94s/it, lr: 1.0e-04 loss: 3.976e-02]mindexpander_qwen_v1:  26%|##6       | 795/3000 [53:30<2:24:44,  3.94s/it, lr: 1.0e-04 loss: 3.976e-02]mindexpander_qwen_v1:  26%|##6       | 795/3000 [53:32<2:24:44,  3.94s/it, lr: 1.0e-04 loss: 8.410e-02]mindexpander_qwen_v1:  26%|##6       | 795/3000 [53:32<2:24:44,  3.94s/it, lr: 1.0e-04 loss: 8.410e-02]mindexpander_qwen_v1:  27%|##6       | 796/3000 [53:32<2:09:07,  3.52s/it, lr: 1.0e-04 loss: 8.410e-02]mindexpander_qwen_v1:  27%|##6       | 796/3000 [53:32<2:09:07,  3.52s/it, lr: 1.0e-04 loss: 8.410e-02]mindexpander_qwen_v1:  27%|##6       | 796/3000 [53:36<2:09:07,  3.52s/it, lr: 1.0e-04 loss: 9.771e-02]mindexpander_qwen_v1:  27%|##6       | 796/3000 [53:36<2:09:07,  3.52s/it, lr: 1.0e-04 loss: 9.771e-02]mindexpander_qwen_v1:  27%|##6       | 797/3000 [53:36<2:13:16,  3.63s/it, lr: 1.0e-04 loss: 9.771e-02]mindexpander_qwen_v1:  27%|##6       | 797/3000 [53:36<2:13:16,  3.63s/it, lr: 1.0e-04 loss: 9.771e-02]mindexpander_qwen_v1:  27%|##6       | 797/3000 [53:42<2:13:16,  3.63s/it, lr: 1.0e-04 loss: 6.725e-02]mindexpander_qwen_v1:  27%|##6       | 797/3000 [53:42<2:13:16,  3.63s/it, lr: 1.0e-04 loss: 6.725e-02]mindexpander_qwen_v1:  27%|##6       | 798/3000 [53:42<2:36:05,  4.25s/it, lr: 1.0e-04 loss: 6.725e-02]mindexpander_qwen_v1:  27%|##6       | 798/3000 [53:42<2:36:05,  4.25s/it, lr: 1.0e-04 loss: 6.725e-02]mindexpander_qwen_v1:  27%|##6       | 798/3000 [53:45<2:36:05,  4.25s/it, lr: 1.0e-04 loss: 1.090e-01]mindexpander_qwen_v1:  27%|##6       | 798/3000 [53:45<2:36:05,  4.25s/it, lr: 1.0e-04 loss: 1.090e-01]mindexpander_qwen_v1:  27%|##6       | 799/3000 [53:45<2:30:28,  4.10s/it, lr: 1.0e-04 loss: 1.090e-01]mindexpander_qwen_v1:  27%|##6       | 799/3000 [53:45<2:30:28,  4.10s/it, lr: 1.0e-04 loss: 1.090e-01]mindexpander_qwen_v1:  27%|##6       | 799/3000 [53:49<2:30:28,  4.10s/it, lr: 1.0e-04 loss: 1.635e-01]mindexpander_qwen_v1:  27%|##6       | 799/3000 [53:49<2:30:28,  4.10s/it, lr: 1.0e-04 loss: 1.635e-01]mindexpander_qwen_v1:  27%|##6       | 800/3000 [53:53<2:30:24,  4.10s/it, lr: 1.0e-04 loss: 1.684e-01]mindexpander_qwen_v1:  27%|##6       | 800/3000 [53:53<2:30:24,  4.10s/it, lr: 1.0e-04 loss: 1.684e-01]mindexpander_qwen_v1:  27%|##6       | 801/3000 [53:53<1:54:18,  3.12s/it, lr: 1.0e-04 loss: 1.684e-01]mindexpander_qwen_v1:  27%|##6       | 801/3000 [53:53<1:54:18,  3.12s/it, lr: 1.0e-04 loss: 1.684e-01]mindexpander_qwen_v1:  27%|##6       | 801/3000 [53:59<1:54:18,  3.12s/it, lr: 1.0e-04 loss: 2.579e-02]mindexpander_qwen_v1:  27%|##6       | 801/3000 [53:59<1:54:18,  3.12s/it, lr: 1.0e-04 loss: 2.579e-02]mindexpander_qwen_v1:  27%|##6       | 802/3000 [53:59<2:18:00,  3.77s/it, lr: 1.0e-04 loss: 2.579e-02]mindexpander_qwen_v1:  27%|##6       | 802/3000 [53:59<2:18:00,  3.77s/it, lr: 1.0e-04 loss: 2.579e-02]mindexpander_qwen_v1:  27%|##6       | 802/3000 [54:05<2:18:00,  3.77s/it, lr: 1.0e-04 loss: 4.583e-02]mindexpander_qwen_v1:  27%|##6       | 802/3000 [54:05<2:18:00,  3.77s/it, lr: 1.0e-04 loss: 4.583e-02]mindexpander_qwen_v1:  27%|##6       | 803/3000 [54:05<2:36:54,  4.29s/it, lr: 1.0e-04 loss: 4.583e-02]mindexpander_qwen_v1:  27%|##6       | 803/3000 [54:05<2:36:54,  4.29s/it, lr: 1.0e-04 loss: 4.583e-02]mindexpander_qwen_v1:  27%|##6       | 803/3000 [54:10<2:36:54,  4.29s/it, lr: 1.0e-04 loss: 2.387e-02]mindexpander_qwen_v1:  27%|##6       | 803/3000 [54:10<2:36:54,  4.29s/it, lr: 1.0e-04 loss: 2.387e-02]mindexpander_qwen_v1:  27%|##6       | 804/3000 [54:10<2:51:25,  4.68s/it, lr: 1.0e-04 loss: 2.387e-02]mindexpander_qwen_v1:  27%|##6       | 804/3000 [54:10<2:51:25,  4.68s/it, lr: 1.0e-04 loss: 2.387e-02]mindexpander_qwen_v1:  27%|##6       | 804/3000 [54:13<2:51:25,  4.68s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  27%|##6       | 804/3000 [54:13<2:51:25,  4.68s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  27%|##6       | 805/3000 [54:13<2:30:23,  4.11s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  27%|##6       | 805/3000 [54:13<2:30:23,  4.11s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  27%|##6       | 805/3000 [54:17<2:30:23,  4.11s/it, lr: 1.0e-04 loss: 6.819e-02]mindexpander_qwen_v1:  27%|##6       | 805/3000 [54:17<2:30:23,  4.11s/it, lr: 1.0e-04 loss: 6.819e-02]mindexpander_qwen_v1:  27%|##6       | 806/3000 [54:17<2:26:29,  4.01s/it, lr: 1.0e-04 loss: 6.819e-02]mindexpander_qwen_v1:  27%|##6       | 806/3000 [54:17<2:26:29,  4.01s/it, lr: 1.0e-04 loss: 6.819e-02]mindexpander_qwen_v1:  27%|##6       | 806/3000 [54:20<2:26:29,  4.01s/it, lr: 1.0e-04 loss: 2.682e-02]mindexpander_qwen_v1:  27%|##6       | 806/3000 [54:20<2:26:29,  4.01s/it, lr: 1.0e-04 loss: 2.682e-02]mindexpander_qwen_v1:  27%|##6       | 807/3000 [54:20<2:23:38,  3.93s/it, lr: 1.0e-04 loss: 2.682e-02]mindexpander_qwen_v1:  27%|##6       | 807/3000 [54:20<2:23:38,  3.93s/it, lr: 1.0e-04 loss: 2.682e-02]mindexpander_qwen_v1:  27%|##6       | 807/3000 [54:26<2:23:38,  3.93s/it, lr: 1.0e-04 loss: 3.328e-02]mindexpander_qwen_v1:  27%|##6       | 807/3000 [54:26<2:23:38,  3.93s/it, lr: 1.0e-04 loss: 3.328e-02]mindexpander_qwen_v1:  27%|##6       | 808/3000 [54:26<2:43:07,  4.47s/it, lr: 1.0e-04 loss: 3.328e-02]mindexpander_qwen_v1:  27%|##6       | 808/3000 [54:26<2:43:07,  4.47s/it, lr: 1.0e-04 loss: 3.328e-02]mindexpander_qwen_v1:  27%|##6       | 808/3000 [54:30<2:43:07,  4.47s/it, lr: 1.0e-04 loss: 9.617e-02]mindexpander_qwen_v1:  27%|##6       | 808/3000 [54:30<2:43:07,  4.47s/it, lr: 1.0e-04 loss: 9.617e-02]mindexpander_qwen_v1:  27%|##6       | 809/3000 [54:30<2:36:50,  4.29s/it, lr: 1.0e-04 loss: 9.617e-02]mindexpander_qwen_v1:  27%|##6       | 809/3000 [54:30<2:36:50,  4.29s/it, lr: 1.0e-04 loss: 9.617e-02]mindexpander_qwen_v1:  27%|##6       | 809/3000 [54:36<2:36:50,  4.29s/it, lr: 1.0e-04 loss: 5.910e-02]mindexpander_qwen_v1:  27%|##6       | 809/3000 [54:36<2:36:50,  4.29s/it, lr: 1.0e-04 loss: 5.910e-02]mindexpander_qwen_v1:  27%|##7       | 810/3000 [54:42<2:36:45,  4.29s/it, lr: 1.0e-04 loss: 8.058e-03]mindexpander_qwen_v1:  27%|##7       | 810/3000 [54:42<2:36:45,  4.29s/it, lr: 1.0e-04 loss: 8.058e-03]mindexpander_qwen_v1:  27%|##7       | 811/3000 [54:42<2:13:01,  3.65s/it, lr: 1.0e-04 loss: 8.058e-03]mindexpander_qwen_v1:  27%|##7       | 811/3000 [54:42<2:13:01,  3.65s/it, lr: 1.0e-04 loss: 8.058e-03]mindexpander_qwen_v1:  27%|##7       | 811/3000 [54:46<2:13:01,  3.65s/it, lr: 1.0e-04 loss: 2.990e-02]mindexpander_qwen_v1:  27%|##7       | 811/3000 [54:46<2:13:01,  3.65s/it, lr: 1.0e-04 loss: 2.990e-02]mindexpander_qwen_v1:  27%|##7       | 812/3000 [54:46<2:13:53,  3.67s/it, lr: 1.0e-04 loss: 2.990e-02]mindexpander_qwen_v1:  27%|##7       | 812/3000 [54:46<2:13:53,  3.67s/it, lr: 1.0e-04 loss: 2.990e-02]mindexpander_qwen_v1:  27%|##7       | 812/3000 [54:48<2:13:53,  3.67s/it, lr: 1.0e-04 loss: 9.869e-02]mindexpander_qwen_v1:  27%|##7       | 812/3000 [54:48<2:13:53,  3.67s/it, lr: 1.0e-04 loss: 9.869e-02]mindexpander_qwen_v1:  27%|##7       | 813/3000 [54:48<2:04:49,  3.42s/it, lr: 1.0e-04 loss: 9.869e-02]mindexpander_qwen_v1:  27%|##7       | 813/3000 [54:48<2:04:49,  3.42s/it, lr: 1.0e-04 loss: 9.869e-02]mindexpander_qwen_v1:  27%|##7       | 813/3000 [54:52<2:04:49,  3.42s/it, lr: 1.0e-04 loss: 1.975e-01]mindexpander_qwen_v1:  27%|##7       | 813/3000 [54:52<2:04:49,  3.42s/it, lr: 1.0e-04 loss: 1.975e-01]mindexpander_qwen_v1:  27%|##7       | 814/3000 [54:52<2:07:50,  3.51s/it, lr: 1.0e-04 loss: 1.975e-01]mindexpander_qwen_v1:  27%|##7       | 814/3000 [54:52<2:07:50,  3.51s/it, lr: 1.0e-04 loss: 1.975e-01]mindexpander_qwen_v1:  27%|##7       | 814/3000 [54:56<2:07:50,  3.51s/it, lr: 1.0e-04 loss: 2.390e-02]mindexpander_qwen_v1:  27%|##7       | 814/3000 [54:56<2:07:50,  3.51s/it, lr: 1.0e-04 loss: 2.390e-02]mindexpander_qwen_v1:  27%|##7       | 815/3000 [54:56<2:10:07,  3.57s/it, lr: 1.0e-04 loss: 2.390e-02]mindexpander_qwen_v1:  27%|##7       | 815/3000 [54:56<2:10:07,  3.57s/it, lr: 1.0e-04 loss: 2.390e-02]mindexpander_qwen_v1:  27%|##7       | 815/3000 [54:58<2:10:07,  3.57s/it, lr: 1.0e-04 loss: 2.586e-02]mindexpander_qwen_v1:  27%|##7       | 815/3000 [54:58<2:10:07,  3.57s/it, lr: 1.0e-04 loss: 2.586e-02]mindexpander_qwen_v1:  27%|##7       | 816/3000 [54:58<1:58:25,  3.25s/it, lr: 1.0e-04 loss: 2.586e-02]mindexpander_qwen_v1:  27%|##7       | 816/3000 [54:58<1:58:25,  3.25s/it, lr: 1.0e-04 loss: 2.586e-02]mindexpander_qwen_v1:  27%|##7       | 816/3000 [55:01<1:58:25,  3.25s/it, lr: 1.0e-04 loss: 9.222e-02]mindexpander_qwen_v1:  27%|##7       | 816/3000 [55:01<1:58:25,  3.25s/it, lr: 1.0e-04 loss: 9.222e-02]mindexpander_qwen_v1:  27%|##7       | 817/3000 [55:01<1:51:53,  3.08s/it, lr: 1.0e-04 loss: 9.222e-02]mindexpander_qwen_v1:  27%|##7       | 817/3000 [55:01<1:51:53,  3.08s/it, lr: 1.0e-04 loss: 9.222e-02]mindexpander_qwen_v1:  27%|##7       | 817/3000 [55:05<1:51:53,  3.08s/it, lr: 1.0e-04 loss: 2.375e-02]mindexpander_qwen_v1:  27%|##7       | 817/3000 [55:05<1:51:53,  3.08s/it, lr: 1.0e-04 loss: 2.375e-02]mindexpander_qwen_v1:  27%|##7       | 818/3000 [55:05<1:58:52,  3.27s/it, lr: 1.0e-04 loss: 2.375e-02]mindexpander_qwen_v1:  27%|##7       | 818/3000 [55:05<1:58:52,  3.27s/it, lr: 1.0e-04 loss: 2.375e-02]mindexpander_qwen_v1:  27%|##7       | 818/3000 [55:07<1:58:52,  3.27s/it, lr: 1.0e-04 loss: 2.090e-01]mindexpander_qwen_v1:  27%|##7       | 818/3000 [55:07<1:58:52,  3.27s/it, lr: 1.0e-04 loss: 2.090e-01]mindexpander_qwen_v1:  27%|##7       | 819/3000 [55:07<1:50:04,  3.03s/it, lr: 1.0e-04 loss: 2.090e-01]mindexpander_qwen_v1:  27%|##7       | 819/3000 [55:07<1:50:04,  3.03s/it, lr: 1.0e-04 loss: 2.090e-01]mindexpander_qwen_v1:  27%|##7       | 819/3000 [55:13<1:50:04,  3.03s/it, lr: 1.0e-04 loss: 2.247e-02]mindexpander_qwen_v1:  27%|##7       | 819/3000 [55:13<1:50:04,  3.03s/it, lr: 1.0e-04 loss: 2.247e-02]mindexpander_qwen_v1:  27%|##7       | 820/3000 [55:16<1:50:01,  3.03s/it, lr: 1.0e-04 loss: 1.735e-01]mindexpander_qwen_v1:  27%|##7       | 820/3000 [55:16<1:50:01,  3.03s/it, lr: 1.0e-04 loss: 1.735e-01]mindexpander_qwen_v1:  27%|##7       | 821/3000 [55:16<1:21:28,  2.24s/it, lr: 1.0e-04 loss: 1.735e-01]mindexpander_qwen_v1:  27%|##7       | 821/3000 [55:16<1:21:28,  2.24s/it, lr: 1.0e-04 loss: 1.735e-01]mindexpander_qwen_v1:  27%|##7       | 821/3000 [55:19<1:21:28,  2.24s/it, lr: 1.0e-04 loss: 2.564e-02]mindexpander_qwen_v1:  27%|##7       | 821/3000 [55:19<1:21:28,  2.24s/it, lr: 1.0e-04 loss: 2.564e-02]mindexpander_qwen_v1:  27%|##7       | 822/3000 [55:19<1:34:49,  2.61s/it, lr: 1.0e-04 loss: 2.564e-02]mindexpander_qwen_v1:  27%|##7       | 822/3000 [55:19<1:34:49,  2.61s/it, lr: 1.0e-04 loss: 2.564e-02]mindexpander_qwen_v1:  27%|##7       | 822/3000 [55:22<1:34:49,  2.61s/it, lr: 1.0e-04 loss: 1.772e-01]mindexpander_qwen_v1:  27%|##7       | 822/3000 [55:22<1:34:49,  2.61s/it, lr: 1.0e-04 loss: 1.772e-01]mindexpander_qwen_v1:  27%|##7       | 823/3000 [55:22<1:33:17,  2.57s/it, lr: 1.0e-04 loss: 1.772e-01]mindexpander_qwen_v1:  27%|##7       | 823/3000 [55:22<1:33:17,  2.57s/it, lr: 1.0e-04 loss: 1.772e-01]mindexpander_qwen_v1:  27%|##7       | 823/3000 [55:25<1:33:17,  2.57s/it, lr: 1.0e-04 loss: 4.583e-02]mindexpander_qwen_v1:  27%|##7       | 823/3000 [55:25<1:33:17,  2.57s/it, lr: 1.0e-04 loss: 4.583e-02]mindexpander_qwen_v1:  27%|##7       | 824/3000 [55:25<1:44:40,  2.89s/it, lr: 1.0e-04 loss: 4.583e-02]mindexpander_qwen_v1:  27%|##7       | 824/3000 [55:25<1:44:40,  2.89s/it, lr: 1.0e-04 loss: 4.583e-02]mindexpander_qwen_v1:  27%|##7       | 824/3000 [55:31<1:44:40,  2.89s/it, lr: 1.0e-04 loss: 6.911e-02]mindexpander_qwen_v1:  27%|##7       | 824/3000 [55:31<1:44:40,  2.89s/it, lr: 1.0e-04 loss: 6.911e-02]mindexpander_qwen_v1:  28%|##7       | 825/3000 [55:31<2:14:43,  3.72s/it, lr: 1.0e-04 loss: 6.911e-02]mindexpander_qwen_v1:  28%|##7       | 825/3000 [55:31<2:14:43,  3.72s/it, lr: 1.0e-04 loss: 6.911e-02]mindexpander_qwen_v1:  28%|##7       | 825/3000 [55:37<2:14:43,  3.72s/it, lr: 1.0e-04 loss: 2.839e-02]mindexpander_qwen_v1:  28%|##7       | 825/3000 [55:37<2:14:43,  3.72s/it, lr: 1.0e-04 loss: 2.839e-02]mindexpander_qwen_v1:  28%|##7       | 826/3000 [55:37<2:35:45,  4.30s/it, lr: 1.0e-04 loss: 2.839e-02]mindexpander_qwen_v1:  28%|##7       | 826/3000 [55:37<2:35:45,  4.30s/it, lr: 1.0e-04 loss: 2.839e-02]mindexpander_qwen_v1:  28%|##7       | 826/3000 [55:41<2:35:45,  4.30s/it, lr: 1.0e-04 loss: 2.673e-02]mindexpander_qwen_v1:  28%|##7       | 826/3000 [55:41<2:35:45,  4.30s/it, lr: 1.0e-04 loss: 2.673e-02]mindexpander_qwen_v1:  28%|##7       | 827/3000 [55:41<2:29:50,  4.14s/it, lr: 1.0e-04 loss: 2.673e-02]mindexpander_qwen_v1:  28%|##7       | 827/3000 [55:41<2:29:50,  4.14s/it, lr: 1.0e-04 loss: 2.673e-02]mindexpander_qwen_v1:  28%|##7       | 827/3000 [55:47<2:29:50,  4.14s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  28%|##7       | 827/3000 [55:47<2:29:50,  4.14s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  28%|##7       | 828/3000 [55:47<2:46:44,  4.61s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  28%|##7       | 828/3000 [55:47<2:46:44,  4.61s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  28%|##7       | 828/3000 [55:49<2:46:44,  4.61s/it, lr: 1.0e-04 loss: 1.941e-01]mindexpander_qwen_v1:  28%|##7       | 828/3000 [55:49<2:46:44,  4.61s/it, lr: 1.0e-04 loss: 1.941e-01]mindexpander_qwen_v1:  28%|##7       | 829/3000 [55:49<2:25:35,  4.02s/it, lr: 1.0e-04 loss: 1.941e-01]mindexpander_qwen_v1:  28%|##7       | 829/3000 [55:49<2:25:35,  4.02s/it, lr: 1.0e-04 loss: 1.941e-01]mindexpander_qwen_v1:  28%|##7       | 829/3000 [55:52<2:25:35,  4.02s/it, lr: 1.0e-04 loss: 2.655e-02]mindexpander_qwen_v1:  28%|##7       | 829/3000 [55:52<2:25:35,  4.02s/it, lr: 1.0e-04 loss: 2.655e-02]mindexpander_qwen_v1:  28%|##7       | 830/3000 [55:54<2:25:31,  4.02s/it, lr: 1.0e-04 loss: 1.393e-01]mindexpander_qwen_v1:  28%|##7       | 830/3000 [55:54<2:25:31,  4.02s/it, lr: 1.0e-04 loss: 1.393e-01]mindexpander_qwen_v1:  28%|##7       | 831/3000 [55:54<1:39:04,  2.74s/it, lr: 1.0e-04 loss: 1.393e-01]mindexpander_qwen_v1:  28%|##7       | 831/3000 [55:54<1:39:04,  2.74s/it, lr: 1.0e-04 loss: 1.393e-01]mindexpander_qwen_v1:  28%|##7       | 831/3000 [56:00<1:39:04,  2.74s/it, lr: 1.0e-04 loss: 2.526e-02]mindexpander_qwen_v1:  28%|##7       | 831/3000 [56:00<1:39:04,  2.74s/it, lr: 1.0e-04 loss: 2.526e-02]mindexpander_qwen_v1:  28%|##7       | 832/3000 [56:00<2:06:55,  3.51s/it, lr: 1.0e-04 loss: 2.526e-02]mindexpander_qwen_v1:  28%|##7       | 832/3000 [56:00<2:06:55,  3.51s/it, lr: 1.0e-04 loss: 2.526e-02]mindexpander_qwen_v1:  28%|##7       | 832/3000 [56:02<2:06:55,  3.51s/it, lr: 1.0e-04 loss: 1.033e-01]mindexpander_qwen_v1:  28%|##7       | 832/3000 [56:02<2:06:55,  3.51s/it, lr: 1.0e-04 loss: 1.033e-01]mindexpander_qwen_v1:  28%|##7       | 833/3000 [56:02<1:56:49,  3.23s/it, lr: 1.0e-04 loss: 1.033e-01]mindexpander_qwen_v1:  28%|##7       | 833/3000 [56:02<1:56:49,  3.23s/it, lr: 1.0e-04 loss: 1.033e-01]mindexpander_qwen_v1:  28%|##7       | 833/3000 [56:06<1:56:49,  3.23s/it, lr: 1.0e-04 loss: 2.262e-02]mindexpander_qwen_v1:  28%|##7       | 833/3000 [56:06<1:56:49,  3.23s/it, lr: 1.0e-04 loss: 2.262e-02]mindexpander_qwen_v1:  28%|##7       | 834/3000 [56:06<2:01:40,  3.37s/it, lr: 1.0e-04 loss: 2.262e-02]mindexpander_qwen_v1:  28%|##7       | 834/3000 [56:06<2:01:40,  3.37s/it, lr: 1.0e-04 loss: 2.262e-02]mindexpander_qwen_v1:  28%|##7       | 834/3000 [56:12<2:01:40,  3.37s/it, lr: 1.0e-04 loss: 7.983e-03]mindexpander_qwen_v1:  28%|##7       | 834/3000 [56:12<2:01:40,  3.37s/it, lr: 1.0e-04 loss: 7.983e-03]mindexpander_qwen_v1:  28%|##7       | 835/3000 [56:12<2:25:36,  4.04s/it, lr: 1.0e-04 loss: 7.983e-03]mindexpander_qwen_v1:  28%|##7       | 835/3000 [56:12<2:25:36,  4.04s/it, lr: 1.0e-04 loss: 7.983e-03]mindexpander_qwen_v1:  28%|##7       | 835/3000 [56:18<2:25:36,  4.04s/it, lr: 1.0e-04 loss: 8.783e-03]mindexpander_qwen_v1:  28%|##7       | 835/3000 [56:18<2:25:36,  4.04s/it, lr: 1.0e-04 loss: 8.783e-03]mindexpander_qwen_v1:  28%|##7       | 836/3000 [56:18<2:44:28,  4.56s/it, lr: 1.0e-04 loss: 8.783e-03]mindexpander_qwen_v1:  28%|##7       | 836/3000 [56:18<2:44:28,  4.56s/it, lr: 1.0e-04 loss: 8.783e-03]mindexpander_qwen_v1:  28%|##7       | 836/3000 [56:21<2:44:28,  4.56s/it, lr: 1.0e-04 loss: 7.611e-02]mindexpander_qwen_v1:  28%|##7       | 836/3000 [56:21<2:44:28,  4.56s/it, lr: 1.0e-04 loss: 7.611e-02]mindexpander_qwen_v1:  28%|##7       | 837/3000 [56:21<2:35:48,  4.32s/it, lr: 1.0e-04 loss: 7.611e-02]mindexpander_qwen_v1:  28%|##7       | 837/3000 [56:21<2:35:48,  4.32s/it, lr: 1.0e-04 loss: 7.611e-02]mindexpander_qwen_v1:  28%|##7       | 837/3000 [56:25<2:35:48,  4.32s/it, lr: 1.0e-04 loss: 5.698e-02]mindexpander_qwen_v1:  28%|##7       | 837/3000 [56:25<2:35:48,  4.32s/it, lr: 1.0e-04 loss: 5.698e-02]mindexpander_qwen_v1:  28%|##7       | 838/3000 [56:25<2:29:33,  4.15s/it, lr: 1.0e-04 loss: 5.698e-02]mindexpander_qwen_v1:  28%|##7       | 838/3000 [56:25<2:29:33,  4.15s/it, lr: 1.0e-04 loss: 5.698e-02]mindexpander_qwen_v1:  28%|##7       | 838/3000 [56:31<2:29:33,  4.15s/it, lr: 1.0e-04 loss: 1.263e-01]mindexpander_qwen_v1:  28%|##7       | 838/3000 [56:31<2:29:33,  4.15s/it, lr: 1.0e-04 loss: 1.263e-01]mindexpander_qwen_v1:  28%|##7       | 839/3000 [56:31<2:46:28,  4.62s/it, lr: 1.0e-04 loss: 1.263e-01]mindexpander_qwen_v1:  28%|##7       | 839/3000 [56:31<2:46:28,  4.62s/it, lr: 1.0e-04 loss: 1.263e-01]mindexpander_qwen_v1:  28%|##7       | 839/3000 [56:34<2:46:28,  4.62s/it, lr: 1.0e-04 loss: 1.272e-01]mindexpander_qwen_v1:  28%|##7       | 839/3000 [56:34<2:46:28,  4.62s/it, lr: 1.0e-04 loss: 1.272e-01]mindexpander_qwen_v1:  28%|##8       | 840/3000 [56:38<2:46:24,  4.62s/it, lr: 1.0e-04 loss: 3.935e-02]mindexpander_qwen_v1:  28%|##8       | 840/3000 [56:38<2:46:24,  4.62s/it, lr: 1.0e-04 loss: 3.935e-02]mindexpander_qwen_v1:  28%|##8       | 841/3000 [56:38<2:01:10,  3.37s/it, lr: 1.0e-04 loss: 3.935e-02]mindexpander_qwen_v1:  28%|##8       | 841/3000 [56:38<2:01:10,  3.37s/it, lr: 1.0e-04 loss: 3.935e-02]mindexpander_qwen_v1:  28%|##8       | 841/3000 [56:41<2:01:10,  3.37s/it, lr: 1.0e-04 loss: 4.485e-02]mindexpander_qwen_v1:  28%|##8       | 841/3000 [56:41<2:01:10,  3.37s/it, lr: 1.0e-04 loss: 4.485e-02]mindexpander_qwen_v1:  28%|##8       | 842/3000 [56:42<2:04:24,  3.46s/it, lr: 1.0e-04 loss: 4.485e-02]mindexpander_qwen_v1:  28%|##8       | 842/3000 [56:42<2:04:24,  3.46s/it, lr: 1.0e-04 loss: 4.485e-02]mindexpander_qwen_v1:  28%|##8       | 842/3000 [56:45<2:04:24,  3.46s/it, lr: 1.0e-04 loss: 3.704e-02]mindexpander_qwen_v1:  28%|##8       | 842/3000 [56:45<2:04:24,  3.46s/it, lr: 1.0e-04 loss: 3.704e-02]mindexpander_qwen_v1:  28%|##8       | 843/3000 [56:45<2:06:59,  3.53s/it, lr: 1.0e-04 loss: 3.704e-02]mindexpander_qwen_v1:  28%|##8       | 843/3000 [56:45<2:06:59,  3.53s/it, lr: 1.0e-04 loss: 3.704e-02]mindexpander_qwen_v1:  28%|##8       | 843/3000 [56:51<2:06:59,  3.53s/it, lr: 1.0e-04 loss: 1.582e-02]mindexpander_qwen_v1:  28%|##8       | 843/3000 [56:51<2:06:59,  3.53s/it, lr: 1.0e-04 loss: 1.582e-02]mindexpander_qwen_v1:  28%|##8       | 844/3000 [56:51<2:29:57,  4.17s/it, lr: 1.0e-04 loss: 1.582e-02]mindexpander_qwen_v1:  28%|##8       | 844/3000 [56:51<2:29:57,  4.17s/it, lr: 1.0e-04 loss: 1.582e-02]mindexpander_qwen_v1:  28%|##8       | 844/3000 [56:57<2:29:57,  4.17s/it, lr: 1.0e-04 loss: 5.300e-02]mindexpander_qwen_v1:  28%|##8       | 844/3000 [56:57<2:29:57,  4.17s/it, lr: 1.0e-04 loss: 5.300e-02]mindexpander_qwen_v1:  28%|##8       | 845/3000 [56:57<2:45:44,  4.61s/it, lr: 1.0e-04 loss: 5.300e-02]mindexpander_qwen_v1:  28%|##8       | 845/3000 [56:57<2:45:44,  4.61s/it, lr: 1.0e-04 loss: 5.300e-02]mindexpander_qwen_v1:  28%|##8       | 845/3000 [57:01<2:45:44,  4.61s/it, lr: 1.0e-04 loss: 2.921e-02]mindexpander_qwen_v1:  28%|##8       | 845/3000 [57:01<2:45:44,  4.61s/it, lr: 1.0e-04 loss: 2.921e-02]mindexpander_qwen_v1:  28%|##8       | 846/3000 [57:01<2:36:44,  4.37s/it, lr: 1.0e-04 loss: 2.921e-02]mindexpander_qwen_v1:  28%|##8       | 846/3000 [57:01<2:36:44,  4.37s/it, lr: 1.0e-04 loss: 2.921e-02]mindexpander_qwen_v1:  28%|##8       | 846/3000 [57:03<2:36:44,  4.37s/it, lr: 1.0e-04 loss: 1.851e-01]mindexpander_qwen_v1:  28%|##8       | 846/3000 [57:03<2:36:44,  4.37s/it, lr: 1.0e-04 loss: 1.851e-01]mindexpander_qwen_v1:  28%|##8       | 847/3000 [57:03<2:16:48,  3.81s/it, lr: 1.0e-04 loss: 1.851e-01]mindexpander_qwen_v1:  28%|##8       | 847/3000 [57:03<2:16:48,  3.81s/it, lr: 1.0e-04 loss: 1.851e-01]mindexpander_qwen_v1:  28%|##8       | 847/3000 [57:09<2:16:48,  3.81s/it, lr: 1.0e-04 loss: 1.326e-02]mindexpander_qwen_v1:  28%|##8       | 847/3000 [57:09<2:16:48,  3.81s/it, lr: 1.0e-04 loss: 1.326e-02]mindexpander_qwen_v1:  28%|##8       | 848/3000 [57:09<2:38:31,  4.42s/it, lr: 1.0e-04 loss: 1.326e-02]mindexpander_qwen_v1:  28%|##8       | 848/3000 [57:09<2:38:31,  4.42s/it, lr: 1.0e-04 loss: 1.326e-02]mindexpander_qwen_v1:  28%|##8       | 848/3000 [57:13<2:38:31,  4.42s/it, lr: 1.0e-04 loss: 1.331e-01]mindexpander_qwen_v1:  28%|##8       | 848/3000 [57:13<2:38:31,  4.42s/it, lr: 1.0e-04 loss: 1.331e-01]mindexpander_qwen_v1:  28%|##8       | 849/3000 [57:13<2:31:18,  4.22s/it, lr: 1.0e-04 loss: 1.331e-01]mindexpander_qwen_v1:  28%|##8       | 849/3000 [57:13<2:31:18,  4.22s/it, lr: 1.0e-04 loss: 1.331e-01]mindexpander_qwen_v1:  28%|##8       | 849/3000 [57:15<2:31:18,  4.22s/it, lr: 1.0e-04 loss: 4.305e-02]mindexpander_qwen_v1:  28%|##8       | 849/3000 [57:15<2:31:18,  4.22s/it, lr: 1.0e-04 loss: 4.305e-02]mindexpander_qwen_v1:  28%|##8       | 850/3000 [57:21<2:31:14,  4.22s/it, lr: 1.0e-04 loss: 5.156e-02]mindexpander_qwen_v1:  28%|##8       | 850/3000 [57:21<2:31:14,  4.22s/it, lr: 1.0e-04 loss: 5.156e-02]mindexpander_qwen_v1:  28%|##8       | 851/3000 [57:21<2:09:12,  3.61s/it, lr: 1.0e-04 loss: 5.156e-02]mindexpander_qwen_v1:  28%|##8       | 851/3000 [57:21<2:09:12,  3.61s/it, lr: 1.0e-04 loss: 5.156e-02]mindexpander_qwen_v1:  28%|##8       | 851/3000 [57:27<2:09:12,  3.61s/it, lr: 1.0e-04 loss: 1.036e-01]mindexpander_qwen_v1:  28%|##8       | 851/3000 [57:27<2:09:12,  3.61s/it, lr: 1.0e-04 loss: 1.036e-01]mindexpander_qwen_v1:  28%|##8       | 852/3000 [57:27<2:29:10,  4.17s/it, lr: 1.0e-04 loss: 1.036e-01]mindexpander_qwen_v1:  28%|##8       | 852/3000 [57:27<2:29:10,  4.17s/it, lr: 1.0e-04 loss: 1.036e-01]mindexpander_qwen_v1:  28%|##8       | 852/3000 [57:33<2:29:10,  4.17s/it, lr: 1.0e-04 loss: 8.836e-03]mindexpander_qwen_v1:  28%|##8       | 852/3000 [57:33<2:29:10,  4.17s/it, lr: 1.0e-04 loss: 8.836e-03]mindexpander_qwen_v1:  28%|##8       | 853/3000 [57:33<2:43:53,  4.58s/it, lr: 1.0e-04 loss: 8.836e-03]mindexpander_qwen_v1:  28%|##8       | 853/3000 [57:33<2:43:53,  4.58s/it, lr: 1.0e-04 loss: 8.836e-03]mindexpander_qwen_v1:  28%|##8       | 853/3000 [57:38<2:43:53,  4.58s/it, lr: 1.0e-04 loss: 1.172e-01]mindexpander_qwen_v1:  28%|##8       | 853/3000 [57:38<2:43:53,  4.58s/it, lr: 1.0e-04 loss: 1.172e-01]mindexpander_qwen_v1:  28%|##8       | 854/3000 [57:38<2:55:13,  4.90s/it, lr: 1.0e-04 loss: 1.172e-01]mindexpander_qwen_v1:  28%|##8       | 854/3000 [57:38<2:55:13,  4.90s/it, lr: 1.0e-04 loss: 1.172e-01]mindexpander_qwen_v1:  28%|##8       | 854/3000 [57:41<2:55:13,  4.90s/it, lr: 1.0e-04 loss: 5.268e-02]mindexpander_qwen_v1:  28%|##8       | 854/3000 [57:41<2:55:13,  4.90s/it, lr: 1.0e-04 loss: 5.268e-02]mindexpander_qwen_v1:  28%|##8       | 855/3000 [57:41<2:30:43,  4.22s/it, lr: 1.0e-04 loss: 5.268e-02]mindexpander_qwen_v1:  28%|##8       | 855/3000 [57:41<2:30:43,  4.22s/it, lr: 1.0e-04 loss: 5.268e-02]mindexpander_qwen_v1:  28%|##8       | 855/3000 [57:43<2:30:43,  4.22s/it, lr: 1.0e-04 loss: 4.530e-02]mindexpander_qwen_v1:  28%|##8       | 855/3000 [57:43<2:30:43,  4.22s/it, lr: 1.0e-04 loss: 4.530e-02]mindexpander_qwen_v1:  29%|##8       | 856/3000 [57:43<2:14:37,  3.77s/it, lr: 1.0e-04 loss: 4.530e-02]mindexpander_qwen_v1:  29%|##8       | 856/3000 [57:43<2:14:37,  3.77s/it, lr: 1.0e-04 loss: 4.530e-02]mindexpander_qwen_v1:  29%|##8       | 856/3000 [57:46<2:14:37,  3.77s/it, lr: 1.0e-04 loss: 7.078e-02]mindexpander_qwen_v1:  29%|##8       | 856/3000 [57:46<2:14:37,  3.77s/it, lr: 1.0e-04 loss: 7.078e-02]mindexpander_qwen_v1:  29%|##8       | 857/3000 [57:46<2:00:52,  3.38s/it, lr: 1.0e-04 loss: 7.078e-02]mindexpander_qwen_v1:  29%|##8       | 857/3000 [57:46<2:00:52,  3.38s/it, lr: 1.0e-04 loss: 7.078e-02]mindexpander_qwen_v1:  29%|##8       | 857/3000 [57:50<2:00:52,  3.38s/it, lr: 1.0e-04 loss: 3.385e-02]mindexpander_qwen_v1:  29%|##8       | 857/3000 [57:50<2:00:52,  3.38s/it, lr: 1.0e-04 loss: 3.385e-02]mindexpander_qwen_v1:  29%|##8       | 858/3000 [57:50<2:04:32,  3.49s/it, lr: 1.0e-04 loss: 3.385e-02]mindexpander_qwen_v1:  29%|##8       | 858/3000 [57:50<2:04:32,  3.49s/it, lr: 1.0e-04 loss: 3.385e-02]mindexpander_qwen_v1:  29%|##8       | 858/3000 [57:52<2:04:32,  3.49s/it, lr: 1.0e-04 loss: 4.132e-02]mindexpander_qwen_v1:  29%|##8       | 858/3000 [57:52<2:04:32,  3.49s/it, lr: 1.0e-04 loss: 4.132e-02]mindexpander_qwen_v1:  29%|##8       | 859/3000 [57:52<1:53:33,  3.18s/it, lr: 1.0e-04 loss: 4.132e-02]mindexpander_qwen_v1:  29%|##8       | 859/3000 [57:52<1:53:33,  3.18s/it, lr: 1.0e-04 loss: 4.132e-02]mindexpander_qwen_v1:  29%|##8       | 859/3000 [57:58<1:53:33,  3.18s/it, lr: 1.0e-04 loss: 6.794e-02]mindexpander_qwen_v1:  29%|##8       | 859/3000 [57:58<1:53:33,  3.18s/it, lr: 1.0e-04 loss: 6.794e-02]mindexpander_qwen_v1:  29%|##8       | 860/3000 [58:02<1:53:30,  3.18s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  29%|##8       | 860/3000 [58:02<1:53:30,  3.18s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  29%|##8       | 861/3000 [58:02<1:32:04,  2.58s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  29%|##8       | 861/3000 [58:02<1:32:04,  2.58s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  29%|##8       | 861/3000 [58:07<1:32:04,  2.58s/it, lr: 1.0e-04 loss: 1.072e-01]mindexpander_qwen_v1:  29%|##8       | 861/3000 [58:07<1:32:04,  2.58s/it, lr: 1.0e-04 loss: 1.072e-01]mindexpander_qwen_v1:  29%|##8       | 862/3000 [58:07<1:59:47,  3.36s/it, lr: 1.0e-04 loss: 1.072e-01]mindexpander_qwen_v1:  29%|##8       | 862/3000 [58:07<1:59:47,  3.36s/it, lr: 1.0e-04 loss: 1.072e-01]mindexpander_qwen_v1:  29%|##8       | 862/3000 [58:11<1:59:47,  3.36s/it, lr: 1.0e-04 loss: 5.735e-02]mindexpander_qwen_v1:  29%|##8       | 862/3000 [58:11<1:59:47,  3.36s/it, lr: 1.0e-04 loss: 5.735e-02]mindexpander_qwen_v1:  29%|##8       | 863/3000 [58:11<2:03:15,  3.46s/it, lr: 1.0e-04 loss: 5.735e-02]mindexpander_qwen_v1:  29%|##8       | 863/3000 [58:11<2:03:15,  3.46s/it, lr: 1.0e-04 loss: 5.735e-02]mindexpander_qwen_v1:  29%|##8       | 863/3000 [58:15<2:03:15,  3.46s/it, lr: 1.0e-04 loss: 3.301e-02]mindexpander_qwen_v1:  29%|##8       | 863/3000 [58:15<2:03:15,  3.46s/it, lr: 1.0e-04 loss: 3.301e-02]mindexpander_qwen_v1:  29%|##8       | 864/3000 [58:15<2:07:33,  3.58s/it, lr: 1.0e-04 loss: 3.301e-02]mindexpander_qwen_v1:  29%|##8       | 864/3000 [58:15<2:07:33,  3.58s/it, lr: 1.0e-04 loss: 3.301e-02]mindexpander_qwen_v1:  29%|##8       | 864/3000 [58:19<2:07:33,  3.58s/it, lr: 1.0e-04 loss: 8.661e-02]mindexpander_qwen_v1:  29%|##8       | 864/3000 [58:19<2:07:33,  3.58s/it, lr: 1.0e-04 loss: 8.661e-02]mindexpander_qwen_v1:  29%|##8       | 865/3000 [58:19<2:09:04,  3.63s/it, lr: 1.0e-04 loss: 8.661e-02]mindexpander_qwen_v1:  29%|##8       | 865/3000 [58:19<2:09:04,  3.63s/it, lr: 1.0e-04 loss: 8.661e-02]mindexpander_qwen_v1:  29%|##8       | 865/3000 [58:21<2:09:04,  3.63s/it, lr: 1.0e-04 loss: 5.923e-02]mindexpander_qwen_v1:  29%|##8       | 865/3000 [58:21<2:09:04,  3.63s/it, lr: 1.0e-04 loss: 5.923e-02]mindexpander_qwen_v1:  29%|##8       | 866/3000 [58:21<1:57:04,  3.29s/it, lr: 1.0e-04 loss: 5.923e-02]mindexpander_qwen_v1:  29%|##8       | 866/3000 [58:21<1:57:04,  3.29s/it, lr: 1.0e-04 loss: 5.923e-02]mindexpander_qwen_v1:  29%|##8       | 866/3000 [58:24<1:57:04,  3.29s/it, lr: 1.0e-04 loss: 1.794e-01]mindexpander_qwen_v1:  29%|##8       | 866/3000 [58:24<1:57:04,  3.29s/it, lr: 1.0e-04 loss: 1.794e-01]mindexpander_qwen_v1:  29%|##8       | 867/3000 [58:24<1:48:23,  3.05s/it, lr: 1.0e-04 loss: 1.794e-01]mindexpander_qwen_v1:  29%|##8       | 867/3000 [58:24<1:48:23,  3.05s/it, lr: 1.0e-04 loss: 1.794e-01]mindexpander_qwen_v1:  29%|##8       | 867/3000 [58:30<1:48:23,  3.05s/it, lr: 1.0e-04 loss: 1.234e-01]mindexpander_qwen_v1:  29%|##8       | 867/3000 [58:30<1:48:23,  3.05s/it, lr: 1.0e-04 loss: 1.234e-01]mindexpander_qwen_v1:  29%|##8       | 868/3000 [58:30<2:17:46,  3.88s/it, lr: 1.0e-04 loss: 1.234e-01]mindexpander_qwen_v1:  29%|##8       | 868/3000 [58:30<2:17:46,  3.88s/it, lr: 1.0e-04 loss: 1.234e-01]mindexpander_qwen_v1:  29%|##8       | 868/3000 [58:32<2:17:46,  3.88s/it, lr: 1.0e-04 loss: 4.125e-02]mindexpander_qwen_v1:  29%|##8       | 868/3000 [58:32<2:17:46,  3.88s/it, lr: 1.0e-04 loss: 4.125e-02]mindexpander_qwen_v1:  29%|##8       | 869/3000 [58:32<2:02:47,  3.46s/it, lr: 1.0e-04 loss: 4.125e-02]mindexpander_qwen_v1:  29%|##8       | 869/3000 [58:32<2:02:47,  3.46s/it, lr: 1.0e-04 loss: 4.125e-02]mindexpander_qwen_v1:  29%|##8       | 869/3000 [58:35<2:02:47,  3.46s/it, lr: 1.0e-04 loss: 1.928e-01]mindexpander_qwen_v1:  29%|##8       | 869/3000 [58:35<2:02:47,  3.46s/it, lr: 1.0e-04 loss: 1.928e-01]mindexpander_qwen_v1:  29%|##9       | 870/3000 [58:41<2:02:43,  3.46s/it, lr: 1.0e-04 loss: 6.557e-02]mindexpander_qwen_v1:  29%|##9       | 870/3000 [58:41<2:02:43,  3.46s/it, lr: 1.0e-04 loss: 6.557e-02]mindexpander_qwen_v1:  29%|##9       | 871/3000 [58:41<1:53:22,  3.20s/it, lr: 1.0e-04 loss: 6.557e-02]mindexpander_qwen_v1:  29%|##9       | 871/3000 [58:41<1:53:22,  3.20s/it, lr: 1.0e-04 loss: 6.557e-02]mindexpander_qwen_v1:  29%|##9       | 871/3000 [58:45<1:53:22,  3.20s/it, lr: 1.0e-04 loss: 8.967e-02]mindexpander_qwen_v1:  29%|##9       | 871/3000 [58:45<1:53:22,  3.20s/it, lr: 1.0e-04 loss: 8.967e-02]mindexpander_qwen_v1:  29%|##9       | 872/3000 [58:45<2:00:14,  3.39s/it, lr: 1.0e-04 loss: 8.967e-02]mindexpander_qwen_v1:  29%|##9       | 872/3000 [58:45<2:00:14,  3.39s/it, lr: 1.0e-04 loss: 8.967e-02]mindexpander_qwen_v1:  29%|##9       | 872/3000 [58:48<2:00:14,  3.39s/it, lr: 1.0e-04 loss: 3.506e-02]mindexpander_qwen_v1:  29%|##9       | 872/3000 [58:48<2:00:14,  3.39s/it, lr: 1.0e-04 loss: 3.506e-02]mindexpander_qwen_v1:  29%|##9       | 873/3000 [58:48<2:03:35,  3.49s/it, lr: 1.0e-04 loss: 3.506e-02]mindexpander_qwen_v1:  29%|##9       | 873/3000 [58:48<2:03:35,  3.49s/it, lr: 1.0e-04 loss: 3.506e-02]mindexpander_qwen_v1:  29%|##9       | 873/3000 [58:54<2:03:35,  3.49s/it, lr: 1.0e-04 loss: 1.511e-01]mindexpander_qwen_v1:  29%|##9       | 873/3000 [58:54<2:03:35,  3.49s/it, lr: 1.0e-04 loss: 1.511e-01]mindexpander_qwen_v1:  29%|##9       | 874/3000 [58:54<2:25:16,  4.10s/it, lr: 1.0e-04 loss: 1.511e-01]mindexpander_qwen_v1:  29%|##9       | 874/3000 [58:54<2:25:16,  4.10s/it, lr: 1.0e-04 loss: 1.511e-01]mindexpander_qwen_v1:  29%|##9       | 874/3000 [58:58<2:25:16,  4.10s/it, lr: 1.0e-04 loss: 7.048e-02]mindexpander_qwen_v1:  29%|##9       | 874/3000 [58:58<2:25:16,  4.10s/it, lr: 1.0e-04 loss: 7.048e-02]mindexpander_qwen_v1:  29%|##9       | 875/3000 [58:58<2:23:27,  4.05s/it, lr: 1.0e-04 loss: 7.048e-02]mindexpander_qwen_v1:  29%|##9       | 875/3000 [58:58<2:23:27,  4.05s/it, lr: 1.0e-04 loss: 7.048e-02]mindexpander_qwen_v1:  29%|##9       | 875/3000 [59:00<2:23:27,  4.05s/it, lr: 1.0e-04 loss: 9.528e-02]mindexpander_qwen_v1:  29%|##9       | 875/3000 [59:00<2:23:27,  4.05s/it, lr: 1.0e-04 loss: 9.528e-02]mindexpander_qwen_v1:  29%|##9       | 876/3000 [59:00<2:07:13,  3.59s/it, lr: 1.0e-04 loss: 9.528e-02]mindexpander_qwen_v1:  29%|##9       | 876/3000 [59:00<2:07:13,  3.59s/it, lr: 1.0e-04 loss: 9.528e-02]mindexpander_qwen_v1:  29%|##9       | 876/3000 [59:06<2:07:13,  3.59s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:  29%|##9       | 876/3000 [59:06<2:07:13,  3.59s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:  29%|##9       | 877/3000 [59:06<2:29:21,  4.22s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:  29%|##9       | 877/3000 [59:06<2:29:21,  4.22s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:  29%|##9       | 877/3000 [59:12<2:29:21,  4.22s/it, lr: 1.0e-04 loss: 5.246e-02]mindexpander_qwen_v1:  29%|##9       | 877/3000 [59:12<2:29:21,  4.22s/it, lr: 1.0e-04 loss: 5.246e-02]mindexpander_qwen_v1:  29%|##9       | 878/3000 [59:12<2:45:09,  4.67s/it, lr: 1.0e-04 loss: 5.246e-02]mindexpander_qwen_v1:  29%|##9       | 878/3000 [59:12<2:45:09,  4.67s/it, lr: 1.0e-04 loss: 5.246e-02]mindexpander_qwen_v1:  29%|##9       | 878/3000 [59:15<2:45:09,  4.67s/it, lr: 1.0e-04 loss: 3.597e-02]mindexpander_qwen_v1:  29%|##9       | 878/3000 [59:15<2:45:09,  4.67s/it, lr: 1.0e-04 loss: 3.597e-02]mindexpander_qwen_v1:  29%|##9       | 879/3000 [59:15<2:23:53,  4.07s/it, lr: 1.0e-04 loss: 3.597e-02]mindexpander_qwen_v1:  29%|##9       | 879/3000 [59:15<2:23:53,  4.07s/it, lr: 1.0e-04 loss: 3.597e-02]mindexpander_qwen_v1:  29%|##9       | 879/3000 [59:17<2:23:53,  4.07s/it, lr: 1.0e-04 loss: 1.125e-01]mindexpander_qwen_v1:  29%|##9       | 879/3000 [59:17<2:23:53,  4.07s/it, lr: 1.0e-04 loss: 1.125e-01]mindexpander_qwen_v1:  29%|##9       | 880/3000 [59:20<2:23:49,  4.07s/it, lr: 1.0e-04 loss: 6.579e-03]mindexpander_qwen_v1:  29%|##9       | 880/3000 [59:20<2:23:49,  4.07s/it, lr: 1.0e-04 loss: 6.579e-03]mindexpander_qwen_v1:  29%|##9       | 881/3000 [59:20<1:37:47,  2.77s/it, lr: 1.0e-04 loss: 6.579e-03]mindexpander_qwen_v1:  29%|##9       | 881/3000 [59:20<1:37:47,  2.77s/it, lr: 1.0e-04 loss: 6.579e-03]mindexpander_qwen_v1:  29%|##9       | 881/3000 [59:22<1:37:47,  2.77s/it, lr: 1.0e-04 loss: 2.879e-02]mindexpander_qwen_v1:  29%|##9       | 881/3000 [59:22<1:37:47,  2.77s/it, lr: 1.0e-04 loss: 2.879e-02]mindexpander_qwen_v1:  29%|##9       | 882/3000 [59:22<1:34:57,  2.69s/it, lr: 1.0e-04 loss: 2.879e-02]mindexpander_qwen_v1:  29%|##9       | 882/3000 [59:22<1:34:57,  2.69s/it, lr: 1.0e-04 loss: 2.879e-02]mindexpander_qwen_v1:  29%|##9       | 882/3000 [59:26<1:34:57,  2.69s/it, lr: 1.0e-04 loss: 2.920e-02]mindexpander_qwen_v1:  29%|##9       | 882/3000 [59:26<1:34:57,  2.69s/it, lr: 1.0e-04 loss: 2.920e-02]mindexpander_qwen_v1:  29%|##9       | 883/3000 [59:26<1:45:55,  3.00s/it, lr: 1.0e-04 loss: 2.920e-02]mindexpander_qwen_v1:  29%|##9       | 883/3000 [59:26<1:45:55,  3.00s/it, lr: 1.0e-04 loss: 2.920e-02]mindexpander_qwen_v1:  29%|##9       | 883/3000 [59:28<1:45:55,  3.00s/it, lr: 1.0e-04 loss: 3.141e-02]mindexpander_qwen_v1:  29%|##9       | 883/3000 [59:28<1:45:55,  3.00s/it, lr: 1.0e-04 loss: 3.141e-02]mindexpander_qwen_v1:  29%|##9       | 884/3000 [59:28<1:40:34,  2.85s/it, lr: 1.0e-04 loss: 3.141e-02]mindexpander_qwen_v1:  29%|##9       | 884/3000 [59:28<1:40:34,  2.85s/it, lr: 1.0e-04 loss: 3.141e-02]mindexpander_qwen_v1:  29%|##9       | 884/3000 [59:34<1:40:34,  2.85s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  29%|##9       | 884/3000 [59:34<1:40:34,  2.85s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  30%|##9       | 885/3000 [59:34<2:09:03,  3.66s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  30%|##9       | 885/3000 [59:34<2:09:03,  3.66s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  30%|##9       | 885/3000 [59:40<2:09:03,  3.66s/it, lr: 1.0e-04 loss: 5.814e-02]mindexpander_qwen_v1:  30%|##9       | 885/3000 [59:40<2:09:03,  3.66s/it, lr: 1.0e-04 loss: 5.814e-02]mindexpander_qwen_v1:  30%|##9       | 886/3000 [59:40<2:30:01,  4.26s/it, lr: 1.0e-04 loss: 5.814e-02]mindexpander_qwen_v1:  30%|##9       | 886/3000 [59:40<2:30:01,  4.26s/it, lr: 1.0e-04 loss: 5.814e-02]mindexpander_qwen_v1:  30%|##9       | 886/3000 [59:42<2:30:01,  4.26s/it, lr: 1.0e-04 loss: 2.918e-02]mindexpander_qwen_v1:  30%|##9       | 886/3000 [59:42<2:30:01,  4.26s/it, lr: 1.0e-04 loss: 2.918e-02]mindexpander_qwen_v1:  30%|##9       | 887/3000 [59:42<2:13:24,  3.79s/it, lr: 1.0e-04 loss: 2.918e-02]mindexpander_qwen_v1:  30%|##9       | 887/3000 [59:42<2:13:24,  3.79s/it, lr: 1.0e-04 loss: 2.918e-02]mindexpander_qwen_v1:  30%|##9       | 887/3000 [59:45<2:13:24,  3.79s/it, lr: 1.0e-04 loss: 1.825e-01]mindexpander_qwen_v1:  30%|##9       | 887/3000 [59:45<2:13:24,  3.79s/it, lr: 1.0e-04 loss: 1.825e-01]mindexpander_qwen_v1:  30%|##9       | 888/3000 [59:45<1:59:31,  3.40s/it, lr: 1.0e-04 loss: 1.825e-01]mindexpander_qwen_v1:  30%|##9       | 888/3000 [59:45<1:59:31,  3.40s/it, lr: 1.0e-04 loss: 1.825e-01]mindexpander_qwen_v1:  30%|##9       | 888/3000 [59:51<1:59:31,  3.40s/it, lr: 1.0e-04 loss: 6.695e-03]mindexpander_qwen_v1:  30%|##9       | 888/3000 [59:51<1:59:31,  3.40s/it, lr: 1.0e-04 loss: 6.695e-03]mindexpander_qwen_v1:  30%|##9       | 889/3000 [59:51<2:23:54,  4.09s/it, lr: 1.0e-04 loss: 6.695e-03]mindexpander_qwen_v1:  30%|##9       | 889/3000 [59:51<2:23:54,  4.09s/it, lr: 1.0e-04 loss: 6.695e-03]mindexpander_qwen_v1:  30%|##9       | 889/3000 [59:54<2:23:54,  4.09s/it, lr: 1.0e-04 loss: 1.255e-01]mindexpander_qwen_v1:  30%|##9       | 889/3000 [59:54<2:23:54,  4.09s/it, lr: 1.0e-04 loss: 1.255e-01]mindexpander_qwen_v1:  30%|##9       | 890/3000 [59:58<2:23:50,  4.09s/it, lr: 1.0e-04 loss: 2.526e-02]mindexpander_qwen_v1:  30%|##9       | 890/3000 [59:58<2:23:50,  4.09s/it, lr: 1.0e-04 loss: 2.526e-02]mindexpander_qwen_v1:  30%|##9       | 891/3000 [59:58<1:49:20,  3.11s/it, lr: 1.0e-04 loss: 2.526e-02]mindexpander_qwen_v1:  30%|##9       | 891/3000 [59:58<1:49:20,  3.11s/it, lr: 1.0e-04 loss: 2.526e-02]mindexpander_qwen_v1:  30%|##9       | 891/3000 [1:00:02<1:49:20,  3.11s/it, lr: 1.0e-04 loss: 1.167e-01]mindexpander_qwen_v1:  30%|##9       | 891/3000 [1:00:02<1:49:20,  3.11s/it, lr: 1.0e-04 loss: 1.167e-01]mindexpander_qwen_v1:  30%|##9       | 892/3000 [1:00:02<1:54:41,  3.26s/it, lr: 1.0e-04 loss: 1.167e-01]mindexpander_qwen_v1:  30%|##9       | 892/3000 [1:00:02<1:54:41,  3.26s/it, lr: 1.0e-04 loss: 1.167e-01]mindexpander_qwen_v1:  30%|##9       | 892/3000 [1:00:08<1:54:41,  3.26s/it, lr: 1.0e-04 loss: 5.615e-02]mindexpander_qwen_v1:  30%|##9       | 892/3000 [1:00:08<1:54:41,  3.26s/it, lr: 1.0e-04 loss: 5.615e-02]mindexpander_qwen_v1:  30%|##9       | 893/3000 [1:00:08<2:17:20,  3.91s/it, lr: 1.0e-04 loss: 5.615e-02]mindexpander_qwen_v1:  30%|##9       | 893/3000 [1:00:08<2:17:20,  3.91s/it, lr: 1.0e-04 loss: 5.615e-02]mindexpander_qwen_v1:  30%|##9       | 893/3000 [1:00:12<2:17:20,  3.91s/it, lr: 1.0e-04 loss: 5.250e-02]mindexpander_qwen_v1:  30%|##9       | 893/3000 [1:00:12<2:17:20,  3.91s/it, lr: 1.0e-04 loss: 5.250e-02]mindexpander_qwen_v1:  30%|##9       | 894/3000 [1:00:12<2:15:42,  3.87s/it, lr: 1.0e-04 loss: 5.250e-02]mindexpander_qwen_v1:  30%|##9       | 894/3000 [1:00:12<2:15:42,  3.87s/it, lr: 1.0e-04 loss: 5.250e-02]mindexpander_qwen_v1:  30%|##9       | 894/3000 [1:00:14<2:15:42,  3.87s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  30%|##9       | 894/3000 [1:00:14<2:15:42,  3.87s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  30%|##9       | 895/3000 [1:00:14<2:03:32,  3.52s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  30%|##9       | 895/3000 [1:00:14<2:03:32,  3.52s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  30%|##9       | 895/3000 [1:00:18<2:03:32,  3.52s/it, lr: 1.0e-04 loss: 8.163e-02]mindexpander_qwen_v1:  30%|##9       | 895/3000 [1:00:18<2:03:32,  3.52s/it, lr: 1.0e-04 loss: 8.163e-02]mindexpander_qwen_v1:  30%|##9       | 896/3000 [1:00:18<2:05:44,  3.59s/it, lr: 1.0e-04 loss: 8.163e-02]mindexpander_qwen_v1:  30%|##9       | 896/3000 [1:00:18<2:05:44,  3.59s/it, lr: 1.0e-04 loss: 8.163e-02]mindexpander_qwen_v1:  30%|##9       | 896/3000 [1:00:24<2:05:44,  3.59s/it, lr: 1.0e-04 loss: 1.407e-01]mindexpander_qwen_v1:  30%|##9       | 896/3000 [1:00:24<2:05:44,  3.59s/it, lr: 1.0e-04 loss: 1.407e-01]mindexpander_qwen_v1:  30%|##9       | 897/3000 [1:00:24<2:27:43,  4.21s/it, lr: 1.0e-04 loss: 1.407e-01]mindexpander_qwen_v1:  30%|##9       | 897/3000 [1:00:24<2:27:43,  4.21s/it, lr: 1.0e-04 loss: 1.407e-01]mindexpander_qwen_v1:  30%|##9       | 897/3000 [1:00:29<2:27:43,  4.21s/it, lr: 1.0e-04 loss: 3.766e-02]mindexpander_qwen_v1:  30%|##9       | 897/3000 [1:00:29<2:27:43,  4.21s/it, lr: 1.0e-04 loss: 3.766e-02]mindexpander_qwen_v1:  30%|##9       | 898/3000 [1:00:29<2:43:24,  4.66s/it, lr: 1.0e-04 loss: 3.766e-02]mindexpander_qwen_v1:  30%|##9       | 898/3000 [1:00:29<2:43:24,  4.66s/it, lr: 1.0e-04 loss: 3.766e-02]mindexpander_qwen_v1:  30%|##9       | 898/3000 [1:00:33<2:43:24,  4.66s/it, lr: 1.0e-04 loss: 2.984e-02]mindexpander_qwen_v1:  30%|##9       | 898/3000 [1:00:33<2:43:24,  4.66s/it, lr: 1.0e-04 loss: 2.984e-02]mindexpander_qwen_v1:  30%|##9       | 899/3000 [1:00:33<2:35:28,  4.44s/it, lr: 1.0e-04 loss: 2.984e-02]mindexpander_qwen_v1:  30%|##9       | 899/3000 [1:00:33<2:35:28,  4.44s/it, lr: 1.0e-04 loss: 2.984e-02]mindexpander_qwen_v1:  30%|##9       | 899/3000 [1:00:37<2:35:28,  4.44s/it, lr: 1.0e-04 loss: 1.874e-01]mindexpander_qwen_v1:  30%|##9       | 899/3000 [1:00:37<2:35:28,  4.44s/it, lr: 1.0e-04 loss: 1.874e-01]mindexpander_qwen_v1:  30%|###       | 900/3000 [1:00:43<2:35:24,  4.44s/it, lr: 1.0e-04 loss: 1.799e-01]mindexpander_qwen_v1:  30%|###       | 900/3000 [1:00:43<2:35:24,  4.44s/it, lr: 1.0e-04 loss: 1.799e-01]mindexpander_qwen_v1:  30%|###       | 901/3000 [1:00:43<2:10:19,  3.73s/it, lr: 1.0e-04 loss: 1.799e-01]mindexpander_qwen_v1:  30%|###       | 901/3000 [1:00:43<2:10:19,  3.73s/it, lr: 1.0e-04 loss: 1.799e-01]mindexpander_qwen_v1:  30%|###       | 901/3000 [1:00:49<2:10:19,  3.73s/it, lr: 1.0e-04 loss: 1.489e-01]mindexpander_qwen_v1:  30%|###       | 901/3000 [1:00:49<2:10:19,  3.73s/it, lr: 1.0e-04 loss: 1.489e-01]mindexpander_qwen_v1:  30%|###       | 902/3000 [1:00:49<2:27:40,  4.22s/it, lr: 1.0e-04 loss: 1.489e-01]mindexpander_qwen_v1:  30%|###       | 902/3000 [1:00:49<2:27:40,  4.22s/it, lr: 1.0e-04 loss: 1.489e-01]mindexpander_qwen_v1:  30%|###       | 902/3000 [1:00:52<2:27:40,  4.22s/it, lr: 1.0e-04 loss: 1.876e-01]mindexpander_qwen_v1:  30%|###       | 902/3000 [1:00:52<2:27:40,  4.22s/it, lr: 1.0e-04 loss: 1.876e-01]mindexpander_qwen_v1:  30%|###       | 903/3000 [1:00:52<2:13:57,  3.83s/it, lr: 1.0e-04 loss: 1.876e-01]mindexpander_qwen_v1:  30%|###       | 903/3000 [1:00:52<2:13:57,  3.83s/it, lr: 1.0e-04 loss: 1.876e-01]mindexpander_qwen_v1:  30%|###       | 903/3000 [1:00:57<2:13:57,  3.83s/it, lr: 1.0e-04 loss: 5.714e-03]mindexpander_qwen_v1:  30%|###       | 903/3000 [1:00:57<2:13:57,  3.83s/it, lr: 1.0e-04 loss: 5.714e-03]mindexpander_qwen_v1:  30%|###       | 904/3000 [1:00:57<2:32:00,  4.35s/it, lr: 1.0e-04 loss: 5.714e-03]mindexpander_qwen_v1:  30%|###       | 904/3000 [1:00:57<2:32:00,  4.35s/it, lr: 1.0e-04 loss: 5.714e-03]mindexpander_qwen_v1:  30%|###       | 904/3000 [1:01:01<2:32:00,  4.35s/it, lr: 1.0e-04 loss: 7.247e-02]mindexpander_qwen_v1:  30%|###       | 904/3000 [1:01:01<2:32:00,  4.35s/it, lr: 1.0e-04 loss: 7.247e-02]mindexpander_qwen_v1:  30%|###       | 905/3000 [1:01:01<2:25:53,  4.18s/it, lr: 1.0e-04 loss: 7.247e-02]mindexpander_qwen_v1:  30%|###       | 905/3000 [1:01:01<2:25:53,  4.18s/it, lr: 1.0e-04 loss: 7.247e-02]mindexpander_qwen_v1:  30%|###       | 905/3000 [1:01:04<2:25:53,  4.18s/it, lr: 1.0e-04 loss: 5.222e-02]mindexpander_qwen_v1:  30%|###       | 905/3000 [1:01:04<2:25:53,  4.18s/it, lr: 1.0e-04 loss: 5.222e-02]mindexpander_qwen_v1:  30%|###       | 906/3000 [1:01:04<2:08:33,  3.68s/it, lr: 1.0e-04 loss: 5.222e-02]mindexpander_qwen_v1:  30%|###       | 906/3000 [1:01:04<2:08:33,  3.68s/it, lr: 1.0e-04 loss: 5.222e-02]mindexpander_qwen_v1:  30%|###       | 906/3000 [1:01:09<2:08:33,  3.68s/it, lr: 1.0e-04 loss: 1.973e-02]mindexpander_qwen_v1:  30%|###       | 906/3000 [1:01:09<2:08:33,  3.68s/it, lr: 1.0e-04 loss: 1.973e-02]mindexpander_qwen_v1:  30%|###       | 907/3000 [1:01:09<2:30:21,  4.31s/it, lr: 1.0e-04 loss: 1.973e-02]mindexpander_qwen_v1:  30%|###       | 907/3000 [1:01:09<2:30:21,  4.31s/it, lr: 1.0e-04 loss: 1.973e-02]mindexpander_qwen_v1:  30%|###       | 907/3000 [1:01:12<2:30:21,  4.31s/it, lr: 1.0e-04 loss: 3.179e-02]mindexpander_qwen_v1:  30%|###       | 907/3000 [1:01:12<2:30:21,  4.31s/it, lr: 1.0e-04 loss: 3.179e-02]mindexpander_qwen_v1:  30%|###       | 908/3000 [1:01:12<2:11:15,  3.76s/it, lr: 1.0e-04 loss: 3.179e-02]mindexpander_qwen_v1:  30%|###       | 908/3000 [1:01:12<2:11:15,  3.76s/it, lr: 1.0e-04 loss: 3.179e-02]mindexpander_qwen_v1:  30%|###       | 908/3000 [1:01:16<2:11:15,  3.76s/it, lr: 1.0e-04 loss: 1.662e-01]mindexpander_qwen_v1:  30%|###       | 908/3000 [1:01:16<2:11:15,  3.76s/it, lr: 1.0e-04 loss: 1.662e-01]mindexpander_qwen_v1:  30%|###       | 909/3000 [1:01:16<2:10:51,  3.75s/it, lr: 1.0e-04 loss: 1.662e-01]mindexpander_qwen_v1:  30%|###       | 909/3000 [1:01:16<2:10:51,  3.75s/it, lr: 1.0e-04 loss: 1.662e-01]mindexpander_qwen_v1:  30%|###       | 909/3000 [1:01:19<2:10:51,  3.75s/it, lr: 1.0e-04 loss: 1.728e-01]mindexpander_qwen_v1:  30%|###       | 909/3000 [1:01:19<2:10:51,  3.75s/it, lr: 1.0e-04 loss: 1.728e-01]mindexpander_qwen_v1:  30%|###       | 910/3000 [1:01:25<2:10:47,  3.75s/it, lr: 1.0e-04 loss: 8.855e-02]mindexpander_qwen_v1:  30%|###       | 910/3000 [1:01:25<2:10:47,  3.75s/it, lr: 1.0e-04 loss: 8.855e-02]mindexpander_qwen_v1:  30%|###       | 911/3000 [1:01:25<1:57:38,  3.38s/it, lr: 1.0e-04 loss: 8.855e-02]mindexpander_qwen_v1:  30%|###       | 911/3000 [1:01:25<1:57:38,  3.38s/it, lr: 1.0e-04 loss: 8.855e-02]mindexpander_qwen_v1:  30%|###       | 911/3000 [1:01:31<1:57:38,  3.38s/it, lr: 1.0e-04 loss: 2.560e-02]mindexpander_qwen_v1:  30%|###       | 911/3000 [1:01:31<1:57:38,  3.38s/it, lr: 1.0e-04 loss: 2.560e-02]mindexpander_qwen_v1:  30%|###       | 912/3000 [1:01:31<2:17:53,  3.96s/it, lr: 1.0e-04 loss: 2.560e-02]mindexpander_qwen_v1:  30%|###       | 912/3000 [1:01:31<2:17:53,  3.96s/it, lr: 1.0e-04 loss: 2.560e-02]mindexpander_qwen_v1:  30%|###       | 912/3000 [1:01:35<2:17:53,  3.96s/it, lr: 1.0e-04 loss: 2.947e-02]mindexpander_qwen_v1:  30%|###       | 912/3000 [1:01:35<2:17:53,  3.96s/it, lr: 1.0e-04 loss: 2.947e-02]mindexpander_qwen_v1:  30%|###       | 913/3000 [1:01:35<2:15:49,  3.91s/it, lr: 1.0e-04 loss: 2.947e-02]mindexpander_qwen_v1:  30%|###       | 913/3000 [1:01:35<2:15:49,  3.91s/it, lr: 1.0e-04 loss: 2.947e-02]mindexpander_qwen_v1:  30%|###       | 913/3000 [1:01:40<2:15:49,  3.91s/it, lr: 1.0e-04 loss: 3.960e-02]mindexpander_qwen_v1:  30%|###       | 913/3000 [1:01:40<2:15:49,  3.91s/it, lr: 1.0e-04 loss: 3.960e-02]mindexpander_qwen_v1:  30%|###       | 914/3000 [1:01:40<2:33:09,  4.41s/it, lr: 1.0e-04 loss: 3.960e-02]mindexpander_qwen_v1:  30%|###       | 914/3000 [1:01:40<2:33:09,  4.41s/it, lr: 1.0e-04 loss: 3.960e-02]mindexpander_qwen_v1:  30%|###       | 914/3000 [1:01:46<2:33:09,  4.41s/it, lr: 1.0e-04 loss: 1.811e-01]mindexpander_qwen_v1:  30%|###       | 914/3000 [1:01:46<2:33:09,  4.41s/it, lr: 1.0e-04 loss: 1.811e-01]mindexpander_qwen_v1:  30%|###       | 915/3000 [1:01:46<2:47:49,  4.83s/it, lr: 1.0e-04 loss: 1.811e-01]mindexpander_qwen_v1:  30%|###       | 915/3000 [1:01:46<2:47:49,  4.83s/it, lr: 1.0e-04 loss: 1.811e-01]mindexpander_qwen_v1:  30%|###       | 915/3000 [1:01:49<2:47:49,  4.83s/it, lr: 1.0e-04 loss: 8.368e-03]mindexpander_qwen_v1:  30%|###       | 915/3000 [1:01:49<2:47:49,  4.83s/it, lr: 1.0e-04 loss: 8.368e-03]mindexpander_qwen_v1:  31%|###       | 916/3000 [1:01:49<2:24:09,  4.15s/it, lr: 1.0e-04 loss: 8.368e-03]mindexpander_qwen_v1:  31%|###       | 916/3000 [1:01:49<2:24:09,  4.15s/it, lr: 1.0e-04 loss: 8.368e-03]mindexpander_qwen_v1:  31%|###       | 916/3000 [1:01:51<2:24:09,  4.15s/it, lr: 1.0e-04 loss: 3.026e-02]mindexpander_qwen_v1:  31%|###       | 916/3000 [1:01:51<2:24:09,  4.15s/it, lr: 1.0e-04 loss: 3.026e-02]mindexpander_qwen_v1:  31%|###       | 917/3000 [1:01:51<2:06:58,  3.66s/it, lr: 1.0e-04 loss: 3.026e-02]mindexpander_qwen_v1:  31%|###       | 917/3000 [1:01:51<2:06:58,  3.66s/it, lr: 1.0e-04 loss: 3.026e-02]mindexpander_qwen_v1:  31%|###       | 917/3000 [1:01:54<2:06:58,  3.66s/it, lr: 1.0e-04 loss: 5.493e-03]mindexpander_qwen_v1:  31%|###       | 917/3000 [1:01:54<2:06:58,  3.66s/it, lr: 1.0e-04 loss: 5.493e-03]mindexpander_qwen_v1:  31%|###       | 918/3000 [1:01:54<1:56:34,  3.36s/it, lr: 1.0e-04 loss: 5.493e-03]mindexpander_qwen_v1:  31%|###       | 918/3000 [1:01:54<1:56:34,  3.36s/it, lr: 1.0e-04 loss: 5.493e-03]mindexpander_qwen_v1:  31%|###       | 918/3000 [1:01:58<1:56:34,  3.36s/it, lr: 1.0e-04 loss: 1.480e-01]mindexpander_qwen_v1:  31%|###       | 918/3000 [1:01:58<1:56:34,  3.36s/it, lr: 1.0e-04 loss: 1.480e-01]mindexpander_qwen_v1:  31%|###       | 919/3000 [1:01:58<2:00:26,  3.47s/it, lr: 1.0e-04 loss: 1.480e-01]mindexpander_qwen_v1:  31%|###       | 919/3000 [1:01:58<2:00:26,  3.47s/it, lr: 1.0e-04 loss: 1.480e-01]mindexpander_qwen_v1:  31%|###       | 919/3000 [1:02:00<2:00:26,  3.47s/it, lr: 1.0e-04 loss: 5.341e-02]mindexpander_qwen_v1:  31%|###       | 919/3000 [1:02:00<2:00:26,  3.47s/it, lr: 1.0e-04 loss: 5.341e-02]mindexpander_qwen_v1:  31%|###       | 920/3000 [1:02:04<2:00:23,  3.47s/it, lr: 1.0e-04 loss: 1.082e-01]mindexpander_qwen_v1:  31%|###       | 920/3000 [1:02:04<2:00:23,  3.47s/it, lr: 1.0e-04 loss: 1.082e-01]mindexpander_qwen_v1:  31%|###       | 921/3000 [1:02:04<1:34:55,  2.74s/it, lr: 1.0e-04 loss: 1.082e-01]mindexpander_qwen_v1:  31%|###       | 921/3000 [1:02:04<1:34:55,  2.74s/it, lr: 1.0e-04 loss: 1.082e-01]mindexpander_qwen_v1:  31%|###       | 921/3000 [1:02:10<1:34:55,  2.74s/it, lr: 1.0e-04 loss: 1.026e-01]mindexpander_qwen_v1:  31%|###       | 921/3000 [1:02:10<1:34:55,  2.74s/it, lr: 1.0e-04 loss: 1.026e-01]mindexpander_qwen_v1:  31%|###       | 922/3000 [1:02:10<2:01:39,  3.51s/it, lr: 1.0e-04 loss: 1.026e-01]mindexpander_qwen_v1:  31%|###       | 922/3000 [1:02:10<2:01:39,  3.51s/it, lr: 1.0e-04 loss: 1.026e-01]mindexpander_qwen_v1:  31%|###       | 922/3000 [1:02:12<2:01:39,  3.51s/it, lr: 1.0e-04 loss: 1.863e-01]mindexpander_qwen_v1:  31%|###       | 922/3000 [1:02:12<2:01:39,  3.51s/it, lr: 1.0e-04 loss: 1.863e-01]mindexpander_qwen_v1:  31%|###       | 923/3000 [1:02:12<1:52:02,  3.24s/it, lr: 1.0e-04 loss: 1.863e-01]mindexpander_qwen_v1:  31%|###       | 923/3000 [1:02:12<1:52:02,  3.24s/it, lr: 1.0e-04 loss: 1.863e-01]mindexpander_qwen_v1:  31%|###       | 923/3000 [1:02:18<1:52:02,  3.24s/it, lr: 1.0e-04 loss: 1.564e-01]mindexpander_qwen_v1:  31%|###       | 923/3000 [1:02:18<1:52:02,  3.24s/it, lr: 1.0e-04 loss: 1.564e-01]mindexpander_qwen_v1:  31%|###       | 924/3000 [1:02:18<2:15:35,  3.92s/it, lr: 1.0e-04 loss: 1.564e-01]mindexpander_qwen_v1:  31%|###       | 924/3000 [1:02:18<2:15:35,  3.92s/it, lr: 1.0e-04 loss: 1.564e-01]mindexpander_qwen_v1:  31%|###       | 924/3000 [1:02:20<2:15:35,  3.92s/it, lr: 1.0e-04 loss: 1.793e-01]mindexpander_qwen_v1:  31%|###       | 924/3000 [1:02:20<2:15:35,  3.92s/it, lr: 1.0e-04 loss: 1.793e-01]mindexpander_qwen_v1:  31%|###       | 925/3000 [1:02:20<2:01:22,  3.51s/it, lr: 1.0e-04 loss: 1.793e-01]mindexpander_qwen_v1:  31%|###       | 925/3000 [1:02:20<2:01:22,  3.51s/it, lr: 1.0e-04 loss: 1.793e-01]mindexpander_qwen_v1:  31%|###       | 925/3000 [1:02:24<2:01:22,  3.51s/it, lr: 1.0e-04 loss: 7.688e-02]mindexpander_qwen_v1:  31%|###       | 925/3000 [1:02:24<2:01:22,  3.51s/it, lr: 1.0e-04 loss: 7.688e-02]mindexpander_qwen_v1:  31%|###       | 926/3000 [1:02:24<2:05:21,  3.63s/it, lr: 1.0e-04 loss: 7.688e-02]mindexpander_qwen_v1:  31%|###       | 926/3000 [1:02:24<2:05:21,  3.63s/it, lr: 1.0e-04 loss: 7.688e-02]mindexpander_qwen_v1:  31%|###       | 926/3000 [1:02:28<2:05:21,  3.63s/it, lr: 1.0e-04 loss: 2.789e-02]mindexpander_qwen_v1:  31%|###       | 926/3000 [1:02:28<2:05:21,  3.63s/it, lr: 1.0e-04 loss: 2.789e-02]mindexpander_qwen_v1:  31%|###       | 927/3000 [1:02:28<2:06:21,  3.66s/it, lr: 1.0e-04 loss: 2.789e-02]mindexpander_qwen_v1:  31%|###       | 927/3000 [1:02:28<2:06:21,  3.66s/it, lr: 1.0e-04 loss: 2.789e-02]mindexpander_qwen_v1:  31%|###       | 927/3000 [1:02:30<2:06:21,  3.66s/it, lr: 1.0e-04 loss: 1.629e-01]mindexpander_qwen_v1:  31%|###       | 927/3000 [1:02:30<2:06:21,  3.66s/it, lr: 1.0e-04 loss: 1.629e-01]mindexpander_qwen_v1:  31%|###       | 928/3000 [1:02:30<1:54:06,  3.30s/it, lr: 1.0e-04 loss: 1.629e-01]mindexpander_qwen_v1:  31%|###       | 928/3000 [1:02:30<1:54:06,  3.30s/it, lr: 1.0e-04 loss: 1.629e-01]mindexpander_qwen_v1:  31%|###       | 928/3000 [1:02:34<1:54:06,  3.30s/it, lr: 1.0e-04 loss: 1.466e-02]mindexpander_qwen_v1:  31%|###       | 928/3000 [1:02:34<1:54:06,  3.30s/it, lr: 1.0e-04 loss: 1.466e-02]mindexpander_qwen_v1:  31%|###       | 929/3000 [1:02:34<1:58:30,  3.43s/it, lr: 1.0e-04 loss: 1.466e-02]mindexpander_qwen_v1:  31%|###       | 929/3000 [1:02:34<1:58:30,  3.43s/it, lr: 1.0e-04 loss: 1.466e-02]mindexpander_qwen_v1:  31%|###       | 929/3000 [1:02:40<1:58:30,  3.43s/it, lr: 1.0e-04 loss: 1.103e-01]mindexpander_qwen_v1:  31%|###       | 929/3000 [1:02:40<1:58:30,  3.43s/it, lr: 1.0e-04 loss: 1.103e-01]mindexpander_qwen_v1:  31%|###1      | 930/3000 [1:02:46<1:58:27,  3.43s/it, lr: 1.0e-04 loss: 4.654e-02]mindexpander_qwen_v1:  31%|###1      | 930/3000 [1:02:46<1:58:27,  3.43s/it, lr: 1.0e-04 loss: 4.654e-02]mindexpander_qwen_v1:  31%|###1      | 931/3000 [1:02:46<1:49:38,  3.18s/it, lr: 1.0e-04 loss: 4.654e-02]mindexpander_qwen_v1:  31%|###1      | 931/3000 [1:02:46<1:49:38,  3.18s/it, lr: 1.0e-04 loss: 4.654e-02]mindexpander_qwen_v1:  31%|###1      | 931/3000 [1:02:52<1:49:38,  3.18s/it, lr: 1.0e-04 loss: 1.308e-01]mindexpander_qwen_v1:  31%|###1      | 931/3000 [1:02:52<1:49:38,  3.18s/it, lr: 1.0e-04 loss: 1.308e-01]mindexpander_qwen_v1:  31%|###1      | 932/3000 [1:02:52<2:11:24,  3.81s/it, lr: 1.0e-04 loss: 1.308e-01]mindexpander_qwen_v1:  31%|###1      | 932/3000 [1:02:52<2:11:24,  3.81s/it, lr: 1.0e-04 loss: 1.308e-01]mindexpander_qwen_v1:  31%|###1      | 932/3000 [1:02:56<2:11:24,  3.81s/it, lr: 1.0e-04 loss: 1.707e-01]mindexpander_qwen_v1:  31%|###1      | 932/3000 [1:02:56<2:11:24,  3.81s/it, lr: 1.0e-04 loss: 1.707e-01]mindexpander_qwen_v1:  31%|###1      | 933/3000 [1:02:56<2:10:51,  3.80s/it, lr: 1.0e-04 loss: 1.707e-01]mindexpander_qwen_v1:  31%|###1      | 933/3000 [1:02:56<2:10:51,  3.80s/it, lr: 1.0e-04 loss: 1.707e-01]mindexpander_qwen_v1:  31%|###1      | 933/3000 [1:02:58<2:10:51,  3.80s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  31%|###1      | 933/3000 [1:02:58<2:10:51,  3.80s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  31%|###1      | 934/3000 [1:02:58<2:00:01,  3.49s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  31%|###1      | 934/3000 [1:02:58<2:00:01,  3.49s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  31%|###1      | 934/3000 [1:03:04<2:00:01,  3.49s/it, lr: 1.0e-04 loss: 6.050e-02]mindexpander_qwen_v1:  31%|###1      | 934/3000 [1:03:04<2:00:01,  3.49s/it, lr: 1.0e-04 loss: 6.050e-02]mindexpander_qwen_v1:  31%|###1      | 935/3000 [1:03:04<2:21:46,  4.12s/it, lr: 1.0e-04 loss: 6.050e-02]mindexpander_qwen_v1:  31%|###1      | 935/3000 [1:03:04<2:21:46,  4.12s/it, lr: 1.0e-04 loss: 6.050e-02]mindexpander_qwen_v1:  31%|###1      | 935/3000 [1:03:07<2:21:46,  4.12s/it, lr: 1.0e-04 loss: 1.985e-01]mindexpander_qwen_v1:  31%|###1      | 935/3000 [1:03:07<2:21:46,  4.12s/it, lr: 1.0e-04 loss: 1.985e-01]mindexpander_qwen_v1:  31%|###1      | 936/3000 [1:03:07<2:05:20,  3.64s/it, lr: 1.0e-04 loss: 1.985e-01]mindexpander_qwen_v1:  31%|###1      | 936/3000 [1:03:07<2:05:20,  3.64s/it, lr: 1.0e-04 loss: 1.985e-01]mindexpander_qwen_v1:  31%|###1      | 936/3000 [1:03:09<2:05:20,  3.64s/it, lr: 1.0e-04 loss: 2.377e-02]mindexpander_qwen_v1:  31%|###1      | 936/3000 [1:03:09<2:05:20,  3.64s/it, lr: 1.0e-04 loss: 2.377e-02]mindexpander_qwen_v1:  31%|###1      | 937/3000 [1:03:09<1:53:24,  3.30s/it, lr: 1.0e-04 loss: 2.377e-02]mindexpander_qwen_v1:  31%|###1      | 937/3000 [1:03:09<1:53:24,  3.30s/it, lr: 1.0e-04 loss: 2.377e-02]mindexpander_qwen_v1:  31%|###1      | 937/3000 [1:03:12<1:53:24,  3.30s/it, lr: 1.0e-04 loss: 1.539e-01]mindexpander_qwen_v1:  31%|###1      | 937/3000 [1:03:12<1:53:24,  3.30s/it, lr: 1.0e-04 loss: 1.539e-01]mindexpander_qwen_v1:  31%|###1      | 938/3000 [1:03:12<1:46:36,  3.10s/it, lr: 1.0e-04 loss: 1.539e-01]mindexpander_qwen_v1:  31%|###1      | 938/3000 [1:03:12<1:46:36,  3.10s/it, lr: 1.0e-04 loss: 1.539e-01]mindexpander_qwen_v1:  31%|###1      | 938/3000 [1:03:17<1:46:36,  3.10s/it, lr: 1.0e-04 loss: 2.254e-02]mindexpander_qwen_v1:  31%|###1      | 938/3000 [1:03:17<1:46:36,  3.10s/it, lr: 1.0e-04 loss: 2.254e-02]mindexpander_qwen_v1:  31%|###1      | 939/3000 [1:03:17<2:13:23,  3.88s/it, lr: 1.0e-04 loss: 2.254e-02]mindexpander_qwen_v1:  31%|###1      | 939/3000 [1:03:17<2:13:23,  3.88s/it, lr: 1.0e-04 loss: 2.254e-02]mindexpander_qwen_v1:  31%|###1      | 939/3000 [1:03:20<2:13:23,  3.88s/it, lr: 1.0e-04 loss: 8.729e-02]mindexpander_qwen_v1:  31%|###1      | 939/3000 [1:03:20<2:13:23,  3.88s/it, lr: 1.0e-04 loss: 8.729e-02]mindexpander_qwen_v1:  31%|###1      | 940/3000 [1:03:24<2:13:19,  3.88s/it, lr: 1.0e-04 loss: 1.326e-01]mindexpander_qwen_v1:  31%|###1      | 940/3000 [1:03:24<2:13:19,  3.88s/it, lr: 1.0e-04 loss: 1.326e-01]mindexpander_qwen_v1:  31%|###1      | 941/3000 [1:03:24<1:41:42,  2.96s/it, lr: 1.0e-04 loss: 1.326e-01]mindexpander_qwen_v1:  31%|###1      | 941/3000 [1:03:24<1:41:42,  2.96s/it, lr: 1.0e-04 loss: 1.326e-01]mindexpander_qwen_v1:  31%|###1      | 941/3000 [1:03:28<1:41:42,  2.96s/it, lr: 1.0e-04 loss: 2.039e-02]mindexpander_qwen_v1:  31%|###1      | 941/3000 [1:03:28<1:41:42,  2.96s/it, lr: 1.0e-04 loss: 2.039e-02]mindexpander_qwen_v1:  31%|###1      | 942/3000 [1:03:28<1:49:37,  3.20s/it, lr: 1.0e-04 loss: 2.039e-02]mindexpander_qwen_v1:  31%|###1      | 942/3000 [1:03:28<1:49:37,  3.20s/it, lr: 1.0e-04 loss: 2.039e-02]mindexpander_qwen_v1:  31%|###1      | 942/3000 [1:03:33<1:49:37,  3.20s/it, lr: 1.0e-04 loss: 1.223e-01]mindexpander_qwen_v1:  31%|###1      | 942/3000 [1:03:33<1:49:37,  3.20s/it, lr: 1.0e-04 loss: 1.223e-01]mindexpander_qwen_v1:  31%|###1      | 943/3000 [1:03:33<2:12:25,  3.86s/it, lr: 1.0e-04 loss: 1.223e-01]mindexpander_qwen_v1:  31%|###1      | 943/3000 [1:03:33<2:12:25,  3.86s/it, lr: 1.0e-04 loss: 1.223e-01]mindexpander_qwen_v1:  31%|###1      | 943/3000 [1:03:39<2:12:25,  3.86s/it, lr: 1.0e-04 loss: 1.361e-01]mindexpander_qwen_v1:  31%|###1      | 943/3000 [1:03:39<2:12:25,  3.86s/it, lr: 1.0e-04 loss: 1.361e-01]mindexpander_qwen_v1:  31%|###1      | 944/3000 [1:03:39<2:29:54,  4.37s/it, lr: 1.0e-04 loss: 1.361e-01]mindexpander_qwen_v1:  31%|###1      | 944/3000 [1:03:39<2:29:54,  4.37s/it, lr: 1.0e-04 loss: 1.361e-01]mindexpander_qwen_v1:  31%|###1      | 944/3000 [1:03:41<2:29:54,  4.37s/it, lr: 1.0e-04 loss: 9.832e-02]mindexpander_qwen_v1:  31%|###1      | 944/3000 [1:03:41<2:29:54,  4.37s/it, lr: 1.0e-04 loss: 9.832e-02]mindexpander_qwen_v1:  32%|###1      | 945/3000 [1:03:41<2:11:21,  3.84s/it, lr: 1.0e-04 loss: 9.832e-02]mindexpander_qwen_v1:  32%|###1      | 945/3000 [1:03:41<2:11:21,  3.84s/it, lr: 1.0e-04 loss: 9.832e-02]mindexpander_qwen_v1:  32%|###1      | 945/3000 [1:03:44<2:11:21,  3.84s/it, lr: 1.0e-04 loss: 2.271e-02]mindexpander_qwen_v1:  32%|###1      | 945/3000 [1:03:44<2:11:21,  3.84s/it, lr: 1.0e-04 loss: 2.271e-02]mindexpander_qwen_v1:  32%|###1      | 946/3000 [1:03:44<1:59:55,  3.50s/it, lr: 1.0e-04 loss: 2.271e-02]mindexpander_qwen_v1:  32%|###1      | 946/3000 [1:03:44<1:59:55,  3.50s/it, lr: 1.0e-04 loss: 2.271e-02]mindexpander_qwen_v1:  32%|###1      | 946/3000 [1:03:50<1:59:55,  3.50s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  32%|###1      | 946/3000 [1:03:50<1:59:55,  3.50s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  32%|###1      | 947/3000 [1:03:50<2:22:06,  4.15s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  32%|###1      | 947/3000 [1:03:50<2:22:06,  4.15s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  32%|###1      | 947/3000 [1:03:54<2:22:06,  4.15s/it, lr: 1.0e-04 loss: 9.188e-02]mindexpander_qwen_v1:  32%|###1      | 947/3000 [1:03:54<2:22:06,  4.15s/it, lr: 1.0e-04 loss: 9.188e-02]mindexpander_qwen_v1:  32%|###1      | 948/3000 [1:03:54<2:17:54,  4.03s/it, lr: 1.0e-04 loss: 9.188e-02]mindexpander_qwen_v1:  32%|###1      | 948/3000 [1:03:54<2:17:54,  4.03s/it, lr: 1.0e-04 loss: 9.188e-02]mindexpander_qwen_v1:  32%|###1      | 948/3000 [1:03:57<2:17:54,  4.03s/it, lr: 1.0e-04 loss: 5.449e-02]mindexpander_qwen_v1:  32%|###1      | 948/3000 [1:03:57<2:17:54,  4.03s/it, lr: 1.0e-04 loss: 5.449e-02]mindexpander_qwen_v1:  32%|###1      | 949/3000 [1:03:57<2:14:53,  3.95s/it, lr: 1.0e-04 loss: 5.449e-02]mindexpander_qwen_v1:  32%|###1      | 949/3000 [1:03:57<2:14:53,  3.95s/it, lr: 1.0e-04 loss: 5.449e-02]mindexpander_qwen_v1:  32%|###1      | 949/3000 [1:04:01<2:14:53,  3.95s/it, lr: 1.0e-04 loss: 1.974e-01]mindexpander_qwen_v1:  32%|###1      | 949/3000 [1:04:01<2:14:53,  3.95s/it, lr: 1.0e-04 loss: 1.974e-01]mindexpander_qwen_v1:  32%|###1      | 950/3000 [1:04:05<2:14:49,  3.95s/it, lr: 1.0e-04 loss: 1.284e-01]mindexpander_qwen_v1:  32%|###1      | 950/3000 [1:04:05<2:14:49,  3.95s/it, lr: 1.0e-04 loss: 1.284e-01]mindexpander_qwen_v1:  32%|###1      | 951/3000 [1:04:05<1:42:19,  3.00s/it, lr: 1.0e-04 loss: 1.284e-01]mindexpander_qwen_v1:  32%|###1      | 951/3000 [1:04:05<1:42:19,  3.00s/it, lr: 1.0e-04 loss: 1.284e-01]mindexpander_qwen_v1:  32%|###1      | 951/3000 [1:04:09<1:42:19,  3.00s/it, lr: 1.0e-04 loss: 1.136e-01]mindexpander_qwen_v1:  32%|###1      | 951/3000 [1:04:09<1:42:19,  3.00s/it, lr: 1.0e-04 loss: 1.136e-01]mindexpander_qwen_v1:  32%|###1      | 952/3000 [1:04:09<1:48:29,  3.18s/it, lr: 1.0e-04 loss: 1.136e-01]mindexpander_qwen_v1:  32%|###1      | 952/3000 [1:04:09<1:48:29,  3.18s/it, lr: 1.0e-04 loss: 1.136e-01]mindexpander_qwen_v1:  32%|###1      | 952/3000 [1:04:11<1:48:29,  3.18s/it, lr: 1.0e-04 loss: 7.934e-02]mindexpander_qwen_v1:  32%|###1      | 952/3000 [1:04:11<1:48:29,  3.18s/it, lr: 1.0e-04 loss: 7.934e-02]mindexpander_qwen_v1:  32%|###1      | 953/3000 [1:04:11<1:41:58,  2.99s/it, lr: 1.0e-04 loss: 7.934e-02]mindexpander_qwen_v1:  32%|###1      | 953/3000 [1:04:11<1:41:58,  2.99s/it, lr: 1.0e-04 loss: 7.934e-02]mindexpander_qwen_v1:  32%|###1      | 953/3000 [1:04:14<1:41:58,  2.99s/it, lr: 1.0e-04 loss: 3.850e-03]mindexpander_qwen_v1:  32%|###1      | 953/3000 [1:04:14<1:41:58,  2.99s/it, lr: 1.0e-04 loss: 3.850e-03]mindexpander_qwen_v1:  32%|###1      | 954/3000 [1:04:14<1:38:42,  2.89s/it, lr: 1.0e-04 loss: 3.850e-03]mindexpander_qwen_v1:  32%|###1      | 954/3000 [1:04:14<1:38:42,  2.89s/it, lr: 1.0e-04 loss: 3.850e-03]mindexpander_qwen_v1:  32%|###1      | 954/3000 [1:04:18<1:38:42,  2.89s/it, lr: 1.0e-04 loss: 8.689e-02]mindexpander_qwen_v1:  32%|###1      | 954/3000 [1:04:18<1:38:42,  2.89s/it, lr: 1.0e-04 loss: 8.689e-02]mindexpander_qwen_v1:  32%|###1      | 955/3000 [1:04:18<1:46:42,  3.13s/it, lr: 1.0e-04 loss: 8.689e-02]mindexpander_qwen_v1:  32%|###1      | 955/3000 [1:04:18<1:46:42,  3.13s/it, lr: 1.0e-04 loss: 8.689e-02]mindexpander_qwen_v1:  32%|###1      | 955/3000 [1:04:23<1:46:42,  3.13s/it, lr: 1.0e-04 loss: 1.136e-02]mindexpander_qwen_v1:  32%|###1      | 955/3000 [1:04:23<1:46:42,  3.13s/it, lr: 1.0e-04 loss: 1.136e-02]mindexpander_qwen_v1:  32%|###1      | 956/3000 [1:04:23<2:12:09,  3.88s/it, lr: 1.0e-04 loss: 1.136e-02]mindexpander_qwen_v1:  32%|###1      | 956/3000 [1:04:23<2:12:09,  3.88s/it, lr: 1.0e-04 loss: 1.136e-02]mindexpander_qwen_v1:  32%|###1      | 956/3000 [1:04:26<2:12:09,  3.88s/it, lr: 1.0e-04 loss: 6.777e-02]mindexpander_qwen_v1:  32%|###1      | 956/3000 [1:04:26<2:12:09,  3.88s/it, lr: 1.0e-04 loss: 6.777e-02]mindexpander_qwen_v1:  32%|###1      | 957/3000 [1:04:26<1:58:00,  3.47s/it, lr: 1.0e-04 loss: 6.777e-02]mindexpander_qwen_v1:  32%|###1      | 957/3000 [1:04:26<1:58:00,  3.47s/it, lr: 1.0e-04 loss: 6.777e-02]mindexpander_qwen_v1:  32%|###1      | 957/3000 [1:04:30<1:58:00,  3.47s/it, lr: 1.0e-04 loss: 1.582e-01]mindexpander_qwen_v1:  32%|###1      | 957/3000 [1:04:30<1:58:00,  3.47s/it, lr: 1.0e-04 loss: 1.582e-01]mindexpander_qwen_v1:  32%|###1      | 958/3000 [1:04:30<2:02:17,  3.59s/it, lr: 1.0e-04 loss: 1.582e-01]mindexpander_qwen_v1:  32%|###1      | 958/3000 [1:04:30<2:02:17,  3.59s/it, lr: 1.0e-04 loss: 1.582e-01]mindexpander_qwen_v1:  32%|###1      | 958/3000 [1:04:35<2:02:17,  3.59s/it, lr: 1.0e-04 loss: 2.451e-02]mindexpander_qwen_v1:  32%|###1      | 958/3000 [1:04:35<2:02:17,  3.59s/it, lr: 1.0e-04 loss: 2.451e-02]mindexpander_qwen_v1:  32%|###1      | 959/3000 [1:04:35<2:23:54,  4.23s/it, lr: 1.0e-04 loss: 2.451e-02]mindexpander_qwen_v1:  32%|###1      | 959/3000 [1:04:35<2:23:54,  4.23s/it, lr: 1.0e-04 loss: 2.451e-02]mindexpander_qwen_v1:  32%|###1      | 959/3000 [1:04:42<2:23:54,  4.23s/it, lr: 1.0e-04 loss: 1.582e-02]mindexpander_qwen_v1:  32%|###1      | 959/3000 [1:04:42<2:23:54,  4.23s/it, lr: 1.0e-04 loss: 1.582e-02]mindexpander_qwen_v1:  32%|###2      | 960/3000 [1:04:44<2:23:50,  4.23s/it, lr: 1.0e-04 loss: 3.405e-02]mindexpander_qwen_v1:  32%|###2      | 960/3000 [1:04:44<2:23:50,  4.23s/it, lr: 1.0e-04 loss: 3.405e-02]mindexpander_qwen_v1:  32%|###2      | 961/3000 [1:04:44<1:37:05,  2.86s/it, lr: 1.0e-04 loss: 3.405e-02]mindexpander_qwen_v1:  32%|###2      | 961/3000 [1:04:44<1:37:05,  2.86s/it, lr: 1.0e-04 loss: 3.405e-02]mindexpander_qwen_v1:  32%|###2      | 961/3000 [1:04:48<1:37:05,  2.86s/it, lr: 1.0e-04 loss: 7.126e-02]mindexpander_qwen_v1:  32%|###2      | 961/3000 [1:04:48<1:37:05,  2.86s/it, lr: 1.0e-04 loss: 7.126e-02]mindexpander_qwen_v1:  32%|###2      | 962/3000 [1:04:48<1:46:31,  3.14s/it, lr: 1.0e-04 loss: 7.126e-02]mindexpander_qwen_v1:  32%|###2      | 962/3000 [1:04:48<1:46:31,  3.14s/it, lr: 1.0e-04 loss: 7.126e-02]mindexpander_qwen_v1:  32%|###2      | 962/3000 [1:04:52<1:46:31,  3.14s/it, lr: 1.0e-04 loss: 7.057e-02]mindexpander_qwen_v1:  32%|###2      | 962/3000 [1:04:52<1:46:31,  3.14s/it, lr: 1.0e-04 loss: 7.057e-02]mindexpander_qwen_v1:  32%|###2      | 963/3000 [1:04:52<1:51:47,  3.29s/it, lr: 1.0e-04 loss: 7.057e-02]mindexpander_qwen_v1:  32%|###2      | 963/3000 [1:04:52<1:51:47,  3.29s/it, lr: 1.0e-04 loss: 7.057e-02]mindexpander_qwen_v1:  32%|###2      | 963/3000 [1:04:54<1:51:47,  3.29s/it, lr: 1.0e-04 loss: 7.563e-02]mindexpander_qwen_v1:  32%|###2      | 963/3000 [1:04:54<1:51:47,  3.29s/it, lr: 1.0e-04 loss: 7.563e-02]mindexpander_qwen_v1:  32%|###2      | 964/3000 [1:04:54<1:44:01,  3.07s/it, lr: 1.0e-04 loss: 7.563e-02]mindexpander_qwen_v1:  32%|###2      | 964/3000 [1:04:54<1:44:01,  3.07s/it, lr: 1.0e-04 loss: 7.563e-02]mindexpander_qwen_v1:  32%|###2      | 964/3000 [1:04:57<1:44:01,  3.07s/it, lr: 1.0e-04 loss: 3.850e-02]mindexpander_qwen_v1:  32%|###2      | 964/3000 [1:04:57<1:44:01,  3.07s/it, lr: 1.0e-04 loss: 3.850e-02]mindexpander_qwen_v1:  32%|###2      | 965/3000 [1:04:57<1:38:09,  2.89s/it, lr: 1.0e-04 loss: 3.850e-02]mindexpander_qwen_v1:  32%|###2      | 965/3000 [1:04:57<1:38:09,  2.89s/it, lr: 1.0e-04 loss: 3.850e-02]mindexpander_qwen_v1:  32%|###2      | 965/3000 [1:05:01<1:38:09,  2.89s/it, lr: 1.0e-04 loss: 6.827e-02]mindexpander_qwen_v1:  32%|###2      | 965/3000 [1:05:01<1:38:09,  2.89s/it, lr: 1.0e-04 loss: 6.827e-02]mindexpander_qwen_v1:  32%|###2      | 966/3000 [1:05:01<1:47:58,  3.18s/it, lr: 1.0e-04 loss: 6.827e-02]mindexpander_qwen_v1:  32%|###2      | 966/3000 [1:05:01<1:47:58,  3.18s/it, lr: 1.0e-04 loss: 6.827e-02]mindexpander_qwen_v1:  32%|###2      | 966/3000 [1:05:03<1:47:58,  3.18s/it, lr: 1.0e-04 loss: 1.676e-01]mindexpander_qwen_v1:  32%|###2      | 966/3000 [1:05:03<1:47:58,  3.18s/it, lr: 1.0e-04 loss: 1.676e-01]mindexpander_qwen_v1:  32%|###2      | 967/3000 [1:05:03<1:40:40,  2.97s/it, lr: 1.0e-04 loss: 1.676e-01]mindexpander_qwen_v1:  32%|###2      | 967/3000 [1:05:03<1:40:40,  2.97s/it, lr: 1.0e-04 loss: 1.676e-01]mindexpander_qwen_v1:  32%|###2      | 967/3000 [1:05:09<1:40:40,  2.97s/it, lr: 1.0e-04 loss: 2.835e-02]mindexpander_qwen_v1:  32%|###2      | 967/3000 [1:05:09<1:40:40,  2.97s/it, lr: 1.0e-04 loss: 2.835e-02]mindexpander_qwen_v1:  32%|###2      | 968/3000 [1:05:09<2:08:12,  3.79s/it, lr: 1.0e-04 loss: 2.835e-02]mindexpander_qwen_v1:  32%|###2      | 968/3000 [1:05:09<2:08:12,  3.79s/it, lr: 1.0e-04 loss: 2.835e-02]mindexpander_qwen_v1:  32%|###2      | 968/3000 [1:05:13<2:08:12,  3.79s/it, lr: 1.0e-04 loss: 9.336e-02]mindexpander_qwen_v1:  32%|###2      | 968/3000 [1:05:13<2:08:12,  3.79s/it, lr: 1.0e-04 loss: 9.336e-02]mindexpander_qwen_v1:  32%|###2      | 969/3000 [1:05:13<2:07:44,  3.77s/it, lr: 1.0e-04 loss: 9.336e-02]mindexpander_qwen_v1:  32%|###2      | 969/3000 [1:05:13<2:07:44,  3.77s/it, lr: 1.0e-04 loss: 9.336e-02]mindexpander_qwen_v1:  32%|###2      | 969/3000 [1:05:15<2:07:44,  3.77s/it, lr: 1.0e-04 loss: 7.881e-02]mindexpander_qwen_v1:  32%|###2      | 969/3000 [1:05:15<2:07:44,  3.77s/it, lr: 1.0e-04 loss: 7.881e-02]mindexpander_qwen_v1:  32%|###2      | 970/3000 [1:05:19<2:07:40,  3.77s/it, lr: 1.0e-04 loss: 8.278e-02]mindexpander_qwen_v1:  32%|###2      | 970/3000 [1:05:19<2:07:40,  3.77s/it, lr: 1.0e-04 loss: 8.278e-02]mindexpander_qwen_v1:  32%|###2      | 971/3000 [1:05:19<1:38:15,  2.91s/it, lr: 1.0e-04 loss: 8.278e-02]mindexpander_qwen_v1:  32%|###2      | 971/3000 [1:05:19<1:38:15,  2.91s/it, lr: 1.0e-04 loss: 8.278e-02]mindexpander_qwen_v1:  32%|###2      | 971/3000 [1:05:25<1:38:15,  2.91s/it, lr: 1.0e-04 loss: 1.375e-02]mindexpander_qwen_v1:  32%|###2      | 971/3000 [1:05:25<1:38:15,  2.91s/it, lr: 1.0e-04 loss: 1.375e-02]mindexpander_qwen_v1:  32%|###2      | 972/3000 [1:05:25<2:01:55,  3.61s/it, lr: 1.0e-04 loss: 1.375e-02]mindexpander_qwen_v1:  32%|###2      | 972/3000 [1:05:25<2:01:55,  3.61s/it, lr: 1.0e-04 loss: 1.375e-02]mindexpander_qwen_v1:  32%|###2      | 972/3000 [1:05:27<2:01:55,  3.61s/it, lr: 1.0e-04 loss: 5.766e-02]mindexpander_qwen_v1:  32%|###2      | 972/3000 [1:05:27<2:01:55,  3.61s/it, lr: 1.0e-04 loss: 5.766e-02]mindexpander_qwen_v1:  32%|###2      | 973/3000 [1:05:27<1:51:43,  3.31s/it, lr: 1.0e-04 loss: 5.766e-02]mindexpander_qwen_v1:  32%|###2      | 973/3000 [1:05:27<1:51:43,  3.31s/it, lr: 1.0e-04 loss: 5.766e-02]mindexpander_qwen_v1:  32%|###2      | 973/3000 [1:05:30<1:51:43,  3.31s/it, lr: 1.0e-04 loss: 1.394e-01]mindexpander_qwen_v1:  32%|###2      | 973/3000 [1:05:30<1:51:43,  3.31s/it, lr: 1.0e-04 loss: 1.394e-01]mindexpander_qwen_v1:  32%|###2      | 974/3000 [1:05:30<1:45:30,  3.12s/it, lr: 1.0e-04 loss: 1.394e-01]mindexpander_qwen_v1:  32%|###2      | 974/3000 [1:05:30<1:45:30,  3.12s/it, lr: 1.0e-04 loss: 1.394e-01]mindexpander_qwen_v1:  32%|###2      | 974/3000 [1:05:36<1:45:30,  3.12s/it, lr: 1.0e-04 loss: 2.875e-02]mindexpander_qwen_v1:  32%|###2      | 974/3000 [1:05:36<1:45:30,  3.12s/it, lr: 1.0e-04 loss: 2.875e-02]mindexpander_qwen_v1:  32%|###2      | 975/3000 [1:05:36<2:10:16,  3.86s/it, lr: 1.0e-04 loss: 2.875e-02]mindexpander_qwen_v1:  32%|###2      | 975/3000 [1:05:36<2:10:16,  3.86s/it, lr: 1.0e-04 loss: 2.875e-02]mindexpander_qwen_v1:  32%|###2      | 975/3000 [1:05:41<2:10:16,  3.86s/it, lr: 1.0e-04 loss: 1.399e-02]mindexpander_qwen_v1:  32%|###2      | 975/3000 [1:05:41<2:10:16,  3.86s/it, lr: 1.0e-04 loss: 1.399e-02]mindexpander_qwen_v1:  33%|###2      | 976/3000 [1:05:41<2:28:26,  4.40s/it, lr: 1.0e-04 loss: 1.399e-02]mindexpander_qwen_v1:  33%|###2      | 976/3000 [1:05:41<2:28:26,  4.40s/it, lr: 1.0e-04 loss: 1.399e-02]mindexpander_qwen_v1:  33%|###2      | 976/3000 [1:05:44<2:28:26,  4.40s/it, lr: 1.0e-04 loss: 1.584e-01]mindexpander_qwen_v1:  33%|###2      | 976/3000 [1:05:44<2:28:26,  4.40s/it, lr: 1.0e-04 loss: 1.584e-01]mindexpander_qwen_v1:  33%|###2      | 977/3000 [1:05:44<2:09:20,  3.84s/it, lr: 1.0e-04 loss: 1.584e-01]mindexpander_qwen_v1:  33%|###2      | 977/3000 [1:05:44<2:09:20,  3.84s/it, lr: 1.0e-04 loss: 1.584e-01]mindexpander_qwen_v1:  33%|###2      | 977/3000 [1:05:48<2:09:20,  3.84s/it, lr: 1.0e-04 loss: 9.520e-02]mindexpander_qwen_v1:  33%|###2      | 977/3000 [1:05:48<2:09:20,  3.84s/it, lr: 1.0e-04 loss: 9.520e-02]mindexpander_qwen_v1:  33%|###2      | 978/3000 [1:05:48<2:10:01,  3.86s/it, lr: 1.0e-04 loss: 9.520e-02]mindexpander_qwen_v1:  33%|###2      | 978/3000 [1:05:48<2:10:01,  3.86s/it, lr: 1.0e-04 loss: 9.520e-02]mindexpander_qwen_v1:  33%|###2      | 978/3000 [1:05:51<2:10:01,  3.86s/it, lr: 1.0e-04 loss: 2.785e-02]mindexpander_qwen_v1:  33%|###2      | 978/3000 [1:05:51<2:10:01,  3.86s/it, lr: 1.0e-04 loss: 2.785e-02]mindexpander_qwen_v1:  33%|###2      | 979/3000 [1:05:51<2:08:47,  3.82s/it, lr: 1.0e-04 loss: 2.785e-02]mindexpander_qwen_v1:  33%|###2      | 979/3000 [1:05:51<2:08:47,  3.82s/it, lr: 1.0e-04 loss: 2.785e-02]mindexpander_qwen_v1:  33%|###2      | 979/3000 [1:05:57<2:08:47,  3.82s/it, lr: 1.0e-04 loss: 1.577e-01]mindexpander_qwen_v1:  33%|###2      | 979/3000 [1:05:57<2:08:47,  3.82s/it, lr: 1.0e-04 loss: 1.577e-01]mindexpander_qwen_v1:  33%|###2      | 980/3000 [1:06:01<2:08:43,  3.82s/it, lr: 1.0e-04 loss: 6.172e-02]mindexpander_qwen_v1:  33%|###2      | 980/3000 [1:06:01<2:08:43,  3.82s/it, lr: 1.0e-04 loss: 6.172e-02]mindexpander_qwen_v1:  33%|###2      | 981/3000 [1:06:01<1:38:38,  2.93s/it, lr: 1.0e-04 loss: 6.172e-02]mindexpander_qwen_v1:  33%|###2      | 981/3000 [1:06:01<1:38:38,  2.93s/it, lr: 1.0e-04 loss: 6.172e-02]mindexpander_qwen_v1:  33%|###2      | 981/3000 [1:06:07<1:38:38,  2.93s/it, lr: 1.0e-04 loss: 4.068e-03]mindexpander_qwen_v1:  33%|###2      | 981/3000 [1:06:07<1:38:38,  2.93s/it, lr: 1.0e-04 loss: 4.068e-03]mindexpander_qwen_v1:  33%|###2      | 982/3000 [1:06:07<2:03:02,  3.66s/it, lr: 1.0e-04 loss: 4.068e-03]mindexpander_qwen_v1:  33%|###2      | 982/3000 [1:06:07<2:03:02,  3.66s/it, lr: 1.0e-04 loss: 4.068e-03]mindexpander_qwen_v1:  33%|###2      | 982/3000 [1:06:10<2:03:02,  3.66s/it, lr: 1.0e-04 loss: 1.337e-01]mindexpander_qwen_v1:  33%|###2      | 982/3000 [1:06:10<2:03:02,  3.66s/it, lr: 1.0e-04 loss: 1.337e-01]mindexpander_qwen_v1:  33%|###2      | 983/3000 [1:06:11<2:03:39,  3.68s/it, lr: 1.0e-04 loss: 1.337e-01]mindexpander_qwen_v1:  33%|###2      | 983/3000 [1:06:11<2:03:39,  3.68s/it, lr: 1.0e-04 loss: 1.337e-01]mindexpander_qwen_v1:  33%|###2      | 983/3000 [1:06:16<2:03:39,  3.68s/it, lr: 1.0e-04 loss: 1.523e-01]mindexpander_qwen_v1:  33%|###2      | 983/3000 [1:06:16<2:03:39,  3.68s/it, lr: 1.0e-04 loss: 1.523e-01]mindexpander_qwen_v1:  33%|###2      | 984/3000 [1:06:16<2:22:30,  4.24s/it, lr: 1.0e-04 loss: 1.523e-01]mindexpander_qwen_v1:  33%|###2      | 984/3000 [1:06:16<2:22:30,  4.24s/it, lr: 1.0e-04 loss: 1.523e-01]mindexpander_qwen_v1:  33%|###2      | 984/3000 [1:06:19<2:22:30,  4.24s/it, lr: 1.0e-04 loss: 5.809e-02]mindexpander_qwen_v1:  33%|###2      | 984/3000 [1:06:19<2:22:30,  4.24s/it, lr: 1.0e-04 loss: 5.809e-02]mindexpander_qwen_v1:  33%|###2      | 985/3000 [1:06:19<2:05:40,  3.74s/it, lr: 1.0e-04 loss: 5.809e-02]mindexpander_qwen_v1:  33%|###2      | 985/3000 [1:06:19<2:05:40,  3.74s/it, lr: 1.0e-04 loss: 5.809e-02]mindexpander_qwen_v1:  33%|###2      | 985/3000 [1:06:25<2:05:40,  3.74s/it, lr: 1.0e-04 loss: 1.688e-02]mindexpander_qwen_v1:  33%|###2      | 985/3000 [1:06:25<2:05:40,  3.74s/it, lr: 1.0e-04 loss: 1.688e-02]mindexpander_qwen_v1:  33%|###2      | 986/3000 [1:06:25<2:26:03,  4.35s/it, lr: 1.0e-04 loss: 1.688e-02]mindexpander_qwen_v1:  33%|###2      | 986/3000 [1:06:25<2:26:03,  4.35s/it, lr: 1.0e-04 loss: 1.688e-02]mindexpander_qwen_v1:  33%|###2      | 986/3000 [1:06:27<2:26:03,  4.35s/it, lr: 1.0e-04 loss: 3.270e-02]mindexpander_qwen_v1:  33%|###2      | 986/3000 [1:06:27<2:26:03,  4.35s/it, lr: 1.0e-04 loss: 3.270e-02]mindexpander_qwen_v1:  33%|###2      | 987/3000 [1:06:27<2:07:33,  3.80s/it, lr: 1.0e-04 loss: 3.270e-02]mindexpander_qwen_v1:  33%|###2      | 987/3000 [1:06:27<2:07:33,  3.80s/it, lr: 1.0e-04 loss: 3.270e-02]mindexpander_qwen_v1:  33%|###2      | 987/3000 [1:06:31<2:07:33,  3.80s/it, lr: 1.0e-04 loss: 5.448e-02]mindexpander_qwen_v1:  33%|###2      | 987/3000 [1:06:31<2:07:33,  3.80s/it, lr: 1.0e-04 loss: 5.448e-02]mindexpander_qwen_v1:  33%|###2      | 988/3000 [1:06:31<2:06:53,  3.78s/it, lr: 1.0e-04 loss: 5.448e-02]mindexpander_qwen_v1:  33%|###2      | 988/3000 [1:06:31<2:06:53,  3.78s/it, lr: 1.0e-04 loss: 5.448e-02]mindexpander_qwen_v1:  33%|###2      | 988/3000 [1:06:37<2:06:53,  3.78s/it, lr: 1.0e-04 loss: 1.616e-01]mindexpander_qwen_v1:  33%|###2      | 988/3000 [1:06:37<2:06:53,  3.78s/it, lr: 1.0e-04 loss: 1.616e-01]mindexpander_qwen_v1:  33%|###2      | 989/3000 [1:06:37<2:26:23,  4.37s/it, lr: 1.0e-04 loss: 1.616e-01]mindexpander_qwen_v1:  33%|###2      | 989/3000 [1:06:37<2:26:23,  4.37s/it, lr: 1.0e-04 loss: 1.616e-01]mindexpander_qwen_v1:  33%|###2      | 989/3000 [1:06:41<2:26:23,  4.37s/it, lr: 1.0e-04 loss: 1.404e-01]mindexpander_qwen_v1:  33%|###2      | 989/3000 [1:06:41<2:26:23,  4.37s/it, lr: 1.0e-04 loss: 1.404e-01]mindexpander_qwen_v1:  33%|###3      | 990/3000 [1:06:43<2:26:18,  4.37s/it, lr: 1.0e-04 loss: 1.196e-01]mindexpander_qwen_v1:  33%|###3      | 990/3000 [1:06:43<2:26:18,  4.37s/it, lr: 1.0e-04 loss: 1.196e-01]mindexpander_qwen_v1:  33%|###3      | 991/3000 [1:06:43<1:38:23,  2.94s/it, lr: 1.0e-04 loss: 1.196e-01]mindexpander_qwen_v1:  33%|###3      | 991/3000 [1:06:43<1:38:23,  2.94s/it, lr: 1.0e-04 loss: 1.196e-01]mindexpander_qwen_v1:  33%|###3      | 991/3000 [1:06:46<1:38:23,  2.94s/it, lr: 1.0e-04 loss: 7.512e-02]mindexpander_qwen_v1:  33%|###3      | 991/3000 [1:06:46<1:38:23,  2.94s/it, lr: 1.0e-04 loss: 7.512e-02]mindexpander_qwen_v1:  33%|###3      | 992/3000 [1:06:46<1:34:18,  2.82s/it, lr: 1.0e-04 loss: 7.512e-02]mindexpander_qwen_v1:  33%|###3      | 992/3000 [1:06:46<1:34:18,  2.82s/it, lr: 1.0e-04 loss: 7.512e-02]mindexpander_qwen_v1:  33%|###3      | 992/3000 [1:06:52<1:34:18,  2.82s/it, lr: 1.0e-04 loss: 2.847e-02]mindexpander_qwen_v1:  33%|###3      | 992/3000 [1:06:52<1:34:18,  2.82s/it, lr: 1.0e-04 loss: 2.847e-02]mindexpander_qwen_v1:  33%|###3      | 993/3000 [1:06:52<1:59:52,  3.58s/it, lr: 1.0e-04 loss: 2.847e-02]mindexpander_qwen_v1:  33%|###3      | 993/3000 [1:06:52<1:59:52,  3.58s/it, lr: 1.0e-04 loss: 2.847e-02]mindexpander_qwen_v1:  33%|###3      | 993/3000 [1:06:58<1:59:52,  3.58s/it, lr: 1.0e-04 loss: 1.731e-01]mindexpander_qwen_v1:  33%|###3      | 993/3000 [1:06:58<1:59:52,  3.58s/it, lr: 1.0e-04 loss: 1.731e-01]mindexpander_qwen_v1:  33%|###3      | 994/3000 [1:06:58<2:20:54,  4.21s/it, lr: 1.0e-04 loss: 1.731e-01]mindexpander_qwen_v1:  33%|###3      | 994/3000 [1:06:58<2:20:54,  4.21s/it, lr: 1.0e-04 loss: 1.731e-01]mindexpander_qwen_v1:  33%|###3      | 994/3000 [1:07:01<2:20:54,  4.21s/it, lr: 1.0e-04 loss: 1.185e-01]mindexpander_qwen_v1:  33%|###3      | 994/3000 [1:07:01<2:20:54,  4.21s/it, lr: 1.0e-04 loss: 1.185e-01]mindexpander_qwen_v1:  33%|###3      | 995/3000 [1:07:01<2:16:22,  4.08s/it, lr: 1.0e-04 loss: 1.185e-01]mindexpander_qwen_v1:  33%|###3      | 995/3000 [1:07:01<2:16:22,  4.08s/it, lr: 1.0e-04 loss: 1.185e-01]mindexpander_qwen_v1:  33%|###3      | 995/3000 [1:07:05<2:16:22,  4.08s/it, lr: 1.0e-04 loss: 9.895e-02]mindexpander_qwen_v1:  33%|###3      | 995/3000 [1:07:05<2:16:22,  4.08s/it, lr: 1.0e-04 loss: 9.895e-02]mindexpander_qwen_v1:  33%|###3      | 996/3000 [1:07:05<2:13:04,  3.98s/it, lr: 1.0e-04 loss: 9.895e-02]mindexpander_qwen_v1:  33%|###3      | 996/3000 [1:07:05<2:13:04,  3.98s/it, lr: 1.0e-04 loss: 9.895e-02]mindexpander_qwen_v1:  33%|###3      | 996/3000 [1:07:09<2:13:04,  3.98s/it, lr: 1.0e-04 loss: 8.096e-02]mindexpander_qwen_v1:  33%|###3      | 996/3000 [1:07:09<2:13:04,  3.98s/it, lr: 1.0e-04 loss: 8.096e-02]mindexpander_qwen_v1:  33%|###3      | 997/3000 [1:07:09<2:10:39,  3.91s/it, lr: 1.0e-04 loss: 8.096e-02]mindexpander_qwen_v1:  33%|###3      | 997/3000 [1:07:09<2:10:39,  3.91s/it, lr: 1.0e-04 loss: 8.096e-02]mindexpander_qwen_v1:  33%|###3      | 997/3000 [1:07:13<2:10:39,  3.91s/it, lr: 1.0e-04 loss: 1.967e-02]mindexpander_qwen_v1:  33%|###3      | 997/3000 [1:07:13<2:10:39,  3.91s/it, lr: 1.0e-04 loss: 1.967e-02]mindexpander_qwen_v1:  33%|###3      | 998/3000 [1:07:13<2:10:33,  3.91s/it, lr: 1.0e-04 loss: 1.967e-02]mindexpander_qwen_v1:  33%|###3      | 998/3000 [1:07:13<2:10:33,  3.91s/it, lr: 1.0e-04 loss: 1.967e-02]mindexpander_qwen_v1:  33%|###3      | 998/3000 [1:07:16<2:10:33,  3.91s/it, lr: 1.0e-04 loss: 1.580e-02]mindexpander_qwen_v1:  33%|###3      | 998/3000 [1:07:16<2:10:33,  3.91s/it, lr: 1.0e-04 loss: 1.580e-02]mindexpander_qwen_v1:  33%|###3      | 999/3000 [1:07:16<2:08:48,  3.86s/it, lr: 1.0e-04 loss: 1.580e-02]mindexpander_qwen_v1:  33%|###3      | 999/3000 [1:07:16<2:08:48,  3.86s/it, lr: 1.0e-04 loss: 1.580e-02]mindexpander_qwen_v1:  33%|###3      | 999/3000 [1:07:19<2:08:48,  3.86s/it, lr: 1.0e-04 loss: 5.590e-02]mindexpander_qwen_v1:  33%|###3      | 999/3000 [1:07:19<2:08:48,  3.86s/it, lr: 1.0e-04 loss: 5.590e-02]
+Saving at step 1000
+Saved checkpoint to /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000001000.safetensors
+Saved optimizer to /app/ai-toolkit/output/mindexpander_qwen_v1/optimizer.pt
+
+
+Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:   0%|          | 0/2 [00:00<?, ?it/s][A[A
+
+Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.97s/it]Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.97s/it][A[A
+
+Generating Images: 100%|##########| 2/2 [02:56<00:00, 88.09s/it]Generating Images: 100%|##########| 2/2 [02:56<00:00, 88.09s/it][A[A
+
+                                                                                                                                [A[Amindexpander_qwen_v1:  33%|###3      | 1000/3000 [1:07:22<2:08:44,  3.86s/it, lr: 1.0e-04 loss: 1.030e-01]mindexpander_qwen_v1:  33%|###3      | 1000/3000 [1:07:22<2:08:44,  3.86s/it, lr: 1.0e-04 loss: 1.030e-01]mindexpander_qwen_v1:  33%|###3      | 1001/3000 [1:07:22<1:30:08,  2.71s/it, lr: 1.0e-04 loss: 1.030e-01]mindexpander_qwen_v1:  33%|###3      | 1001/3000 [1:07:22<1:30:08,  2.71s/it, lr: 1.0e-04 loss: 1.030e-01]mindexpander_qwen_v1:  33%|###3      | 1001/3000 [1:07:25<1:30:08,  2.71s/it, lr: 1.0e-04 loss: 9.358e-02]mindexpander_qwen_v1:  33%|###3      | 1001/3000 [1:07:25<1:30:08,  2.71s/it, lr: 1.0e-04 loss: 9.358e-02]mindexpander_qwen_v1:  33%|###3      | 1002/3000 [1:07:25<1:38:31,  2.96s/it, lr: 1.0e-04 loss: 9.358e-02]mindexpander_qwen_v1:  33%|###3      | 1002/3000 [1:07:25<1:38:31,  2.96s/it, lr: 1.0e-04 loss: 9.358e-02]mindexpander_qwen_v1:  33%|###3      | 1002/3000 [1:07:31<1:38:31,  2.96s/it, lr: 1.0e-04 loss: 3.201e-02]mindexpander_qwen_v1:  33%|###3      | 1002/3000 [1:07:31<1:38:31,  2.96s/it, lr: 1.0e-04 loss: 3.201e-02]mindexpander_qwen_v1:  33%|###3      | 1003/3000 [1:07:31<2:02:37,  3.68s/it, lr: 1.0e-04 loss: 3.201e-02]mindexpander_qwen_v1:  33%|###3      | 1003/3000 [1:07:31<2:02:37,  3.68s/it, lr: 1.0e-04 loss: 3.201e-02]mindexpander_qwen_v1:  33%|###3      | 1003/3000 [1:07:37<2:02:37,  3.68s/it, lr: 1.0e-04 loss: 5.353e-02]mindexpander_qwen_v1:  33%|###3      | 1003/3000 [1:07:37<2:02:37,  3.68s/it, lr: 1.0e-04 loss: 5.353e-02]mindexpander_qwen_v1:  33%|###3      | 1004/3000 [1:07:37<2:22:26,  4.28s/it, lr: 1.0e-04 loss: 5.353e-02]mindexpander_qwen_v1:  33%|###3      | 1004/3000 [1:07:37<2:22:26,  4.28s/it, lr: 1.0e-04 loss: 5.353e-02]mindexpander_qwen_v1:  33%|###3      | 1004/3000 [1:07:43<2:22:26,  4.28s/it, lr: 1.0e-04 loss: 2.311e-02]mindexpander_qwen_v1:  33%|###3      | 1004/3000 [1:07:43<2:22:26,  4.28s/it, lr: 1.0e-04 loss: 2.311e-02]mindexpander_qwen_v1:  34%|###3      | 1005/3000 [1:07:43<2:36:02,  4.69s/it, lr: 1.0e-04 loss: 2.311e-02]mindexpander_qwen_v1:  34%|###3      | 1005/3000 [1:07:43<2:36:02,  4.69s/it, lr: 1.0e-04 loss: 2.311e-02]mindexpander_qwen_v1:  34%|###3      | 1005/3000 [1:07:48<2:36:02,  4.69s/it, lr: 1.0e-04 loss: 3.369e-02]mindexpander_qwen_v1:  34%|###3      | 1005/3000 [1:07:48<2:36:02,  4.69s/it, lr: 1.0e-04 loss: 3.369e-02]mindexpander_qwen_v1:  34%|###3      | 1006/3000 [1:07:48<2:46:02,  5.00s/it, lr: 1.0e-04 loss: 3.369e-02]mindexpander_qwen_v1:  34%|###3      | 1006/3000 [1:07:48<2:46:02,  5.00s/it, lr: 1.0e-04 loss: 3.369e-02]mindexpander_qwen_v1:  34%|###3      | 1006/3000 [1:07:51<2:46:02,  5.00s/it, lr: 1.0e-04 loss: 1.827e-01]mindexpander_qwen_v1:  34%|###3      | 1006/3000 [1:07:51<2:46:02,  5.00s/it, lr: 1.0e-04 loss: 1.827e-01]mindexpander_qwen_v1:  34%|###3      | 1007/3000 [1:07:51<2:21:26,  4.26s/it, lr: 1.0e-04 loss: 1.827e-01]mindexpander_qwen_v1:  34%|###3      | 1007/3000 [1:07:51<2:21:26,  4.26s/it, lr: 1.0e-04 loss: 1.827e-01]mindexpander_qwen_v1:  34%|###3      | 1007/3000 [1:07:55<2:21:26,  4.26s/it, lr: 1.0e-04 loss: 1.156e-01]mindexpander_qwen_v1:  34%|###3      | 1007/3000 [1:07:55<2:21:26,  4.26s/it, lr: 1.0e-04 loss: 1.156e-01]mindexpander_qwen_v1:  34%|###3      | 1008/3000 [1:07:55<2:18:04,  4.16s/it, lr: 1.0e-04 loss: 1.156e-01]mindexpander_qwen_v1:  34%|###3      | 1008/3000 [1:07:55<2:18:04,  4.16s/it, lr: 1.0e-04 loss: 1.156e-01]mindexpander_qwen_v1:  34%|###3      | 1008/3000 [1:07:57<2:18:04,  4.16s/it, lr: 1.0e-04 loss: 1.217e-01]mindexpander_qwen_v1:  34%|###3      | 1008/3000 [1:07:57<2:18:04,  4.16s/it, lr: 1.0e-04 loss: 1.217e-01]mindexpander_qwen_v1:  34%|###3      | 1009/3000 [1:07:57<2:01:14,  3.65s/it, lr: 1.0e-04 loss: 1.217e-01]mindexpander_qwen_v1:  34%|###3      | 1009/3000 [1:07:57<2:01:14,  3.65s/it, lr: 1.0e-04 loss: 1.217e-01]mindexpander_qwen_v1:  34%|###3      | 1009/3000 [1:08:03<2:01:14,  3.65s/it, lr: 1.0e-04 loss: 2.257e-02]mindexpander_qwen_v1:  34%|###3      | 1009/3000 [1:08:03<2:01:14,  3.65s/it, lr: 1.0e-04 loss: 2.257e-02]mindexpander_qwen_v1:  34%|###3      | 1010/3000 [1:08:05<2:01:11,  3.65s/it, lr: 1.0e-04 loss: 1.273e-01]mindexpander_qwen_v1:  34%|###3      | 1010/3000 [1:08:05<2:01:11,  3.65s/it, lr: 1.0e-04 loss: 1.273e-01]mindexpander_qwen_v1:  34%|###3      | 1011/3000 [1:08:05<1:24:16,  2.54s/it, lr: 1.0e-04 loss: 1.273e-01]mindexpander_qwen_v1:  34%|###3      | 1011/3000 [1:08:05<1:24:16,  2.54s/it, lr: 1.0e-04 loss: 1.273e-01]mindexpander_qwen_v1:  34%|###3      | 1011/3000 [1:08:11<1:24:16,  2.54s/it, lr: 1.0e-04 loss: 1.226e-01]mindexpander_qwen_v1:  34%|###3      | 1011/3000 [1:08:11<1:24:16,  2.54s/it, lr: 1.0e-04 loss: 1.226e-01]mindexpander_qwen_v1:  34%|###3      | 1012/3000 [1:08:11<1:51:37,  3.37s/it, lr: 1.0e-04 loss: 1.226e-01]mindexpander_qwen_v1:  34%|###3      | 1012/3000 [1:08:11<1:51:37,  3.37s/it, lr: 1.0e-04 loss: 1.226e-01]mindexpander_qwen_v1:  34%|###3      | 1012/3000 [1:08:15<1:51:37,  3.37s/it, lr: 1.0e-04 loss: 5.482e-02]mindexpander_qwen_v1:  34%|###3      | 1012/3000 [1:08:15<1:51:37,  3.37s/it, lr: 1.0e-04 loss: 5.482e-02]mindexpander_qwen_v1:  34%|###3      | 1013/3000 [1:08:15<1:54:42,  3.46s/it, lr: 1.0e-04 loss: 5.482e-02]mindexpander_qwen_v1:  34%|###3      | 1013/3000 [1:08:15<1:54:42,  3.46s/it, lr: 1.0e-04 loss: 5.482e-02]mindexpander_qwen_v1:  34%|###3      | 1013/3000 [1:08:21<1:54:42,  3.46s/it, lr: 1.0e-04 loss: 4.804e-02]mindexpander_qwen_v1:  34%|###3      | 1013/3000 [1:08:21<1:54:42,  3.46s/it, lr: 1.0e-04 loss: 4.804e-02]mindexpander_qwen_v1:  34%|###3      | 1014/3000 [1:08:21<2:15:07,  4.08s/it, lr: 1.0e-04 loss: 4.804e-02]mindexpander_qwen_v1:  34%|###3      | 1014/3000 [1:08:21<2:15:07,  4.08s/it, lr: 1.0e-04 loss: 4.804e-02]mindexpander_qwen_v1:  34%|###3      | 1014/3000 [1:08:25<2:15:07,  4.08s/it, lr: 1.0e-04 loss: 1.063e-01]mindexpander_qwen_v1:  34%|###3      | 1014/3000 [1:08:25<2:15:07,  4.08s/it, lr: 1.0e-04 loss: 1.063e-01]mindexpander_qwen_v1:  34%|###3      | 1015/3000 [1:08:25<2:11:52,  3.99s/it, lr: 1.0e-04 loss: 1.063e-01]mindexpander_qwen_v1:  34%|###3      | 1015/3000 [1:08:25<2:11:52,  3.99s/it, lr: 1.0e-04 loss: 1.063e-01]mindexpander_qwen_v1:  34%|###3      | 1015/3000 [1:08:27<2:11:52,  3.99s/it, lr: 1.0e-04 loss: 5.731e-02]mindexpander_qwen_v1:  34%|###3      | 1015/3000 [1:08:27<2:11:52,  3.99s/it, lr: 1.0e-04 loss: 5.731e-02]mindexpander_qwen_v1:  34%|###3      | 1016/3000 [1:08:27<1:59:09,  3.60s/it, lr: 1.0e-04 loss: 5.731e-02]mindexpander_qwen_v1:  34%|###3      | 1016/3000 [1:08:27<1:59:09,  3.60s/it, lr: 1.0e-04 loss: 5.731e-02]mindexpander_qwen_v1:  34%|###3      | 1016/3000 [1:08:33<1:59:09,  3.60s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:  34%|###3      | 1016/3000 [1:08:33<1:59:09,  3.60s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:  34%|###3      | 1017/3000 [1:08:33<2:19:35,  4.22s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:  34%|###3      | 1017/3000 [1:08:33<2:19:35,  4.22s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:  34%|###3      | 1017/3000 [1:08:35<2:19:35,  4.22s/it, lr: 1.0e-04 loss: 6.430e-02]mindexpander_qwen_v1:  34%|###3      | 1017/3000 [1:08:35<2:19:35,  4.22s/it, lr: 1.0e-04 loss: 6.430e-02]mindexpander_qwen_v1:  34%|###3      | 1018/3000 [1:08:35<2:02:21,  3.70s/it, lr: 1.0e-04 loss: 6.430e-02]mindexpander_qwen_v1:  34%|###3      | 1018/3000 [1:08:35<2:02:21,  3.70s/it, lr: 1.0e-04 loss: 6.430e-02]mindexpander_qwen_v1:  34%|###3      | 1018/3000 [1:08:38<2:02:21,  3.70s/it, lr: 1.0e-04 loss: 8.484e-02]mindexpander_qwen_v1:  34%|###3      | 1018/3000 [1:08:38<2:02:21,  3.70s/it, lr: 1.0e-04 loss: 8.484e-02]mindexpander_qwen_v1:  34%|###3      | 1019/3000 [1:08:38<1:50:02,  3.33s/it, lr: 1.0e-04 loss: 8.484e-02]mindexpander_qwen_v1:  34%|###3      | 1019/3000 [1:08:38<1:50:02,  3.33s/it, lr: 1.0e-04 loss: 8.484e-02]mindexpander_qwen_v1:  34%|###3      | 1019/3000 [1:08:42<1:50:02,  3.33s/it, lr: 1.0e-04 loss: 8.309e-02]mindexpander_qwen_v1:  34%|###3      | 1019/3000 [1:08:42<1:50:02,  3.33s/it, lr: 1.0e-04 loss: 8.309e-02]mindexpander_qwen_v1:  34%|###4      | 1020/3000 [1:08:48<1:49:59,  3.33s/it, lr: 1.0e-04 loss: 3.188e-02]mindexpander_qwen_v1:  34%|###4      | 1020/3000 [1:08:48<1:49:59,  3.33s/it, lr: 1.0e-04 loss: 3.188e-02]mindexpander_qwen_v1:  34%|###4      | 1021/3000 [1:08:48<1:43:25,  3.14s/it, lr: 1.0e-04 loss: 3.188e-02]mindexpander_qwen_v1:  34%|###4      | 1021/3000 [1:08:48<1:43:25,  3.14s/it, lr: 1.0e-04 loss: 3.188e-02]mindexpander_qwen_v1:  34%|###4      | 1021/3000 [1:08:52<1:43:25,  3.14s/it, lr: 1.0e-04 loss: 1.404e-02]mindexpander_qwen_v1:  34%|###4      | 1021/3000 [1:08:52<1:43:25,  3.14s/it, lr: 1.0e-04 loss: 1.404e-02]mindexpander_qwen_v1:  34%|###4      | 1022/3000 [1:08:52<1:48:16,  3.28s/it, lr: 1.0e-04 loss: 1.404e-02]mindexpander_qwen_v1:  34%|###4      | 1022/3000 [1:08:52<1:48:16,  3.28s/it, lr: 1.0e-04 loss: 1.404e-02]mindexpander_qwen_v1:  34%|###4      | 1022/3000 [1:08:55<1:48:16,  3.28s/it, lr: 1.0e-04 loss: 1.355e-02]mindexpander_qwen_v1:  34%|###4      | 1022/3000 [1:08:55<1:48:16,  3.28s/it, lr: 1.0e-04 loss: 1.355e-02]mindexpander_qwen_v1:  34%|###4      | 1023/3000 [1:08:55<1:52:09,  3.40s/it, lr: 1.0e-04 loss: 1.355e-02]mindexpander_qwen_v1:  34%|###4      | 1023/3000 [1:08:55<1:52:09,  3.40s/it, lr: 1.0e-04 loss: 1.355e-02]mindexpander_qwen_v1:  34%|###4      | 1023/3000 [1:09:01<1:52:09,  3.40s/it, lr: 1.0e-04 loss: 1.854e-01]mindexpander_qwen_v1:  34%|###4      | 1023/3000 [1:09:01<1:52:09,  3.40s/it, lr: 1.0e-04 loss: 1.854e-01]mindexpander_qwen_v1:  34%|###4      | 1024/3000 [1:09:01<2:14:16,  4.08s/it, lr: 1.0e-04 loss: 1.854e-01]mindexpander_qwen_v1:  34%|###4      | 1024/3000 [1:09:01<2:14:16,  4.08s/it, lr: 1.0e-04 loss: 1.854e-01]mindexpander_qwen_v1:  34%|###4      | 1024/3000 [1:09:05<2:14:16,  4.08s/it, lr: 1.0e-04 loss: 2.851e-02]mindexpander_qwen_v1:  34%|###4      | 1024/3000 [1:09:05<2:14:16,  4.08s/it, lr: 1.0e-04 loss: 2.851e-02]mindexpander_qwen_v1:  34%|###4      | 1025/3000 [1:09:05<2:11:08,  3.98s/it, lr: 1.0e-04 loss: 2.851e-02]mindexpander_qwen_v1:  34%|###4      | 1025/3000 [1:09:05<2:11:08,  3.98s/it, lr: 1.0e-04 loss: 2.851e-02]mindexpander_qwen_v1:  34%|###4      | 1025/3000 [1:09:08<2:11:08,  3.98s/it, lr: 1.0e-04 loss: 4.666e-02]mindexpander_qwen_v1:  34%|###4      | 1025/3000 [1:09:08<2:11:08,  3.98s/it, lr: 1.0e-04 loss: 4.666e-02]mindexpander_qwen_v1:  34%|###4      | 1026/3000 [1:09:08<1:56:49,  3.55s/it, lr: 1.0e-04 loss: 4.666e-02]mindexpander_qwen_v1:  34%|###4      | 1026/3000 [1:09:08<1:56:49,  3.55s/it, lr: 1.0e-04 loss: 4.666e-02]mindexpander_qwen_v1:  34%|###4      | 1026/3000 [1:09:13<1:56:49,  3.55s/it, lr: 1.0e-04 loss: 1.195e-02]mindexpander_qwen_v1:  34%|###4      | 1026/3000 [1:09:13<1:56:49,  3.55s/it, lr: 1.0e-04 loss: 1.195e-02]mindexpander_qwen_v1:  34%|###4      | 1027/3000 [1:09:13<2:17:46,  4.19s/it, lr: 1.0e-04 loss: 1.195e-02]mindexpander_qwen_v1:  34%|###4      | 1027/3000 [1:09:13<2:17:46,  4.19s/it, lr: 1.0e-04 loss: 1.195e-02]mindexpander_qwen_v1:  34%|###4      | 1027/3000 [1:09:16<2:17:46,  4.19s/it, lr: 1.0e-04 loss: 1.181e-03]mindexpander_qwen_v1:  34%|###4      | 1027/3000 [1:09:16<2:17:46,  4.19s/it, lr: 1.0e-04 loss: 1.181e-03]mindexpander_qwen_v1:  34%|###4      | 1028/3000 [1:09:16<2:02:58,  3.74s/it, lr: 1.0e-04 loss: 1.181e-03]mindexpander_qwen_v1:  34%|###4      | 1028/3000 [1:09:16<2:02:58,  3.74s/it, lr: 1.0e-04 loss: 1.181e-03]mindexpander_qwen_v1:  34%|###4      | 1028/3000 [1:09:18<2:02:58,  3.74s/it, lr: 1.0e-04 loss: 1.165e-01]mindexpander_qwen_v1:  34%|###4      | 1028/3000 [1:09:18<2:02:58,  3.74s/it, lr: 1.0e-04 loss: 1.165e-01]mindexpander_qwen_v1:  34%|###4      | 1029/3000 [1:09:18<1:50:27,  3.36s/it, lr: 1.0e-04 loss: 1.165e-01]mindexpander_qwen_v1:  34%|###4      | 1029/3000 [1:09:18<1:50:27,  3.36s/it, lr: 1.0e-04 loss: 1.165e-01]mindexpander_qwen_v1:  34%|###4      | 1029/3000 [1:09:21<1:50:27,  3.36s/it, lr: 1.0e-04 loss: 2.166e-02]mindexpander_qwen_v1:  34%|###4      | 1029/3000 [1:09:21<1:50:27,  3.36s/it, lr: 1.0e-04 loss: 2.166e-02]mindexpander_qwen_v1:  34%|###4      | 1030/3000 [1:09:25<1:50:24,  3.36s/it, lr: 1.0e-04 loss: 9.299e-03]mindexpander_qwen_v1:  34%|###4      | 1030/3000 [1:09:25<1:50:24,  3.36s/it, lr: 1.0e-04 loss: 9.299e-03]mindexpander_qwen_v1:  34%|###4      | 1031/3000 [1:09:25<1:27:53,  2.68s/it, lr: 1.0e-04 loss: 9.299e-03]mindexpander_qwen_v1:  34%|###4      | 1031/3000 [1:09:25<1:27:53,  2.68s/it, lr: 1.0e-04 loss: 9.299e-03]mindexpander_qwen_v1:  34%|###4      | 1031/3000 [1:09:30<1:27:53,  2.68s/it, lr: 1.0e-04 loss: 4.805e-02]mindexpander_qwen_v1:  34%|###4      | 1031/3000 [1:09:30<1:27:53,  2.68s/it, lr: 1.0e-04 loss: 4.805e-02]mindexpander_qwen_v1:  34%|###4      | 1032/3000 [1:09:30<1:53:37,  3.46s/it, lr: 1.0e-04 loss: 4.805e-02]mindexpander_qwen_v1:  34%|###4      | 1032/3000 [1:09:30<1:53:37,  3.46s/it, lr: 1.0e-04 loss: 4.805e-02]mindexpander_qwen_v1:  34%|###4      | 1032/3000 [1:09:33<1:53:37,  3.46s/it, lr: 1.0e-04 loss: 6.083e-03]mindexpander_qwen_v1:  34%|###4      | 1032/3000 [1:09:33<1:53:37,  3.46s/it, lr: 1.0e-04 loss: 6.083e-03]mindexpander_qwen_v1:  34%|###4      | 1033/3000 [1:09:33<1:44:57,  3.20s/it, lr: 1.0e-04 loss: 6.083e-03]mindexpander_qwen_v1:  34%|###4      | 1033/3000 [1:09:33<1:44:57,  3.20s/it, lr: 1.0e-04 loss: 6.083e-03]mindexpander_qwen_v1:  34%|###4      | 1033/3000 [1:09:35<1:44:57,  3.20s/it, lr: 1.0e-04 loss: 5.438e-02]mindexpander_qwen_v1:  34%|###4      | 1033/3000 [1:09:35<1:44:57,  3.20s/it, lr: 1.0e-04 loss: 5.438e-02]mindexpander_qwen_v1:  34%|###4      | 1034/3000 [1:09:35<1:38:14,  3.00s/it, lr: 1.0e-04 loss: 5.438e-02]mindexpander_qwen_v1:  34%|###4      | 1034/3000 [1:09:35<1:38:14,  3.00s/it, lr: 1.0e-04 loss: 5.438e-02]mindexpander_qwen_v1:  34%|###4      | 1034/3000 [1:09:38<1:38:14,  3.00s/it, lr: 1.0e-04 loss: 6.691e-02]mindexpander_qwen_v1:  34%|###4      | 1034/3000 [1:09:38<1:38:14,  3.00s/it, lr: 1.0e-04 loss: 6.691e-02]mindexpander_qwen_v1:  34%|###4      | 1035/3000 [1:09:38<1:33:15,  2.85s/it, lr: 1.0e-04 loss: 6.691e-02]mindexpander_qwen_v1:  34%|###4      | 1035/3000 [1:09:38<1:33:15,  2.85s/it, lr: 1.0e-04 loss: 6.691e-02]mindexpander_qwen_v1:  34%|###4      | 1035/3000 [1:09:40<1:33:15,  2.85s/it, lr: 1.0e-04 loss: 1.870e-01]mindexpander_qwen_v1:  34%|###4      | 1035/3000 [1:09:40<1:33:15,  2.85s/it, lr: 1.0e-04 loss: 1.870e-01]mindexpander_qwen_v1:  35%|###4      | 1036/3000 [1:09:41<1:31:15,  2.79s/it, lr: 1.0e-04 loss: 1.870e-01]mindexpander_qwen_v1:  35%|###4      | 1036/3000 [1:09:41<1:31:15,  2.79s/it, lr: 1.0e-04 loss: 1.870e-01]mindexpander_qwen_v1:  35%|###4      | 1036/3000 [1:09:44<1:31:15,  2.79s/it, lr: 1.0e-04 loss: 1.344e-01]mindexpander_qwen_v1:  35%|###4      | 1036/3000 [1:09:44<1:31:15,  2.79s/it, lr: 1.0e-04 loss: 1.344e-01]mindexpander_qwen_v1:  35%|###4      | 1037/3000 [1:09:44<1:40:16,  3.06s/it, lr: 1.0e-04 loss: 1.344e-01]mindexpander_qwen_v1:  35%|###4      | 1037/3000 [1:09:44<1:40:16,  3.06s/it, lr: 1.0e-04 loss: 1.344e-01]mindexpander_qwen_v1:  35%|###4      | 1037/3000 [1:09:50<1:40:16,  3.06s/it, lr: 1.0e-04 loss: 1.670e-01]mindexpander_qwen_v1:  35%|###4      | 1037/3000 [1:09:50<1:40:16,  3.06s/it, lr: 1.0e-04 loss: 1.670e-01]mindexpander_qwen_v1:  35%|###4      | 1038/3000 [1:09:50<2:05:57,  3.85s/it, lr: 1.0e-04 loss: 1.670e-01]mindexpander_qwen_v1:  35%|###4      | 1038/3000 [1:09:50<2:05:57,  3.85s/it, lr: 1.0e-04 loss: 1.670e-01]mindexpander_qwen_v1:  35%|###4      | 1038/3000 [1:09:56<2:05:57,  3.85s/it, lr: 1.0e-04 loss: 4.237e-02]mindexpander_qwen_v1:  35%|###4      | 1038/3000 [1:09:56<2:05:57,  3.85s/it, lr: 1.0e-04 loss: 4.237e-02]mindexpander_qwen_v1:  35%|###4      | 1039/3000 [1:09:56<2:24:17,  4.41s/it, lr: 1.0e-04 loss: 4.237e-02]mindexpander_qwen_v1:  35%|###4      | 1039/3000 [1:09:56<2:24:17,  4.41s/it, lr: 1.0e-04 loss: 4.237e-02]mindexpander_qwen_v1:  35%|###4      | 1039/3000 [1:10:00<2:24:17,  4.41s/it, lr: 1.0e-04 loss: 1.183e-01]mindexpander_qwen_v1:  35%|###4      | 1039/3000 [1:10:00<2:24:17,  4.41s/it, lr: 1.0e-04 loss: 1.183e-01]mindexpander_qwen_v1:  35%|###4      | 1040/3000 [1:10:05<2:24:12,  4.41s/it, lr: 1.0e-04 loss: 4.689e-02]mindexpander_qwen_v1:  35%|###4      | 1040/3000 [1:10:05<2:24:12,  4.41s/it, lr: 1.0e-04 loss: 4.689e-02]mindexpander_qwen_v1:  35%|###4      | 1041/3000 [1:10:05<2:01:14,  3.71s/it, lr: 1.0e-04 loss: 4.689e-02]mindexpander_qwen_v1:  35%|###4      | 1041/3000 [1:10:05<2:01:14,  3.71s/it, lr: 1.0e-04 loss: 4.689e-02]mindexpander_qwen_v1:  35%|###4      | 1041/3000 [1:10:11<2:01:14,  3.71s/it, lr: 1.0e-04 loss: 5.002e-04]mindexpander_qwen_v1:  35%|###4      | 1041/3000 [1:10:11<2:01:14,  3.71s/it, lr: 1.0e-04 loss: 5.002e-04]mindexpander_qwen_v1:  35%|###4      | 1042/3000 [1:10:11<2:17:33,  4.22s/it, lr: 1.0e-04 loss: 5.002e-04]mindexpander_qwen_v1:  35%|###4      | 1042/3000 [1:10:11<2:17:33,  4.22s/it, lr: 1.0e-04 loss: 5.002e-04]mindexpander_qwen_v1:  35%|###4      | 1042/3000 [1:10:17<2:17:33,  4.22s/it, lr: 1.0e-04 loss: 4.359e-03]mindexpander_qwen_v1:  35%|###4      | 1042/3000 [1:10:17<2:17:33,  4.22s/it, lr: 1.0e-04 loss: 4.359e-03]mindexpander_qwen_v1:  35%|###4      | 1043/3000 [1:10:17<2:31:43,  4.65s/it, lr: 1.0e-04 loss: 4.359e-03]mindexpander_qwen_v1:  35%|###4      | 1043/3000 [1:10:17<2:31:43,  4.65s/it, lr: 1.0e-04 loss: 4.359e-03]mindexpander_qwen_v1:  35%|###4      | 1043/3000 [1:10:21<2:31:43,  4.65s/it, lr: 1.0e-04 loss: 1.015e-02]mindexpander_qwen_v1:  35%|###4      | 1043/3000 [1:10:21<2:31:43,  4.65s/it, lr: 1.0e-04 loss: 1.015e-02]mindexpander_qwen_v1:  35%|###4      | 1044/3000 [1:10:21<2:23:35,  4.40s/it, lr: 1.0e-04 loss: 1.015e-02]mindexpander_qwen_v1:  35%|###4      | 1044/3000 [1:10:21<2:23:35,  4.40s/it, lr: 1.0e-04 loss: 1.015e-02]mindexpander_qwen_v1:  35%|###4      | 1044/3000 [1:10:23<2:23:35,  4.40s/it, lr: 1.0e-04 loss: 1.113e-01]mindexpander_qwen_v1:  35%|###4      | 1044/3000 [1:10:23<2:23:35,  4.40s/it, lr: 1.0e-04 loss: 1.113e-01]mindexpander_qwen_v1:  35%|###4      | 1045/3000 [1:10:23<2:05:45,  3.86s/it, lr: 1.0e-04 loss: 1.113e-01]mindexpander_qwen_v1:  35%|###4      | 1045/3000 [1:10:23<2:05:45,  3.86s/it, lr: 1.0e-04 loss: 1.113e-01]mindexpander_qwen_v1:  35%|###4      | 1045/3000 [1:10:29<2:05:45,  3.86s/it, lr: 1.0e-04 loss: 2.051e-02]mindexpander_qwen_v1:  35%|###4      | 1045/3000 [1:10:29<2:05:45,  3.86s/it, lr: 1.0e-04 loss: 2.051e-02]mindexpander_qwen_v1:  35%|###4      | 1046/3000 [1:10:29<2:23:15,  4.40s/it, lr: 1.0e-04 loss: 2.051e-02]mindexpander_qwen_v1:  35%|###4      | 1046/3000 [1:10:29<2:23:15,  4.40s/it, lr: 1.0e-04 loss: 2.051e-02]mindexpander_qwen_v1:  35%|###4      | 1046/3000 [1:10:33<2:23:15,  4.40s/it, lr: 1.0e-04 loss: 1.113e-01]mindexpander_qwen_v1:  35%|###4      | 1046/3000 [1:10:33<2:23:15,  4.40s/it, lr: 1.0e-04 loss: 1.113e-01]mindexpander_qwen_v1:  35%|###4      | 1047/3000 [1:10:33<2:18:31,  4.26s/it, lr: 1.0e-04 loss: 1.113e-01]mindexpander_qwen_v1:  35%|###4      | 1047/3000 [1:10:33<2:18:31,  4.26s/it, lr: 1.0e-04 loss: 1.113e-01]mindexpander_qwen_v1:  35%|###4      | 1047/3000 [1:10:35<2:18:31,  4.26s/it, lr: 1.0e-04 loss: 7.422e-02]mindexpander_qwen_v1:  35%|###4      | 1047/3000 [1:10:35<2:18:31,  4.26s/it, lr: 1.0e-04 loss: 7.422e-02]mindexpander_qwen_v1:  35%|###4      | 1048/3000 [1:10:35<2:01:14,  3.73s/it, lr: 1.0e-04 loss: 7.422e-02]mindexpander_qwen_v1:  35%|###4      | 1048/3000 [1:10:35<2:01:14,  3.73s/it, lr: 1.0e-04 loss: 7.422e-02]mindexpander_qwen_v1:  35%|###4      | 1048/3000 [1:10:39<2:01:14,  3.73s/it, lr: 1.0e-04 loss: 1.954e-01]mindexpander_qwen_v1:  35%|###4      | 1048/3000 [1:10:39<2:01:14,  3.73s/it, lr: 1.0e-04 loss: 1.954e-01]mindexpander_qwen_v1:  35%|###4      | 1049/3000 [1:10:39<2:01:17,  3.73s/it, lr: 1.0e-04 loss: 1.954e-01]mindexpander_qwen_v1:  35%|###4      | 1049/3000 [1:10:39<2:01:17,  3.73s/it, lr: 1.0e-04 loss: 1.954e-01]mindexpander_qwen_v1:  35%|###4      | 1049/3000 [1:10:42<2:01:17,  3.73s/it, lr: 1.0e-04 loss: 1.570e-01]mindexpander_qwen_v1:  35%|###4      | 1049/3000 [1:10:42<2:01:17,  3.73s/it, lr: 1.0e-04 loss: 1.570e-01]mindexpander_qwen_v1:  35%|###5      | 1050/3000 [1:10:45<2:01:14,  3.73s/it, lr: 1.0e-04 loss: 1.091e-01]mindexpander_qwen_v1:  35%|###5      | 1050/3000 [1:10:45<2:01:14,  3.73s/it, lr: 1.0e-04 loss: 1.091e-01]mindexpander_qwen_v1:  35%|###5      | 1051/3000 [1:10:45<1:25:57,  2.65s/it, lr: 1.0e-04 loss: 1.091e-01]mindexpander_qwen_v1:  35%|###5      | 1051/3000 [1:10:45<1:25:57,  2.65s/it, lr: 1.0e-04 loss: 1.091e-01]mindexpander_qwen_v1:  35%|###5      | 1051/3000 [1:10:48<1:25:57,  2.65s/it, lr: 1.0e-04 loss: 1.615e-02]mindexpander_qwen_v1:  35%|###5      | 1051/3000 [1:10:48<1:25:57,  2.65s/it, lr: 1.0e-04 loss: 1.615e-02]mindexpander_qwen_v1:  35%|###5      | 1052/3000 [1:10:48<1:34:38,  2.92s/it, lr: 1.0e-04 loss: 1.615e-02]mindexpander_qwen_v1:  35%|###5      | 1052/3000 [1:10:48<1:34:38,  2.92s/it, lr: 1.0e-04 loss: 1.615e-02]mindexpander_qwen_v1:  35%|###5      | 1052/3000 [1:10:52<1:34:38,  2.92s/it, lr: 1.0e-04 loss: 1.666e-01]mindexpander_qwen_v1:  35%|###5      | 1052/3000 [1:10:52<1:34:38,  2.92s/it, lr: 1.0e-04 loss: 1.666e-01]mindexpander_qwen_v1:  35%|###5      | 1053/3000 [1:10:52<1:41:32,  3.13s/it, lr: 1.0e-04 loss: 1.666e-01]mindexpander_qwen_v1:  35%|###5      | 1053/3000 [1:10:52<1:41:32,  3.13s/it, lr: 1.0e-04 loss: 1.666e-01]mindexpander_qwen_v1:  35%|###5      | 1053/3000 [1:10:55<1:41:32,  3.13s/it, lr: 1.0e-04 loss: 1.661e-01]mindexpander_qwen_v1:  35%|###5      | 1053/3000 [1:10:55<1:41:32,  3.13s/it, lr: 1.0e-04 loss: 1.661e-01]mindexpander_qwen_v1:  35%|###5      | 1054/3000 [1:10:55<1:35:29,  2.94s/it, lr: 1.0e-04 loss: 1.661e-01]mindexpander_qwen_v1:  35%|###5      | 1054/3000 [1:10:55<1:35:29,  2.94s/it, lr: 1.0e-04 loss: 1.661e-01]mindexpander_qwen_v1:  35%|###5      | 1054/3000 [1:10:58<1:35:29,  2.94s/it, lr: 1.0e-04 loss: 1.842e-01]mindexpander_qwen_v1:  35%|###5      | 1054/3000 [1:10:58<1:35:29,  2.94s/it, lr: 1.0e-04 loss: 1.842e-01]mindexpander_qwen_v1:  35%|###5      | 1055/3000 [1:10:58<1:44:24,  3.22s/it, lr: 1.0e-04 loss: 1.842e-01]mindexpander_qwen_v1:  35%|###5      | 1055/3000 [1:10:58<1:44:24,  3.22s/it, lr: 1.0e-04 loss: 1.842e-01]mindexpander_qwen_v1:  35%|###5      | 1055/3000 [1:11:01<1:44:24,  3.22s/it, lr: 1.0e-04 loss: 4.106e-02]mindexpander_qwen_v1:  35%|###5      | 1055/3000 [1:11:01<1:44:24,  3.22s/it, lr: 1.0e-04 loss: 4.106e-02]mindexpander_qwen_v1:  35%|###5      | 1056/3000 [1:11:01<1:37:12,  3.00s/it, lr: 1.0e-04 loss: 4.106e-02]mindexpander_qwen_v1:  35%|###5      | 1056/3000 [1:11:01<1:37:12,  3.00s/it, lr: 1.0e-04 loss: 4.106e-02]mindexpander_qwen_v1:  35%|###5      | 1056/3000 [1:11:07<1:37:12,  3.00s/it, lr: 1.0e-04 loss: 1.546e-01]mindexpander_qwen_v1:  35%|###5      | 1056/3000 [1:11:07<1:37:12,  3.00s/it, lr: 1.0e-04 loss: 1.546e-01]mindexpander_qwen_v1:  35%|###5      | 1057/3000 [1:11:07<2:03:04,  3.80s/it, lr: 1.0e-04 loss: 1.546e-01]mindexpander_qwen_v1:  35%|###5      | 1057/3000 [1:11:07<2:03:04,  3.80s/it, lr: 1.0e-04 loss: 1.546e-01]mindexpander_qwen_v1:  35%|###5      | 1057/3000 [1:11:12<2:03:04,  3.80s/it, lr: 1.0e-04 loss: 4.299e-02]mindexpander_qwen_v1:  35%|###5      | 1057/3000 [1:11:12<2:03:04,  3.80s/it, lr: 1.0e-04 loss: 4.299e-02]mindexpander_qwen_v1:  35%|###5      | 1058/3000 [1:11:12<2:21:34,  4.37s/it, lr: 1.0e-04 loss: 4.299e-02]mindexpander_qwen_v1:  35%|###5      | 1058/3000 [1:11:12<2:21:34,  4.37s/it, lr: 1.0e-04 loss: 4.299e-02]mindexpander_qwen_v1:  35%|###5      | 1058/3000 [1:11:16<2:21:34,  4.37s/it, lr: 1.0e-04 loss: 2.615e-02]mindexpander_qwen_v1:  35%|###5      | 1058/3000 [1:11:16<2:21:34,  4.37s/it, lr: 1.0e-04 loss: 2.615e-02]mindexpander_qwen_v1:  35%|###5      | 1059/3000 [1:11:16<2:17:19,  4.25s/it, lr: 1.0e-04 loss: 2.615e-02]mindexpander_qwen_v1:  35%|###5      | 1059/3000 [1:11:16<2:17:19,  4.25s/it, lr: 1.0e-04 loss: 2.615e-02]mindexpander_qwen_v1:  35%|###5      | 1059/3000 [1:11:20<2:17:19,  4.25s/it, lr: 1.0e-04 loss: 1.108e-01]mindexpander_qwen_v1:  35%|###5      | 1059/3000 [1:11:20<2:17:19,  4.25s/it, lr: 1.0e-04 loss: 1.108e-01]mindexpander_qwen_v1:  35%|###5      | 1060/3000 [1:11:23<2:17:15,  4.25s/it, lr: 1.0e-04 loss: 1.271e-01]mindexpander_qwen_v1:  35%|###5      | 1060/3000 [1:11:23<2:17:15,  4.25s/it, lr: 1.0e-04 loss: 1.271e-01]mindexpander_qwen_v1:  35%|###5      | 1061/3000 [1:11:23<1:32:30,  2.86s/it, lr: 1.0e-04 loss: 1.271e-01]mindexpander_qwen_v1:  35%|###5      | 1061/3000 [1:11:23<1:32:30,  2.86s/it, lr: 1.0e-04 loss: 1.271e-01]mindexpander_qwen_v1:  35%|###5      | 1061/3000 [1:11:26<1:32:30,  2.86s/it, lr: 1.0e-04 loss: 2.174e-02]mindexpander_qwen_v1:  35%|###5      | 1061/3000 [1:11:26<1:32:30,  2.86s/it, lr: 1.0e-04 loss: 2.174e-02]mindexpander_qwen_v1:  35%|###5      | 1062/3000 [1:11:26<1:39:28,  3.08s/it, lr: 1.0e-04 loss: 2.174e-02]mindexpander_qwen_v1:  35%|###5      | 1062/3000 [1:11:26<1:39:28,  3.08s/it, lr: 1.0e-04 loss: 2.174e-02]mindexpander_qwen_v1:  35%|###5      | 1062/3000 [1:11:32<1:39:28,  3.08s/it, lr: 1.0e-04 loss: 1.132e-02]mindexpander_qwen_v1:  35%|###5      | 1062/3000 [1:11:32<1:39:28,  3.08s/it, lr: 1.0e-04 loss: 1.132e-02]mindexpander_qwen_v1:  35%|###5      | 1063/3000 [1:11:32<2:03:01,  3.81s/it, lr: 1.0e-04 loss: 1.132e-02]mindexpander_qwen_v1:  35%|###5      | 1063/3000 [1:11:32<2:03:01,  3.81s/it, lr: 1.0e-04 loss: 1.132e-02]mindexpander_qwen_v1:  35%|###5      | 1063/3000 [1:11:36<2:03:01,  3.81s/it, lr: 1.0e-04 loss: 7.585e-02]mindexpander_qwen_v1:  35%|###5      | 1063/3000 [1:11:36<2:03:01,  3.81s/it, lr: 1.0e-04 loss: 7.585e-02]mindexpander_qwen_v1:  35%|###5      | 1064/3000 [1:11:36<2:02:21,  3.79s/it, lr: 1.0e-04 loss: 7.585e-02]mindexpander_qwen_v1:  35%|###5      | 1064/3000 [1:11:36<2:02:21,  3.79s/it, lr: 1.0e-04 loss: 7.585e-02]mindexpander_qwen_v1:  35%|###5      | 1064/3000 [1:11:40<2:02:21,  3.79s/it, lr: 1.0e-04 loss: 1.703e-01]mindexpander_qwen_v1:  35%|###5      | 1064/3000 [1:11:40<2:02:21,  3.79s/it, lr: 1.0e-04 loss: 1.703e-01]mindexpander_qwen_v1:  36%|###5      | 1065/3000 [1:11:40<2:01:49,  3.78s/it, lr: 1.0e-04 loss: 1.703e-01]mindexpander_qwen_v1:  36%|###5      | 1065/3000 [1:11:40<2:01:49,  3.78s/it, lr: 1.0e-04 loss: 1.703e-01]mindexpander_qwen_v1:  36%|###5      | 1065/3000 [1:11:42<2:01:49,  3.78s/it, lr: 1.0e-04 loss: 1.031e-01]mindexpander_qwen_v1:  36%|###5      | 1065/3000 [1:11:42<2:01:49,  3.78s/it, lr: 1.0e-04 loss: 1.031e-01]mindexpander_qwen_v1:  36%|###5      | 1066/3000 [1:11:42<1:49:37,  3.40s/it, lr: 1.0e-04 loss: 1.031e-01]mindexpander_qwen_v1:  36%|###5      | 1066/3000 [1:11:42<1:49:37,  3.40s/it, lr: 1.0e-04 loss: 1.031e-01]mindexpander_qwen_v1:  36%|###5      | 1066/3000 [1:11:48<1:49:37,  3.40s/it, lr: 1.0e-04 loss: 1.494e-01]mindexpander_qwen_v1:  36%|###5      | 1066/3000 [1:11:48<1:49:37,  3.40s/it, lr: 1.0e-04 loss: 1.494e-01]mindexpander_qwen_v1:  36%|###5      | 1067/3000 [1:11:48<2:12:47,  4.12s/it, lr: 1.0e-04 loss: 1.494e-01]mindexpander_qwen_v1:  36%|###5      | 1067/3000 [1:11:48<2:12:47,  4.12s/it, lr: 1.0e-04 loss: 1.494e-01]mindexpander_qwen_v1:  36%|###5      | 1067/3000 [1:11:54<2:12:47,  4.12s/it, lr: 1.0e-04 loss: 1.662e-01]mindexpander_qwen_v1:  36%|###5      | 1067/3000 [1:11:54<2:12:47,  4.12s/it, lr: 1.0e-04 loss: 1.662e-01]mindexpander_qwen_v1:  36%|###5      | 1068/3000 [1:11:54<2:28:08,  4.60s/it, lr: 1.0e-04 loss: 1.662e-01]mindexpander_qwen_v1:  36%|###5      | 1068/3000 [1:11:54<2:28:08,  4.60s/it, lr: 1.0e-04 loss: 1.662e-01]mindexpander_qwen_v1:  36%|###5      | 1068/3000 [1:12:00<2:28:08,  4.60s/it, lr: 1.0e-04 loss: 1.126e-01]mindexpander_qwen_v1:  36%|###5      | 1068/3000 [1:12:00<2:28:08,  4.60s/it, lr: 1.0e-04 loss: 1.126e-01]mindexpander_qwen_v1:  36%|###5      | 1069/3000 [1:12:00<2:39:01,  4.94s/it, lr: 1.0e-04 loss: 1.126e-01]mindexpander_qwen_v1:  36%|###5      | 1069/3000 [1:12:00<2:39:01,  4.94s/it, lr: 1.0e-04 loss: 1.126e-01]mindexpander_qwen_v1:  36%|###5      | 1069/3000 [1:12:05<2:39:01,  4.94s/it, lr: 1.0e-04 loss: 9.465e-02]mindexpander_qwen_v1:  36%|###5      | 1069/3000 [1:12:05<2:39:01,  4.94s/it, lr: 1.0e-04 loss: 9.465e-02]mindexpander_qwen_v1:  36%|###5      | 1070/3000 [1:12:08<2:38:56,  4.94s/it, lr: 1.0e-04 loss: 2.640e-02]mindexpander_qwen_v1:  36%|###5      | 1070/3000 [1:12:08<2:38:56,  4.94s/it, lr: 1.0e-04 loss: 2.640e-02]mindexpander_qwen_v1:  36%|###5      | 1071/3000 [1:12:08<1:45:44,  3.29s/it, lr: 1.0e-04 loss: 2.640e-02]mindexpander_qwen_v1:  36%|###5      | 1071/3000 [1:12:08<1:45:44,  3.29s/it, lr: 1.0e-04 loss: 2.640e-02]mindexpander_qwen_v1:  36%|###5      | 1071/3000 [1:12:12<1:45:44,  3.29s/it, lr: 1.0e-04 loss: 1.546e-01]mindexpander_qwen_v1:  36%|###5      | 1071/3000 [1:12:12<1:45:44,  3.29s/it, lr: 1.0e-04 loss: 1.546e-01]mindexpander_qwen_v1:  36%|###5      | 1072/3000 [1:12:12<1:49:16,  3.40s/it, lr: 1.0e-04 loss: 1.546e-01]mindexpander_qwen_v1:  36%|###5      | 1072/3000 [1:12:12<1:49:16,  3.40s/it, lr: 1.0e-04 loss: 1.546e-01]mindexpander_qwen_v1:  36%|###5      | 1072/3000 [1:12:17<1:49:16,  3.40s/it, lr: 1.0e-04 loss: 1.225e-01]mindexpander_qwen_v1:  36%|###5      | 1072/3000 [1:12:17<1:49:16,  3.40s/it, lr: 1.0e-04 loss: 1.225e-01]mindexpander_qwen_v1:  36%|###5      | 1073/3000 [1:12:17<2:08:55,  4.01s/it, lr: 1.0e-04 loss: 1.225e-01]mindexpander_qwen_v1:  36%|###5      | 1073/3000 [1:12:17<2:08:55,  4.01s/it, lr: 1.0e-04 loss: 1.225e-01]mindexpander_qwen_v1:  36%|###5      | 1073/3000 [1:12:21<2:08:55,  4.01s/it, lr: 1.0e-04 loss: 6.619e-02]mindexpander_qwen_v1:  36%|###5      | 1073/3000 [1:12:21<2:08:55,  4.01s/it, lr: 1.0e-04 loss: 6.619e-02]mindexpander_qwen_v1:  36%|###5      | 1074/3000 [1:12:21<2:06:28,  3.94s/it, lr: 1.0e-04 loss: 6.619e-02]mindexpander_qwen_v1:  36%|###5      | 1074/3000 [1:12:21<2:06:28,  3.94s/it, lr: 1.0e-04 loss: 6.619e-02]mindexpander_qwen_v1:  36%|###5      | 1074/3000 [1:12:24<2:06:28,  3.94s/it, lr: 1.0e-04 loss: 9.879e-03]mindexpander_qwen_v1:  36%|###5      | 1074/3000 [1:12:24<2:06:28,  3.94s/it, lr: 1.0e-04 loss: 9.879e-03]mindexpander_qwen_v1:  36%|###5      | 1075/3000 [1:12:24<1:54:51,  3.58s/it, lr: 1.0e-04 loss: 9.879e-03]mindexpander_qwen_v1:  36%|###5      | 1075/3000 [1:12:24<1:54:51,  3.58s/it, lr: 1.0e-04 loss: 9.879e-03]mindexpander_qwen_v1:  36%|###5      | 1075/3000 [1:12:26<1:54:51,  3.58s/it, lr: 1.0e-04 loss: 1.588e-01]mindexpander_qwen_v1:  36%|###5      | 1075/3000 [1:12:26<1:54:51,  3.58s/it, lr: 1.0e-04 loss: 1.588e-01]mindexpander_qwen_v1:  36%|###5      | 1076/3000 [1:12:26<1:44:24,  3.26s/it, lr: 1.0e-04 loss: 1.588e-01]mindexpander_qwen_v1:  36%|###5      | 1076/3000 [1:12:26<1:44:24,  3.26s/it, lr: 1.0e-04 loss: 1.588e-01]mindexpander_qwen_v1:  36%|###5      | 1076/3000 [1:12:32<1:44:24,  3.26s/it, lr: 1.0e-04 loss: 4.119e-02]mindexpander_qwen_v1:  36%|###5      | 1076/3000 [1:12:32<1:44:24,  3.26s/it, lr: 1.0e-04 loss: 4.119e-02]mindexpander_qwen_v1:  36%|###5      | 1077/3000 [1:12:32<2:07:31,  3.98s/it, lr: 1.0e-04 loss: 4.119e-02]mindexpander_qwen_v1:  36%|###5      | 1077/3000 [1:12:32<2:07:31,  3.98s/it, lr: 1.0e-04 loss: 4.119e-02]mindexpander_qwen_v1:  36%|###5      | 1077/3000 [1:12:35<2:07:31,  3.98s/it, lr: 1.0e-04 loss: 5.942e-02]mindexpander_qwen_v1:  36%|###5      | 1077/3000 [1:12:35<2:07:31,  3.98s/it, lr: 1.0e-04 loss: 5.942e-02]mindexpander_qwen_v1:  36%|###5      | 1078/3000 [1:12:35<1:53:08,  3.53s/it, lr: 1.0e-04 loss: 5.942e-02]mindexpander_qwen_v1:  36%|###5      | 1078/3000 [1:12:35<1:53:08,  3.53s/it, lr: 1.0e-04 loss: 5.942e-02]mindexpander_qwen_v1:  36%|###5      | 1078/3000 [1:12:40<1:53:08,  3.53s/it, lr: 1.0e-04 loss: 3.226e-02]mindexpander_qwen_v1:  36%|###5      | 1078/3000 [1:12:40<1:53:08,  3.53s/it, lr: 1.0e-04 loss: 3.226e-02]mindexpander_qwen_v1:  36%|###5      | 1079/3000 [1:12:40<2:15:29,  4.23s/it, lr: 1.0e-04 loss: 3.226e-02]mindexpander_qwen_v1:  36%|###5      | 1079/3000 [1:12:40<2:15:29,  4.23s/it, lr: 1.0e-04 loss: 3.226e-02]mindexpander_qwen_v1:  36%|###5      | 1079/3000 [1:12:46<2:15:29,  4.23s/it, lr: 1.0e-04 loss: 6.347e-02]mindexpander_qwen_v1:  36%|###5      | 1079/3000 [1:12:46<2:15:29,  4.23s/it, lr: 1.0e-04 loss: 6.347e-02]mindexpander_qwen_v1:  36%|###6      | 1080/3000 [1:12:50<2:15:25,  4.23s/it, lr: 1.0e-04 loss: 5.301e-03]mindexpander_qwen_v1:  36%|###6      | 1080/3000 [1:12:50<2:15:25,  4.23s/it, lr: 1.0e-04 loss: 5.301e-03]mindexpander_qwen_v1:  36%|###6      | 1081/3000 [1:12:50<1:40:49,  3.15s/it, lr: 1.0e-04 loss: 5.301e-03]mindexpander_qwen_v1:  36%|###6      | 1081/3000 [1:12:50<1:40:49,  3.15s/it, lr: 1.0e-04 loss: 5.301e-03]mindexpander_qwen_v1:  36%|###6      | 1081/3000 [1:12:53<1:40:49,  3.15s/it, lr: 1.0e-04 loss: 2.785e-02]mindexpander_qwen_v1:  36%|###6      | 1081/3000 [1:12:53<1:40:49,  3.15s/it, lr: 1.0e-04 loss: 2.785e-02]mindexpander_qwen_v1:  36%|###6      | 1082/3000 [1:12:53<1:35:20,  2.98s/it, lr: 1.0e-04 loss: 2.785e-02]mindexpander_qwen_v1:  36%|###6      | 1082/3000 [1:12:53<1:35:20,  2.98s/it, lr: 1.0e-04 loss: 2.785e-02]mindexpander_qwen_v1:  36%|###6      | 1082/3000 [1:12:55<1:35:20,  2.98s/it, lr: 1.0e-04 loss: 1.859e-01]mindexpander_qwen_v1:  36%|###6      | 1082/3000 [1:12:55<1:35:20,  2.98s/it, lr: 1.0e-04 loss: 1.859e-01]mindexpander_qwen_v1:  36%|###6      | 1083/3000 [1:12:55<1:33:16,  2.92s/it, lr: 1.0e-04 loss: 1.859e-01]mindexpander_qwen_v1:  36%|###6      | 1083/3000 [1:12:55<1:33:16,  2.92s/it, lr: 1.0e-04 loss: 1.859e-01]mindexpander_qwen_v1:  36%|###6      | 1083/3000 [1:13:01<1:33:16,  2.92s/it, lr: 1.0e-04 loss: 3.879e-03]mindexpander_qwen_v1:  36%|###6      | 1083/3000 [1:13:01<1:33:16,  2.92s/it, lr: 1.0e-04 loss: 3.879e-03]mindexpander_qwen_v1:  36%|###6      | 1084/3000 [1:13:01<1:57:44,  3.69s/it, lr: 1.0e-04 loss: 3.879e-03]mindexpander_qwen_v1:  36%|###6      | 1084/3000 [1:13:01<1:57:44,  3.69s/it, lr: 1.0e-04 loss: 3.879e-03]mindexpander_qwen_v1:  36%|###6      | 1084/3000 [1:13:05<1:57:44,  3.69s/it, lr: 1.0e-04 loss: 1.792e-01]mindexpander_qwen_v1:  36%|###6      | 1084/3000 [1:13:05<1:57:44,  3.69s/it, lr: 1.0e-04 loss: 1.792e-01]mindexpander_qwen_v1:  36%|###6      | 1085/3000 [1:13:05<1:58:09,  3.70s/it, lr: 1.0e-04 loss: 1.792e-01]mindexpander_qwen_v1:  36%|###6      | 1085/3000 [1:13:05<1:58:09,  3.70s/it, lr: 1.0e-04 loss: 1.792e-01]mindexpander_qwen_v1:  36%|###6      | 1085/3000 [1:13:11<1:58:09,  3.70s/it, lr: 1.0e-04 loss: 1.025e-01]mindexpander_qwen_v1:  36%|###6      | 1085/3000 [1:13:11<1:58:09,  3.70s/it, lr: 1.0e-04 loss: 1.025e-01]mindexpander_qwen_v1:  36%|###6      | 1086/3000 [1:13:11<2:16:49,  4.29s/it, lr: 1.0e-04 loss: 1.025e-01]mindexpander_qwen_v1:  36%|###6      | 1086/3000 [1:13:11<2:16:49,  4.29s/it, lr: 1.0e-04 loss: 1.025e-01]mindexpander_qwen_v1:  36%|###6      | 1086/3000 [1:13:15<2:16:49,  4.29s/it, lr: 1.0e-04 loss: 1.518e-01]mindexpander_qwen_v1:  36%|###6      | 1086/3000 [1:13:15<2:16:49,  4.29s/it, lr: 1.0e-04 loss: 1.518e-01]mindexpander_qwen_v1:  36%|###6      | 1087/3000 [1:13:15<2:13:29,  4.19s/it, lr: 1.0e-04 loss: 1.518e-01]mindexpander_qwen_v1:  36%|###6      | 1087/3000 [1:13:15<2:13:29,  4.19s/it, lr: 1.0e-04 loss: 1.518e-01]mindexpander_qwen_v1:  36%|###6      | 1087/3000 [1:13:17<2:13:29,  4.19s/it, lr: 1.0e-04 loss: 2.247e-02]mindexpander_qwen_v1:  36%|###6      | 1087/3000 [1:13:17<2:13:29,  4.19s/it, lr: 1.0e-04 loss: 2.247e-02]mindexpander_qwen_v1:  36%|###6      | 1088/3000 [1:13:17<1:57:14,  3.68s/it, lr: 1.0e-04 loss: 2.247e-02]mindexpander_qwen_v1:  36%|###6      | 1088/3000 [1:13:17<1:57:14,  3.68s/it, lr: 1.0e-04 loss: 2.247e-02]mindexpander_qwen_v1:  36%|###6      | 1088/3000 [1:13:21<1:57:14,  3.68s/it, lr: 1.0e-04 loss: 3.876e-02]mindexpander_qwen_v1:  36%|###6      | 1088/3000 [1:13:21<1:57:14,  3.68s/it, lr: 1.0e-04 loss: 3.876e-02]mindexpander_qwen_v1:  36%|###6      | 1089/3000 [1:13:21<1:57:47,  3.70s/it, lr: 1.0e-04 loss: 3.876e-02]mindexpander_qwen_v1:  36%|###6      | 1089/3000 [1:13:21<1:57:47,  3.70s/it, lr: 1.0e-04 loss: 3.876e-02]mindexpander_qwen_v1:  36%|###6      | 1089/3000 [1:13:23<1:57:47,  3.70s/it, lr: 1.0e-04 loss: 7.431e-02]mindexpander_qwen_v1:  36%|###6      | 1089/3000 [1:13:23<1:57:47,  3.70s/it, lr: 1.0e-04 loss: 7.431e-02]mindexpander_qwen_v1:  36%|###6      | 1090/3000 [1:13:26<1:57:43,  3.70s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  36%|###6      | 1090/3000 [1:13:26<1:57:43,  3.70s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  36%|###6      | 1091/3000 [1:13:26<1:23:05,  2.61s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  36%|###6      | 1091/3000 [1:13:26<1:23:05,  2.61s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  36%|###6      | 1091/3000 [1:13:32<1:23:05,  2.61s/it, lr: 1.0e-04 loss: 4.925e-02]mindexpander_qwen_v1:  36%|###6      | 1091/3000 [1:13:32<1:23:05,  2.61s/it, lr: 1.0e-04 loss: 4.925e-02]mindexpander_qwen_v1:  36%|###6      | 1092/3000 [1:13:32<1:47:37,  3.38s/it, lr: 1.0e-04 loss: 4.925e-02]mindexpander_qwen_v1:  36%|###6      | 1092/3000 [1:13:32<1:47:37,  3.38s/it, lr: 1.0e-04 loss: 4.925e-02]mindexpander_qwen_v1:  36%|###6      | 1092/3000 [1:13:34<1:47:37,  3.38s/it, lr: 1.0e-04 loss: 2.715e-02]mindexpander_qwen_v1:  36%|###6      | 1092/3000 [1:13:34<1:47:37,  3.38s/it, lr: 1.0e-04 loss: 2.715e-02]mindexpander_qwen_v1:  36%|###6      | 1093/3000 [1:13:34<1:39:52,  3.14s/it, lr: 1.0e-04 loss: 2.715e-02]mindexpander_qwen_v1:  36%|###6      | 1093/3000 [1:13:34<1:39:52,  3.14s/it, lr: 1.0e-04 loss: 2.715e-02]mindexpander_qwen_v1:  36%|###6      | 1093/3000 [1:13:38<1:39:52,  3.14s/it, lr: 1.0e-04 loss: 1.841e-01]mindexpander_qwen_v1:  36%|###6      | 1093/3000 [1:13:38<1:39:52,  3.14s/it, lr: 1.0e-04 loss: 1.841e-01]mindexpander_qwen_v1:  36%|###6      | 1094/3000 [1:13:38<1:44:58,  3.30s/it, lr: 1.0e-04 loss: 1.841e-01]mindexpander_qwen_v1:  36%|###6      | 1094/3000 [1:13:38<1:44:58,  3.30s/it, lr: 1.0e-04 loss: 1.841e-01]mindexpander_qwen_v1:  36%|###6      | 1094/3000 [1:13:42<1:44:58,  3.30s/it, lr: 1.0e-04 loss: 2.224e-02]mindexpander_qwen_v1:  36%|###6      | 1094/3000 [1:13:42<1:44:58,  3.30s/it, lr: 1.0e-04 loss: 2.224e-02]mindexpander_qwen_v1:  36%|###6      | 1095/3000 [1:13:42<1:50:26,  3.48s/it, lr: 1.0e-04 loss: 2.224e-02]mindexpander_qwen_v1:  36%|###6      | 1095/3000 [1:13:42<1:50:26,  3.48s/it, lr: 1.0e-04 loss: 2.224e-02]mindexpander_qwen_v1:  36%|###6      | 1095/3000 [1:13:48<1:50:26,  3.48s/it, lr: 1.0e-04 loss: 8.355e-02]mindexpander_qwen_v1:  36%|###6      | 1095/3000 [1:13:48<1:50:26,  3.48s/it, lr: 1.0e-04 loss: 8.355e-02]mindexpander_qwen_v1:  37%|###6      | 1096/3000 [1:13:48<2:10:57,  4.13s/it, lr: 1.0e-04 loss: 8.355e-02]mindexpander_qwen_v1:  37%|###6      | 1096/3000 [1:13:48<2:10:57,  4.13s/it, lr: 1.0e-04 loss: 8.355e-02]mindexpander_qwen_v1:  37%|###6      | 1096/3000 [1:13:53<2:10:57,  4.13s/it, lr: 1.0e-04 loss: 1.899e-02]mindexpander_qwen_v1:  37%|###6      | 1096/3000 [1:13:53<2:10:57,  4.13s/it, lr: 1.0e-04 loss: 1.899e-02]mindexpander_qwen_v1:  37%|###6      | 1097/3000 [1:13:53<2:25:51,  4.60s/it, lr: 1.0e-04 loss: 1.899e-02]mindexpander_qwen_v1:  37%|###6      | 1097/3000 [1:13:53<2:25:51,  4.60s/it, lr: 1.0e-04 loss: 1.899e-02]mindexpander_qwen_v1:  37%|###6      | 1097/3000 [1:13:59<2:25:51,  4.60s/it, lr: 1.0e-04 loss: 3.635e-02]mindexpander_qwen_v1:  37%|###6      | 1097/3000 [1:13:59<2:25:51,  4.60s/it, lr: 1.0e-04 loss: 3.635e-02]mindexpander_qwen_v1:  37%|###6      | 1098/3000 [1:13:59<2:36:30,  4.94s/it, lr: 1.0e-04 loss: 3.635e-02]mindexpander_qwen_v1:  37%|###6      | 1098/3000 [1:13:59<2:36:30,  4.94s/it, lr: 1.0e-04 loss: 3.635e-02]mindexpander_qwen_v1:  37%|###6      | 1098/3000 [1:14:02<2:36:30,  4.94s/it, lr: 1.0e-04 loss: 1.649e-01]mindexpander_qwen_v1:  37%|###6      | 1098/3000 [1:14:02<2:36:30,  4.94s/it, lr: 1.0e-04 loss: 1.649e-01]mindexpander_qwen_v1:  37%|###6      | 1099/3000 [1:14:02<2:15:11,  4.27s/it, lr: 1.0e-04 loss: 1.649e-01]mindexpander_qwen_v1:  37%|###6      | 1099/3000 [1:14:02<2:15:11,  4.27s/it, lr: 1.0e-04 loss: 1.649e-01]mindexpander_qwen_v1:  37%|###6      | 1099/3000 [1:14:04<2:15:11,  4.27s/it, lr: 1.0e-04 loss: 1.882e-01]mindexpander_qwen_v1:  37%|###6      | 1099/3000 [1:14:04<2:15:11,  4.27s/it, lr: 1.0e-04 loss: 1.882e-01]mindexpander_qwen_v1:  37%|###6      | 1100/3000 [1:14:08<2:15:06,  4.27s/it, lr: 1.0e-04 loss: 7.112e-02]mindexpander_qwen_v1:  37%|###6      | 1100/3000 [1:14:08<2:15:06,  4.27s/it, lr: 1.0e-04 loss: 7.112e-02]mindexpander_qwen_v1:  37%|###6      | 1101/3000 [1:14:08<1:40:21,  3.17s/it, lr: 1.0e-04 loss: 7.112e-02]mindexpander_qwen_v1:  37%|###6      | 1101/3000 [1:14:08<1:40:21,  3.17s/it, lr: 1.0e-04 loss: 7.112e-02]mindexpander_qwen_v1:  37%|###6      | 1101/3000 [1:14:14<1:40:21,  3.17s/it, lr: 1.0e-04 loss: 1.917e-02]mindexpander_qwen_v1:  37%|###6      | 1101/3000 [1:14:14<1:40:21,  3.17s/it, lr: 1.0e-04 loss: 1.917e-02]mindexpander_qwen_v1:  37%|###6      | 1102/3000 [1:14:14<2:01:30,  3.84s/it, lr: 1.0e-04 loss: 1.917e-02]mindexpander_qwen_v1:  37%|###6      | 1102/3000 [1:14:14<2:01:30,  3.84s/it, lr: 1.0e-04 loss: 1.917e-02]mindexpander_qwen_v1:  37%|###6      | 1102/3000 [1:14:20<2:01:30,  3.84s/it, lr: 1.0e-04 loss: 1.479e-01]mindexpander_qwen_v1:  37%|###6      | 1102/3000 [1:14:20<2:01:30,  3.84s/it, lr: 1.0e-04 loss: 1.479e-01]mindexpander_qwen_v1:  37%|###6      | 1103/3000 [1:14:20<2:17:10,  4.34s/it, lr: 1.0e-04 loss: 1.479e-01]mindexpander_qwen_v1:  37%|###6      | 1103/3000 [1:14:20<2:17:10,  4.34s/it, lr: 1.0e-04 loss: 1.479e-01]mindexpander_qwen_v1:  37%|###6      | 1103/3000 [1:14:23<2:17:10,  4.34s/it, lr: 1.0e-04 loss: 1.650e-01]mindexpander_qwen_v1:  37%|###6      | 1103/3000 [1:14:23<2:17:10,  4.34s/it, lr: 1.0e-04 loss: 1.650e-01]mindexpander_qwen_v1:  37%|###6      | 1104/3000 [1:14:23<2:11:58,  4.18s/it, lr: 1.0e-04 loss: 1.650e-01]mindexpander_qwen_v1:  37%|###6      | 1104/3000 [1:14:23<2:11:58,  4.18s/it, lr: 1.0e-04 loss: 1.650e-01]mindexpander_qwen_v1:  37%|###6      | 1104/3000 [1:14:29<2:11:58,  4.18s/it, lr: 1.0e-04 loss: 1.795e-02]mindexpander_qwen_v1:  37%|###6      | 1104/3000 [1:14:29<2:11:58,  4.18s/it, lr: 1.0e-04 loss: 1.795e-02]mindexpander_qwen_v1:  37%|###6      | 1105/3000 [1:14:29<2:25:49,  4.62s/it, lr: 1.0e-04 loss: 1.795e-02]mindexpander_qwen_v1:  37%|###6      | 1105/3000 [1:14:29<2:25:49,  4.62s/it, lr: 1.0e-04 loss: 1.795e-02]mindexpander_qwen_v1:  37%|###6      | 1105/3000 [1:14:33<2:25:49,  4.62s/it, lr: 1.0e-04 loss: 4.607e-02]mindexpander_qwen_v1:  37%|###6      | 1105/3000 [1:14:33<2:25:49,  4.62s/it, lr: 1.0e-04 loss: 4.607e-02]mindexpander_qwen_v1:  37%|###6      | 1106/3000 [1:14:33<2:19:25,  4.42s/it, lr: 1.0e-04 loss: 4.607e-02]mindexpander_qwen_v1:  37%|###6      | 1106/3000 [1:14:33<2:19:25,  4.42s/it, lr: 1.0e-04 loss: 4.607e-02]mindexpander_qwen_v1:  37%|###6      | 1106/3000 [1:14:35<2:19:25,  4.42s/it, lr: 1.0e-04 loss: 3.574e-02]mindexpander_qwen_v1:  37%|###6      | 1106/3000 [1:14:35<2:19:25,  4.42s/it, lr: 1.0e-04 loss: 3.574e-02]mindexpander_qwen_v1:  37%|###6      | 1107/3000 [1:14:35<2:01:23,  3.85s/it, lr: 1.0e-04 loss: 3.574e-02]mindexpander_qwen_v1:  37%|###6      | 1107/3000 [1:14:35<2:01:23,  3.85s/it, lr: 1.0e-04 loss: 3.574e-02]mindexpander_qwen_v1:  37%|###6      | 1107/3000 [1:14:39<2:01:23,  3.85s/it, lr: 1.0e-04 loss: 3.076e-02]mindexpander_qwen_v1:  37%|###6      | 1107/3000 [1:14:39<2:01:23,  3.85s/it, lr: 1.0e-04 loss: 3.076e-02]mindexpander_qwen_v1:  37%|###6      | 1108/3000 [1:14:39<2:00:21,  3.82s/it, lr: 1.0e-04 loss: 3.076e-02]mindexpander_qwen_v1:  37%|###6      | 1108/3000 [1:14:39<2:00:21,  3.82s/it, lr: 1.0e-04 loss: 3.076e-02]mindexpander_qwen_v1:  37%|###6      | 1108/3000 [1:14:42<2:00:21,  3.82s/it, lr: 1.0e-04 loss: 8.268e-02]mindexpander_qwen_v1:  37%|###6      | 1108/3000 [1:14:42<2:00:21,  3.82s/it, lr: 1.0e-04 loss: 8.268e-02]mindexpander_qwen_v1:  37%|###6      | 1109/3000 [1:14:42<1:47:34,  3.41s/it, lr: 1.0e-04 loss: 8.268e-02]mindexpander_qwen_v1:  37%|###6      | 1109/3000 [1:14:42<1:47:34,  3.41s/it, lr: 1.0e-04 loss: 8.268e-02]mindexpander_qwen_v1:  37%|###6      | 1109/3000 [1:14:48<1:47:34,  3.41s/it, lr: 1.0e-04 loss: 3.290e-02]mindexpander_qwen_v1:  37%|###6      | 1109/3000 [1:14:48<1:47:34,  3.41s/it, lr: 1.0e-04 loss: 3.290e-02]mindexpander_qwen_v1:  37%|###7      | 1110/3000 [1:14:52<1:47:31,  3.41s/it, lr: 1.0e-04 loss: 1.800e-01]mindexpander_qwen_v1:  37%|###7      | 1110/3000 [1:14:52<1:47:31,  3.41s/it, lr: 1.0e-04 loss: 1.800e-01]mindexpander_qwen_v1:  37%|###7      | 1111/3000 [1:14:52<1:25:13,  2.71s/it, lr: 1.0e-04 loss: 1.800e-01]mindexpander_qwen_v1:  37%|###7      | 1111/3000 [1:14:52<1:25:13,  2.71s/it, lr: 1.0e-04 loss: 1.800e-01]mindexpander_qwen_v1:  37%|###7      | 1111/3000 [1:14:57<1:25:13,  2.71s/it, lr: 1.0e-04 loss: 6.466e-02]mindexpander_qwen_v1:  37%|###7      | 1111/3000 [1:14:57<1:25:13,  2.71s/it, lr: 1.0e-04 loss: 6.466e-02]mindexpander_qwen_v1:  37%|###7      | 1112/3000 [1:14:57<1:48:47,  3.46s/it, lr: 1.0e-04 loss: 6.466e-02]mindexpander_qwen_v1:  37%|###7      | 1112/3000 [1:14:57<1:48:47,  3.46s/it, lr: 1.0e-04 loss: 6.466e-02]mindexpander_qwen_v1:  37%|###7      | 1112/3000 [1:15:00<1:48:47,  3.46s/it, lr: 1.0e-04 loss: 9.346e-02]mindexpander_qwen_v1:  37%|###7      | 1112/3000 [1:15:00<1:48:47,  3.46s/it, lr: 1.0e-04 loss: 9.346e-02]mindexpander_qwen_v1:  37%|###7      | 1113/3000 [1:15:00<1:40:33,  3.20s/it, lr: 1.0e-04 loss: 9.346e-02]mindexpander_qwen_v1:  37%|###7      | 1113/3000 [1:15:00<1:40:33,  3.20s/it, lr: 1.0e-04 loss: 9.346e-02]mindexpander_qwen_v1:  37%|###7      | 1113/3000 [1:15:02<1:40:33,  3.20s/it, lr: 1.0e-04 loss: 7.686e-03]mindexpander_qwen_v1:  37%|###7      | 1113/3000 [1:15:02<1:40:33,  3.20s/it, lr: 1.0e-04 loss: 7.686e-03]mindexpander_qwen_v1:  37%|###7      | 1114/3000 [1:15:02<1:34:08,  2.99s/it, lr: 1.0e-04 loss: 7.686e-03]mindexpander_qwen_v1:  37%|###7      | 1114/3000 [1:15:02<1:34:08,  2.99s/it, lr: 1.0e-04 loss: 7.686e-03]mindexpander_qwen_v1:  37%|###7      | 1114/3000 [1:15:08<1:34:08,  2.99s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  37%|###7      | 1114/3000 [1:15:08<1:34:08,  2.99s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  37%|###7      | 1115/3000 [1:15:08<1:59:22,  3.80s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  37%|###7      | 1115/3000 [1:15:08<1:59:22,  3.80s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  37%|###7      | 1115/3000 [1:15:11<1:59:22,  3.80s/it, lr: 1.0e-04 loss: 1.312e-01]mindexpander_qwen_v1:  37%|###7      | 1115/3000 [1:15:11<1:59:22,  3.80s/it, lr: 1.0e-04 loss: 1.312e-01]mindexpander_qwen_v1:  37%|###7      | 1116/3000 [1:15:11<1:47:12,  3.41s/it, lr: 1.0e-04 loss: 1.312e-01]mindexpander_qwen_v1:  37%|###7      | 1116/3000 [1:15:11<1:47:12,  3.41s/it, lr: 1.0e-04 loss: 1.312e-01]mindexpander_qwen_v1:  37%|###7      | 1116/3000 [1:15:13<1:47:12,  3.41s/it, lr: 1.0e-04 loss: 1.642e-01]mindexpander_qwen_v1:  37%|###7      | 1116/3000 [1:15:13<1:47:12,  3.41s/it, lr: 1.0e-04 loss: 1.642e-01]mindexpander_qwen_v1:  37%|###7      | 1117/3000 [1:15:13<1:38:24,  3.14s/it, lr: 1.0e-04 loss: 1.642e-01]mindexpander_qwen_v1:  37%|###7      | 1117/3000 [1:15:13<1:38:24,  3.14s/it, lr: 1.0e-04 loss: 1.642e-01]mindexpander_qwen_v1:  37%|###7      | 1117/3000 [1:15:19<1:38:24,  3.14s/it, lr: 1.0e-04 loss: 1.963e-02]mindexpander_qwen_v1:  37%|###7      | 1117/3000 [1:15:19<1:38:24,  3.14s/it, lr: 1.0e-04 loss: 1.963e-02]mindexpander_qwen_v1:  37%|###7      | 1118/3000 [1:15:19<2:03:40,  3.94s/it, lr: 1.0e-04 loss: 1.963e-02]mindexpander_qwen_v1:  37%|###7      | 1118/3000 [1:15:19<2:03:40,  3.94s/it, lr: 1.0e-04 loss: 1.963e-02]mindexpander_qwen_v1:  37%|###7      | 1118/3000 [1:15:23<2:03:40,  3.94s/it, lr: 1.0e-04 loss: 2.439e-02]mindexpander_qwen_v1:  37%|###7      | 1118/3000 [1:15:23<2:03:40,  3.94s/it, lr: 1.0e-04 loss: 2.439e-02]mindexpander_qwen_v1:  37%|###7      | 1119/3000 [1:15:23<2:01:43,  3.88s/it, lr: 1.0e-04 loss: 2.439e-02]mindexpander_qwen_v1:  37%|###7      | 1119/3000 [1:15:23<2:01:43,  3.88s/it, lr: 1.0e-04 loss: 2.439e-02]mindexpander_qwen_v1:  37%|###7      | 1119/3000 [1:15:25<2:01:43,  3.88s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:  37%|###7      | 1119/3000 [1:15:25<2:01:43,  3.88s/it, lr: 1.0e-04 loss: 1.850e-01]mindexpander_qwen_v1:  37%|###7      | 1120/3000 [1:15:28<2:01:39,  3.88s/it, lr: 1.0e-04 loss: 8.863e-02]mindexpander_qwen_v1:  37%|###7      | 1120/3000 [1:15:28<2:01:39,  3.88s/it, lr: 1.0e-04 loss: 8.863e-02]mindexpander_qwen_v1:  37%|###7      | 1121/3000 [1:15:28<1:23:31,  2.67s/it, lr: 1.0e-04 loss: 8.863e-02]mindexpander_qwen_v1:  37%|###7      | 1121/3000 [1:15:28<1:23:31,  2.67s/it, lr: 1.0e-04 loss: 8.863e-02]mindexpander_qwen_v1:  37%|###7      | 1121/3000 [1:15:30<1:23:31,  2.67s/it, lr: 1.0e-04 loss: 6.729e-02]mindexpander_qwen_v1:  37%|###7      | 1121/3000 [1:15:30<1:23:31,  2.67s/it, lr: 1.0e-04 loss: 6.729e-02]mindexpander_qwen_v1:  37%|###7      | 1122/3000 [1:15:30<1:23:25,  2.67s/it, lr: 1.0e-04 loss: 6.729e-02]mindexpander_qwen_v1:  37%|###7      | 1122/3000 [1:15:30<1:23:25,  2.67s/it, lr: 1.0e-04 loss: 6.729e-02]mindexpander_qwen_v1:  37%|###7      | 1122/3000 [1:15:34<1:23:25,  2.67s/it, lr: 1.0e-04 loss: 2.989e-02]mindexpander_qwen_v1:  37%|###7      | 1122/3000 [1:15:34<1:23:25,  2.67s/it, lr: 1.0e-04 loss: 2.989e-02]mindexpander_qwen_v1:  37%|###7      | 1123/3000 [1:15:34<1:32:05,  2.94s/it, lr: 1.0e-04 loss: 2.989e-02]mindexpander_qwen_v1:  37%|###7      | 1123/3000 [1:15:34<1:32:05,  2.94s/it, lr: 1.0e-04 loss: 2.989e-02]mindexpander_qwen_v1:  37%|###7      | 1123/3000 [1:15:40<1:32:05,  2.94s/it, lr: 1.0e-04 loss: 1.065e-01]mindexpander_qwen_v1:  37%|###7      | 1123/3000 [1:15:40<1:32:05,  2.94s/it, lr: 1.0e-04 loss: 1.065e-01]mindexpander_qwen_v1:  37%|###7      | 1124/3000 [1:15:40<1:55:51,  3.71s/it, lr: 1.0e-04 loss: 1.065e-01]mindexpander_qwen_v1:  37%|###7      | 1124/3000 [1:15:40<1:55:51,  3.71s/it, lr: 1.0e-04 loss: 1.065e-01]mindexpander_qwen_v1:  37%|###7      | 1124/3000 [1:15:43<1:55:51,  3.71s/it, lr: 1.0e-04 loss: 2.001e-02]mindexpander_qwen_v1:  37%|###7      | 1124/3000 [1:15:43<1:55:51,  3.71s/it, lr: 1.0e-04 loss: 2.001e-02]mindexpander_qwen_v1:  38%|###7      | 1125/3000 [1:15:43<1:56:03,  3.71s/it, lr: 1.0e-04 loss: 2.001e-02]mindexpander_qwen_v1:  38%|###7      | 1125/3000 [1:15:43<1:56:03,  3.71s/it, lr: 1.0e-04 loss: 2.001e-02]mindexpander_qwen_v1:  38%|###7      | 1125/3000 [1:15:46<1:56:03,  3.71s/it, lr: 1.0e-04 loss: 1.134e-02]mindexpander_qwen_v1:  38%|###7      | 1125/3000 [1:15:46<1:56:03,  3.71s/it, lr: 1.0e-04 loss: 1.134e-02]mindexpander_qwen_v1:  38%|###7      | 1126/3000 [1:15:46<1:44:42,  3.35s/it, lr: 1.0e-04 loss: 1.134e-02]mindexpander_qwen_v1:  38%|###7      | 1126/3000 [1:15:46<1:44:42,  3.35s/it, lr: 1.0e-04 loss: 1.134e-02]mindexpander_qwen_v1:  38%|###7      | 1126/3000 [1:15:50<1:44:42,  3.35s/it, lr: 1.0e-04 loss: 1.395e-01]mindexpander_qwen_v1:  38%|###7      | 1126/3000 [1:15:50<1:44:42,  3.35s/it, lr: 1.0e-04 loss: 1.395e-01]mindexpander_qwen_v1:  38%|###7      | 1127/3000 [1:15:50<1:49:43,  3.51s/it, lr: 1.0e-04 loss: 1.395e-01]mindexpander_qwen_v1:  38%|###7      | 1127/3000 [1:15:50<1:49:43,  3.51s/it, lr: 1.0e-04 loss: 1.395e-01]mindexpander_qwen_v1:  38%|###7      | 1127/3000 [1:15:54<1:49:43,  3.51s/it, lr: 1.0e-04 loss: 1.687e-02]mindexpander_qwen_v1:  38%|###7      | 1127/3000 [1:15:54<1:49:43,  3.51s/it, lr: 1.0e-04 loss: 1.687e-02]mindexpander_qwen_v1:  38%|###7      | 1128/3000 [1:15:54<1:51:41,  3.58s/it, lr: 1.0e-04 loss: 1.687e-02]mindexpander_qwen_v1:  38%|###7      | 1128/3000 [1:15:54<1:51:41,  3.58s/it, lr: 1.0e-04 loss: 1.687e-02]mindexpander_qwen_v1:  38%|###7      | 1128/3000 [1:15:59<1:51:41,  3.58s/it, lr: 1.0e-04 loss: 2.509e-02]mindexpander_qwen_v1:  38%|###7      | 1128/3000 [1:15:59<1:51:41,  3.58s/it, lr: 1.0e-04 loss: 2.509e-02]mindexpander_qwen_v1:  38%|###7      | 1129/3000 [1:15:59<2:11:36,  4.22s/it, lr: 1.0e-04 loss: 2.509e-02]mindexpander_qwen_v1:  38%|###7      | 1129/3000 [1:15:59<2:11:36,  4.22s/it, lr: 1.0e-04 loss: 2.509e-02]mindexpander_qwen_v1:  38%|###7      | 1129/3000 [1:16:03<2:11:36,  4.22s/it, lr: 1.0e-04 loss: 6.860e-02]mindexpander_qwen_v1:  38%|###7      | 1129/3000 [1:16:03<2:11:36,  4.22s/it, lr: 1.0e-04 loss: 6.860e-02]mindexpander_qwen_v1:  38%|###7      | 1130/3000 [1:16:09<2:11:32,  4.22s/it, lr: 1.0e-04 loss: 2.057e-02]mindexpander_qwen_v1:  38%|###7      | 1130/3000 [1:16:09<2:11:32,  4.22s/it, lr: 1.0e-04 loss: 2.057e-02]mindexpander_qwen_v1:  38%|###7      | 1131/3000 [1:16:09<1:52:17,  3.60s/it, lr: 1.0e-04 loss: 2.057e-02]mindexpander_qwen_v1:  38%|###7      | 1131/3000 [1:16:09<1:52:17,  3.60s/it, lr: 1.0e-04 loss: 2.057e-02]mindexpander_qwen_v1:  38%|###7      | 1131/3000 [1:16:15<1:52:17,  3.60s/it, lr: 1.0e-04 loss: 8.021e-02]mindexpander_qwen_v1:  38%|###7      | 1131/3000 [1:16:15<1:52:17,  3.60s/it, lr: 1.0e-04 loss: 8.021e-02]mindexpander_qwen_v1:  38%|###7      | 1132/3000 [1:16:15<2:08:43,  4.13s/it, lr: 1.0e-04 loss: 8.021e-02]mindexpander_qwen_v1:  38%|###7      | 1132/3000 [1:16:15<2:08:43,  4.13s/it, lr: 1.0e-04 loss: 8.021e-02]mindexpander_qwen_v1:  38%|###7      | 1132/3000 [1:16:19<2:08:43,  4.13s/it, lr: 1.0e-04 loss: 1.870e-02]mindexpander_qwen_v1:  38%|###7      | 1132/3000 [1:16:19<2:08:43,  4.13s/it, lr: 1.0e-04 loss: 1.870e-02]mindexpander_qwen_v1:  38%|###7      | 1133/3000 [1:16:19<2:05:24,  4.03s/it, lr: 1.0e-04 loss: 1.870e-02]mindexpander_qwen_v1:  38%|###7      | 1133/3000 [1:16:19<2:05:24,  4.03s/it, lr: 1.0e-04 loss: 1.870e-02]mindexpander_qwen_v1:  38%|###7      | 1133/3000 [1:16:24<2:05:24,  4.03s/it, lr: 1.0e-04 loss: 8.824e-02]mindexpander_qwen_v1:  38%|###7      | 1133/3000 [1:16:24<2:05:24,  4.03s/it, lr: 1.0e-04 loss: 8.824e-02]mindexpander_qwen_v1:  38%|###7      | 1134/3000 [1:16:24<2:21:01,  4.53s/it, lr: 1.0e-04 loss: 8.824e-02]mindexpander_qwen_v1:  38%|###7      | 1134/3000 [1:16:24<2:21:01,  4.53s/it, lr: 1.0e-04 loss: 8.824e-02]mindexpander_qwen_v1:  38%|###7      | 1134/3000 [1:16:27<2:21:01,  4.53s/it, lr: 1.0e-04 loss: 4.601e-02]mindexpander_qwen_v1:  38%|###7      | 1134/3000 [1:16:27<2:21:01,  4.53s/it, lr: 1.0e-04 loss: 4.601e-02]mindexpander_qwen_v1:  38%|###7      | 1135/3000 [1:16:27<2:02:50,  3.95s/it, lr: 1.0e-04 loss: 4.601e-02]mindexpander_qwen_v1:  38%|###7      | 1135/3000 [1:16:27<2:02:50,  3.95s/it, lr: 1.0e-04 loss: 4.601e-02]mindexpander_qwen_v1:  38%|###7      | 1135/3000 [1:16:31<2:02:50,  3.95s/it, lr: 1.0e-04 loss: 6.582e-03]mindexpander_qwen_v1:  38%|###7      | 1135/3000 [1:16:31<2:02:50,  3.95s/it, lr: 1.0e-04 loss: 6.582e-03]mindexpander_qwen_v1:  38%|###7      | 1136/3000 [1:16:31<2:00:53,  3.89s/it, lr: 1.0e-04 loss: 6.582e-03]mindexpander_qwen_v1:  38%|###7      | 1136/3000 [1:16:31<2:00:53,  3.89s/it, lr: 1.0e-04 loss: 6.582e-03]mindexpander_qwen_v1:  38%|###7      | 1136/3000 [1:16:34<2:00:53,  3.89s/it, lr: 1.0e-04 loss: 8.535e-02]mindexpander_qwen_v1:  38%|###7      | 1136/3000 [1:16:34<2:00:53,  3.89s/it, lr: 1.0e-04 loss: 8.535e-02]mindexpander_qwen_v1:  38%|###7      | 1137/3000 [1:16:34<1:59:25,  3.85s/it, lr: 1.0e-04 loss: 8.535e-02]mindexpander_qwen_v1:  38%|###7      | 1137/3000 [1:16:34<1:59:25,  3.85s/it, lr: 1.0e-04 loss: 8.535e-02]mindexpander_qwen_v1:  38%|###7      | 1137/3000 [1:16:37<1:59:25,  3.85s/it, lr: 1.0e-04 loss: 4.634e-02]mindexpander_qwen_v1:  38%|###7      | 1137/3000 [1:16:37<1:59:25,  3.85s/it, lr: 1.0e-04 loss: 4.634e-02]mindexpander_qwen_v1:  38%|###7      | 1138/3000 [1:16:37<1:48:34,  3.50s/it, lr: 1.0e-04 loss: 4.634e-02]mindexpander_qwen_v1:  38%|###7      | 1138/3000 [1:16:37<1:48:34,  3.50s/it, lr: 1.0e-04 loss: 4.634e-02]mindexpander_qwen_v1:  38%|###7      | 1138/3000 [1:16:43<1:48:34,  3.50s/it, lr: 1.0e-04 loss: 1.785e-01]mindexpander_qwen_v1:  38%|###7      | 1138/3000 [1:16:43<1:48:34,  3.50s/it, lr: 1.0e-04 loss: 1.785e-01]mindexpander_qwen_v1:  38%|###7      | 1139/3000 [1:16:43<2:09:06,  4.16s/it, lr: 1.0e-04 loss: 1.785e-01]mindexpander_qwen_v1:  38%|###7      | 1139/3000 [1:16:43<2:09:06,  4.16s/it, lr: 1.0e-04 loss: 1.785e-01]mindexpander_qwen_v1:  38%|###7      | 1139/3000 [1:16:47<2:09:06,  4.16s/it, lr: 1.0e-04 loss: 1.764e-01]mindexpander_qwen_v1:  38%|###7      | 1139/3000 [1:16:47<2:09:06,  4.16s/it, lr: 1.0e-04 loss: 1.764e-01]mindexpander_qwen_v1:  38%|###8      | 1140/3000 [1:16:53<2:09:02,  4.16s/it, lr: 1.0e-04 loss: 1.021e-01]mindexpander_qwen_v1:  38%|###8      | 1140/3000 [1:16:53<2:09:02,  4.16s/it, lr: 1.0e-04 loss: 1.021e-01]mindexpander_qwen_v1:  38%|###8      | 1141/3000 [1:16:53<1:50:50,  3.58s/it, lr: 1.0e-04 loss: 1.021e-01]mindexpander_qwen_v1:  38%|###8      | 1141/3000 [1:16:53<1:50:50,  3.58s/it, lr: 1.0e-04 loss: 1.021e-01]mindexpander_qwen_v1:  38%|###8      | 1141/3000 [1:16:59<1:50:50,  3.58s/it, lr: 1.0e-04 loss: 6.543e-02]mindexpander_qwen_v1:  38%|###8      | 1141/3000 [1:16:59<1:50:50,  3.58s/it, lr: 1.0e-04 loss: 6.543e-02]mindexpander_qwen_v1:  38%|###8      | 1142/3000 [1:16:59<2:09:00,  4.17s/it, lr: 1.0e-04 loss: 6.543e-02]mindexpander_qwen_v1:  38%|###8      | 1142/3000 [1:16:59<2:09:00,  4.17s/it, lr: 1.0e-04 loss: 6.543e-02]mindexpander_qwen_v1:  38%|###8      | 1142/3000 [1:17:01<2:09:00,  4.17s/it, lr: 1.0e-04 loss: 1.332e-01]mindexpander_qwen_v1:  38%|###8      | 1142/3000 [1:17:01<2:09:00,  4.17s/it, lr: 1.0e-04 loss: 1.332e-01]mindexpander_qwen_v1:  38%|###8      | 1143/3000 [1:17:01<1:55:20,  3.73s/it, lr: 1.0e-04 loss: 1.332e-01]mindexpander_qwen_v1:  38%|###8      | 1143/3000 [1:17:01<1:55:20,  3.73s/it, lr: 1.0e-04 loss: 1.332e-01]mindexpander_qwen_v1:  38%|###8      | 1143/3000 [1:17:05<1:55:20,  3.73s/it, lr: 1.0e-04 loss: 1.536e-01]mindexpander_qwen_v1:  38%|###8      | 1143/3000 [1:17:05<1:55:20,  3.73s/it, lr: 1.0e-04 loss: 1.536e-01]mindexpander_qwen_v1:  38%|###8      | 1144/3000 [1:17:05<1:55:20,  3.73s/it, lr: 1.0e-04 loss: 1.536e-01]mindexpander_qwen_v1:  38%|###8      | 1144/3000 [1:17:05<1:55:20,  3.73s/it, lr: 1.0e-04 loss: 1.536e-01]mindexpander_qwen_v1:  38%|###8      | 1144/3000 [1:17:08<1:55:20,  3.73s/it, lr: 1.0e-04 loss: 1.826e-01]mindexpander_qwen_v1:  38%|###8      | 1144/3000 [1:17:08<1:55:20,  3.73s/it, lr: 1.0e-04 loss: 1.826e-01]mindexpander_qwen_v1:  38%|###8      | 1145/3000 [1:17:08<1:55:26,  3.73s/it, lr: 1.0e-04 loss: 1.826e-01]mindexpander_qwen_v1:  38%|###8      | 1145/3000 [1:17:08<1:55:26,  3.73s/it, lr: 1.0e-04 loss: 1.826e-01]mindexpander_qwen_v1:  38%|###8      | 1145/3000 [1:17:12<1:55:26,  3.73s/it, lr: 1.0e-04 loss: 1.176e-02]mindexpander_qwen_v1:  38%|###8      | 1145/3000 [1:17:12<1:55:26,  3.73s/it, lr: 1.0e-04 loss: 1.176e-02]mindexpander_qwen_v1:  38%|###8      | 1146/3000 [1:17:12<1:56:52,  3.78s/it, lr: 1.0e-04 loss: 1.176e-02]mindexpander_qwen_v1:  38%|###8      | 1146/3000 [1:17:12<1:56:52,  3.78s/it, lr: 1.0e-04 loss: 1.176e-02]mindexpander_qwen_v1:  38%|###8      | 1146/3000 [1:17:16<1:56:52,  3.78s/it, lr: 1.0e-04 loss: 1.713e-01]mindexpander_qwen_v1:  38%|###8      | 1146/3000 [1:17:16<1:56:52,  3.78s/it, lr: 1.0e-04 loss: 1.713e-01]mindexpander_qwen_v1:  38%|###8      | 1147/3000 [1:17:16<1:56:23,  3.77s/it, lr: 1.0e-04 loss: 1.713e-01]mindexpander_qwen_v1:  38%|###8      | 1147/3000 [1:17:16<1:56:23,  3.77s/it, lr: 1.0e-04 loss: 1.713e-01]mindexpander_qwen_v1:  38%|###8      | 1147/3000 [1:17:22<1:56:23,  3.77s/it, lr: 1.0e-04 loss: 5.910e-02]mindexpander_qwen_v1:  38%|###8      | 1147/3000 [1:17:22<1:56:23,  3.77s/it, lr: 1.0e-04 loss: 5.910e-02]mindexpander_qwen_v1:  38%|###8      | 1148/3000 [1:17:22<2:14:11,  4.35s/it, lr: 1.0e-04 loss: 5.910e-02]mindexpander_qwen_v1:  38%|###8      | 1148/3000 [1:17:22<2:14:11,  4.35s/it, lr: 1.0e-04 loss: 5.910e-02]mindexpander_qwen_v1:  38%|###8      | 1148/3000 [1:17:26<2:14:11,  4.35s/it, lr: 1.0e-04 loss: 9.283e-02]mindexpander_qwen_v1:  38%|###8      | 1148/3000 [1:17:26<2:14:11,  4.35s/it, lr: 1.0e-04 loss: 9.283e-02]mindexpander_qwen_v1:  38%|###8      | 1149/3000 [1:17:26<2:08:33,  4.17s/it, lr: 1.0e-04 loss: 9.283e-02]mindexpander_qwen_v1:  38%|###8      | 1149/3000 [1:17:26<2:08:33,  4.17s/it, lr: 1.0e-04 loss: 9.283e-02]mindexpander_qwen_v1:  38%|###8      | 1149/3000 [1:17:28<2:08:33,  4.17s/it, lr: 1.0e-04 loss: 1.507e-01]mindexpander_qwen_v1:  38%|###8      | 1149/3000 [1:17:28<2:08:33,  4.17s/it, lr: 1.0e-04 loss: 1.507e-01]mindexpander_qwen_v1:  38%|###8      | 1150/3000 [1:17:32<2:08:29,  4.17s/it, lr: 1.0e-04 loss: 1.341e-01]mindexpander_qwen_v1:  38%|###8      | 1150/3000 [1:17:32<2:08:29,  4.17s/it, lr: 1.0e-04 loss: 1.341e-01]mindexpander_qwen_v1:  38%|###8      | 1151/3000 [1:17:32<1:36:01,  3.12s/it, lr: 1.0e-04 loss: 1.341e-01]mindexpander_qwen_v1:  38%|###8      | 1151/3000 [1:17:32<1:36:01,  3.12s/it, lr: 1.0e-04 loss: 1.341e-01]mindexpander_qwen_v1:  38%|###8      | 1151/3000 [1:17:38<1:36:01,  3.12s/it, lr: 1.0e-04 loss: 1.540e-01]mindexpander_qwen_v1:  38%|###8      | 1151/3000 [1:17:38<1:36:01,  3.12s/it, lr: 1.0e-04 loss: 1.540e-01]mindexpander_qwen_v1:  38%|###8      | 1152/3000 [1:17:38<1:55:57,  3.76s/it, lr: 1.0e-04 loss: 1.540e-01]mindexpander_qwen_v1:  38%|###8      | 1152/3000 [1:17:38<1:55:57,  3.76s/it, lr: 1.0e-04 loss: 1.540e-01]mindexpander_qwen_v1:  38%|###8      | 1152/3000 [1:17:40<1:55:57,  3.76s/it, lr: 1.0e-04 loss: 3.048e-02]mindexpander_qwen_v1:  38%|###8      | 1152/3000 [1:17:40<1:55:57,  3.76s/it, lr: 1.0e-04 loss: 3.048e-02]mindexpander_qwen_v1:  38%|###8      | 1153/3000 [1:17:40<1:45:23,  3.42s/it, lr: 1.0e-04 loss: 3.048e-02]mindexpander_qwen_v1:  38%|###8      | 1153/3000 [1:17:40<1:45:23,  3.42s/it, lr: 1.0e-04 loss: 3.048e-02]mindexpander_qwen_v1:  38%|###8      | 1153/3000 [1:17:46<1:45:23,  3.42s/it, lr: 1.0e-04 loss: 1.046e-01]mindexpander_qwen_v1:  38%|###8      | 1153/3000 [1:17:46<1:45:23,  3.42s/it, lr: 1.0e-04 loss: 1.046e-01]mindexpander_qwen_v1:  38%|###8      | 1154/3000 [1:17:46<2:06:08,  4.10s/it, lr: 1.0e-04 loss: 1.046e-01]mindexpander_qwen_v1:  38%|###8      | 1154/3000 [1:17:46<2:06:08,  4.10s/it, lr: 1.0e-04 loss: 1.046e-01]mindexpander_qwen_v1:  38%|###8      | 1154/3000 [1:17:52<2:06:08,  4.10s/it, lr: 1.0e-04 loss: 2.993e-03]mindexpander_qwen_v1:  38%|###8      | 1154/3000 [1:17:52<2:06:08,  4.10s/it, lr: 1.0e-04 loss: 2.993e-03]mindexpander_qwen_v1:  38%|###8      | 1155/3000 [1:17:52<2:20:09,  4.56s/it, lr: 1.0e-04 loss: 2.993e-03]mindexpander_qwen_v1:  38%|###8      | 1155/3000 [1:17:52<2:20:09,  4.56s/it, lr: 1.0e-04 loss: 2.993e-03]mindexpander_qwen_v1:  38%|###8      | 1155/3000 [1:17:54<2:20:09,  4.56s/it, lr: 1.0e-04 loss: 1.787e-01]mindexpander_qwen_v1:  38%|###8      | 1155/3000 [1:17:54<2:20:09,  4.56s/it, lr: 1.0e-04 loss: 1.787e-01]mindexpander_qwen_v1:  39%|###8      | 1156/3000 [1:17:54<2:01:41,  3.96s/it, lr: 1.0e-04 loss: 1.787e-01]mindexpander_qwen_v1:  39%|###8      | 1156/3000 [1:17:54<2:01:41,  3.96s/it, lr: 1.0e-04 loss: 1.787e-01]mindexpander_qwen_v1:  39%|###8      | 1156/3000 [1:17:57<2:01:41,  3.96s/it, lr: 1.0e-04 loss: 1.594e-01]mindexpander_qwen_v1:  39%|###8      | 1156/3000 [1:17:57<2:01:41,  3.96s/it, lr: 1.0e-04 loss: 1.594e-01]mindexpander_qwen_v1:  39%|###8      | 1157/3000 [1:17:57<1:48:17,  3.53s/it, lr: 1.0e-04 loss: 1.594e-01]mindexpander_qwen_v1:  39%|###8      | 1157/3000 [1:17:57<1:48:17,  3.53s/it, lr: 1.0e-04 loss: 1.594e-01]mindexpander_qwen_v1:  39%|###8      | 1157/3000 [1:17:59<1:48:17,  3.53s/it, lr: 1.0e-04 loss: 2.656e-02]mindexpander_qwen_v1:  39%|###8      | 1157/3000 [1:17:59<1:48:17,  3.53s/it, lr: 1.0e-04 loss: 2.656e-02]mindexpander_qwen_v1:  39%|###8      | 1158/3000 [1:17:59<1:40:29,  3.27s/it, lr: 1.0e-04 loss: 2.656e-02]mindexpander_qwen_v1:  39%|###8      | 1158/3000 [1:17:59<1:40:29,  3.27s/it, lr: 1.0e-04 loss: 2.656e-02]mindexpander_qwen_v1:  39%|###8      | 1158/3000 [1:18:05<1:40:29,  3.27s/it, lr: 1.0e-04 loss: 1.964e-02]mindexpander_qwen_v1:  39%|###8      | 1158/3000 [1:18:05<1:40:29,  3.27s/it, lr: 1.0e-04 loss: 1.964e-02]mindexpander_qwen_v1:  39%|###8      | 1159/3000 [1:18:05<2:02:52,  4.00s/it, lr: 1.0e-04 loss: 1.964e-02]mindexpander_qwen_v1:  39%|###8      | 1159/3000 [1:18:05<2:02:52,  4.00s/it, lr: 1.0e-04 loss: 1.964e-02]mindexpander_qwen_v1:  39%|###8      | 1159/3000 [1:18:09<2:02:52,  4.00s/it, lr: 1.0e-04 loss: 1.760e-01]mindexpander_qwen_v1:  39%|###8      | 1159/3000 [1:18:09<2:02:52,  4.00s/it, lr: 1.0e-04 loss: 1.760e-01]mindexpander_qwen_v1:  39%|###8      | 1160/3000 [1:18:15<2:02:48,  4.00s/it, lr: 1.0e-04 loss: 5.560e-02]mindexpander_qwen_v1:  39%|###8      | 1160/3000 [1:18:15<2:02:48,  4.00s/it, lr: 1.0e-04 loss: 5.560e-02]mindexpander_qwen_v1:  39%|###8      | 1161/3000 [1:18:15<1:46:52,  3.49s/it, lr: 1.0e-04 loss: 5.560e-02]mindexpander_qwen_v1:  39%|###8      | 1161/3000 [1:18:15<1:46:52,  3.49s/it, lr: 1.0e-04 loss: 5.560e-02]mindexpander_qwen_v1:  39%|###8      | 1161/3000 [1:18:19<1:46:52,  3.49s/it, lr: 1.0e-04 loss: 3.424e-02]mindexpander_qwen_v1:  39%|###8      | 1161/3000 [1:18:19<1:46:52,  3.49s/it, lr: 1.0e-04 loss: 3.424e-02]mindexpander_qwen_v1:  39%|###8      | 1162/3000 [1:18:19<1:50:05,  3.59s/it, lr: 1.0e-04 loss: 3.424e-02]mindexpander_qwen_v1:  39%|###8      | 1162/3000 [1:18:19<1:50:05,  3.59s/it, lr: 1.0e-04 loss: 3.424e-02]mindexpander_qwen_v1:  39%|###8      | 1162/3000 [1:18:24<1:50:05,  3.59s/it, lr: 1.0e-04 loss: 6.392e-02]mindexpander_qwen_v1:  39%|###8      | 1162/3000 [1:18:24<1:50:05,  3.59s/it, lr: 1.0e-04 loss: 6.392e-02]mindexpander_qwen_v1:  39%|###8      | 1163/3000 [1:18:24<2:07:23,  4.16s/it, lr: 1.0e-04 loss: 6.392e-02]mindexpander_qwen_v1:  39%|###8      | 1163/3000 [1:18:24<2:07:23,  4.16s/it, lr: 1.0e-04 loss: 6.392e-02]mindexpander_qwen_v1:  39%|###8      | 1163/3000 [1:18:28<2:07:23,  4.16s/it, lr: 1.0e-04 loss: 1.360e-01]mindexpander_qwen_v1:  39%|###8      | 1163/3000 [1:18:28<2:07:23,  4.16s/it, lr: 1.0e-04 loss: 1.360e-01]mindexpander_qwen_v1:  39%|###8      | 1164/3000 [1:18:28<2:03:49,  4.05s/it, lr: 1.0e-04 loss: 1.360e-01]mindexpander_qwen_v1:  39%|###8      | 1164/3000 [1:18:28<2:03:49,  4.05s/it, lr: 1.0e-04 loss: 1.360e-01]mindexpander_qwen_v1:  39%|###8      | 1164/3000 [1:18:31<2:03:49,  4.05s/it, lr: 1.0e-04 loss: 2.583e-02]mindexpander_qwen_v1:  39%|###8      | 1164/3000 [1:18:31<2:03:49,  4.05s/it, lr: 1.0e-04 loss: 2.583e-02]mindexpander_qwen_v1:  39%|###8      | 1165/3000 [1:18:31<1:50:10,  3.60s/it, lr: 1.0e-04 loss: 2.583e-02]mindexpander_qwen_v1:  39%|###8      | 1165/3000 [1:18:31<1:50:10,  3.60s/it, lr: 1.0e-04 loss: 2.583e-02]mindexpander_qwen_v1:  39%|###8      | 1165/3000 [1:18:33<1:50:10,  3.60s/it, lr: 1.0e-04 loss: 1.757e-01]mindexpander_qwen_v1:  39%|###8      | 1165/3000 [1:18:33<1:50:10,  3.60s/it, lr: 1.0e-04 loss: 1.757e-01]mindexpander_qwen_v1:  39%|###8      | 1166/3000 [1:18:33<1:41:57,  3.34s/it, lr: 1.0e-04 loss: 1.757e-01]mindexpander_qwen_v1:  39%|###8      | 1166/3000 [1:18:33<1:41:57,  3.34s/it, lr: 1.0e-04 loss: 1.757e-01]mindexpander_qwen_v1:  39%|###8      | 1166/3000 [1:18:36<1:41:57,  3.34s/it, lr: 1.0e-04 loss: 5.200e-02]mindexpander_qwen_v1:  39%|###8      | 1166/3000 [1:18:36<1:41:57,  3.34s/it, lr: 1.0e-04 loss: 5.200e-02]mindexpander_qwen_v1:  39%|###8      | 1167/3000 [1:18:36<1:34:05,  3.08s/it, lr: 1.0e-04 loss: 5.200e-02]mindexpander_qwen_v1:  39%|###8      | 1167/3000 [1:18:36<1:34:05,  3.08s/it, lr: 1.0e-04 loss: 5.200e-02]mindexpander_qwen_v1:  39%|###8      | 1167/3000 [1:18:41<1:34:05,  3.08s/it, lr: 1.0e-04 loss: 4.759e-02]mindexpander_qwen_v1:  39%|###8      | 1167/3000 [1:18:41<1:34:05,  3.08s/it, lr: 1.0e-04 loss: 4.759e-02]mindexpander_qwen_v1:  39%|###8      | 1168/3000 [1:18:41<1:57:56,  3.86s/it, lr: 1.0e-04 loss: 4.759e-02]mindexpander_qwen_v1:  39%|###8      | 1168/3000 [1:18:41<1:57:56,  3.86s/it, lr: 1.0e-04 loss: 4.759e-02]mindexpander_qwen_v1:  39%|###8      | 1168/3000 [1:18:44<1:57:56,  3.86s/it, lr: 1.0e-04 loss: 5.311e-02]mindexpander_qwen_v1:  39%|###8      | 1168/3000 [1:18:44<1:57:56,  3.86s/it, lr: 1.0e-04 loss: 5.311e-02]mindexpander_qwen_v1:  39%|###8      | 1169/3000 [1:18:44<1:45:08,  3.45s/it, lr: 1.0e-04 loss: 5.311e-02]mindexpander_qwen_v1:  39%|###8      | 1169/3000 [1:18:44<1:45:08,  3.45s/it, lr: 1.0e-04 loss: 5.311e-02]mindexpander_qwen_v1:  39%|###8      | 1169/3000 [1:18:48<1:45:08,  3.45s/it, lr: 1.0e-04 loss: 7.636e-02]mindexpander_qwen_v1:  39%|###8      | 1169/3000 [1:18:48<1:45:08,  3.45s/it, lr: 1.0e-04 loss: 7.636e-02]mindexpander_qwen_v1:  39%|###9      | 1170/3000 [1:18:52<1:45:05,  3.45s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  39%|###9      | 1170/3000 [1:18:52<1:45:05,  3.45s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  39%|###9      | 1171/3000 [1:18:52<1:23:04,  2.73s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  39%|###9      | 1171/3000 [1:18:52<1:23:04,  2.73s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  39%|###9      | 1171/3000 [1:18:54<1:23:04,  2.73s/it, lr: 1.0e-04 loss: 1.459e-01]mindexpander_qwen_v1:  39%|###9      | 1171/3000 [1:18:54<1:23:04,  2.73s/it, lr: 1.0e-04 loss: 1.459e-01]mindexpander_qwen_v1:  39%|###9      | 1172/3000 [1:18:54<1:20:59,  2.66s/it, lr: 1.0e-04 loss: 1.459e-01]mindexpander_qwen_v1:  39%|###9      | 1172/3000 [1:18:54<1:20:59,  2.66s/it, lr: 1.0e-04 loss: 1.459e-01]mindexpander_qwen_v1:  39%|###9      | 1172/3000 [1:18:57<1:20:59,  2.66s/it, lr: 1.0e-04 loss: 1.791e-01]mindexpander_qwen_v1:  39%|###9      | 1172/3000 [1:18:57<1:20:59,  2.66s/it, lr: 1.0e-04 loss: 1.791e-01]mindexpander_qwen_v1:  39%|###9      | 1173/3000 [1:18:57<1:19:16,  2.60s/it, lr: 1.0e-04 loss: 1.791e-01]mindexpander_qwen_v1:  39%|###9      | 1173/3000 [1:18:57<1:19:16,  2.60s/it, lr: 1.0e-04 loss: 1.791e-01]mindexpander_qwen_v1:  39%|###9      | 1173/3000 [1:19:01<1:19:16,  2.60s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  39%|###9      | 1173/3000 [1:19:01<1:19:16,  2.60s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  39%|###9      | 1174/3000 [1:19:01<1:30:08,  2.96s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  39%|###9      | 1174/3000 [1:19:01<1:30:08,  2.96s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  39%|###9      | 1174/3000 [1:19:03<1:30:08,  2.96s/it, lr: 1.0e-04 loss: 3.236e-02]mindexpander_qwen_v1:  39%|###9      | 1174/3000 [1:19:03<1:30:08,  2.96s/it, lr: 1.0e-04 loss: 3.236e-02]mindexpander_qwen_v1:  39%|###9      | 1175/3000 [1:19:03<1:25:44,  2.82s/it, lr: 1.0e-04 loss: 3.236e-02]mindexpander_qwen_v1:  39%|###9      | 1175/3000 [1:19:03<1:25:44,  2.82s/it, lr: 1.0e-04 loss: 3.236e-02]mindexpander_qwen_v1:  39%|###9      | 1175/3000 [1:19:09<1:25:44,  2.82s/it, lr: 1.0e-04 loss: 1.146e-02]mindexpander_qwen_v1:  39%|###9      | 1175/3000 [1:19:09<1:25:44,  2.82s/it, lr: 1.0e-04 loss: 1.146e-02]mindexpander_qwen_v1:  39%|###9      | 1176/3000 [1:19:09<1:51:11,  3.66s/it, lr: 1.0e-04 loss: 1.146e-02]mindexpander_qwen_v1:  39%|###9      | 1176/3000 [1:19:09<1:51:11,  3.66s/it, lr: 1.0e-04 loss: 1.146e-02]mindexpander_qwen_v1:  39%|###9      | 1176/3000 [1:19:11<1:51:11,  3.66s/it, lr: 1.0e-04 loss: 3.104e-04]mindexpander_qwen_v1:  39%|###9      | 1176/3000 [1:19:11<1:51:11,  3.66s/it, lr: 1.0e-04 loss: 3.104e-04]mindexpander_qwen_v1:  39%|###9      | 1177/3000 [1:19:11<1:40:28,  3.31s/it, lr: 1.0e-04 loss: 3.104e-04]mindexpander_qwen_v1:  39%|###9      | 1177/3000 [1:19:11<1:40:28,  3.31s/it, lr: 1.0e-04 loss: 3.104e-04]mindexpander_qwen_v1:  39%|###9      | 1177/3000 [1:19:14<1:40:28,  3.31s/it, lr: 1.0e-04 loss: 2.904e-02]mindexpander_qwen_v1:  39%|###9      | 1177/3000 [1:19:14<1:40:28,  3.31s/it, lr: 1.0e-04 loss: 2.904e-02]mindexpander_qwen_v1:  39%|###9      | 1178/3000 [1:19:14<1:34:38,  3.12s/it, lr: 1.0e-04 loss: 2.904e-02]mindexpander_qwen_v1:  39%|###9      | 1178/3000 [1:19:14<1:34:38,  3.12s/it, lr: 1.0e-04 loss: 2.904e-02]mindexpander_qwen_v1:  39%|###9      | 1178/3000 [1:19:17<1:34:38,  3.12s/it, lr: 1.0e-04 loss: 1.610e-01]mindexpander_qwen_v1:  39%|###9      | 1178/3000 [1:19:17<1:34:38,  3.12s/it, lr: 1.0e-04 loss: 1.610e-01]mindexpander_qwen_v1:  39%|###9      | 1179/3000 [1:19:17<1:28:36,  2.92s/it, lr: 1.0e-04 loss: 1.610e-01]mindexpander_qwen_v1:  39%|###9      | 1179/3000 [1:19:17<1:28:36,  2.92s/it, lr: 1.0e-04 loss: 1.610e-01]mindexpander_qwen_v1:  39%|###9      | 1179/3000 [1:19:20<1:28:36,  2.92s/it, lr: 1.0e-04 loss: 1.874e-01]mindexpander_qwen_v1:  39%|###9      | 1179/3000 [1:19:20<1:28:36,  2.92s/it, lr: 1.0e-04 loss: 1.874e-01]mindexpander_qwen_v1:  39%|###9      | 1180/3000 [1:19:26<1:28:33,  2.92s/it, lr: 1.0e-04 loss: 8.613e-02]mindexpander_qwen_v1:  39%|###9      | 1180/3000 [1:19:26<1:28:33,  2.92s/it, lr: 1.0e-04 loss: 8.613e-02]mindexpander_qwen_v1:  39%|###9      | 1181/3000 [1:19:26<1:27:53,  2.90s/it, lr: 1.0e-04 loss: 8.613e-02]mindexpander_qwen_v1:  39%|###9      | 1181/3000 [1:19:26<1:27:53,  2.90s/it, lr: 1.0e-04 loss: 8.613e-02]mindexpander_qwen_v1:  39%|###9      | 1181/3000 [1:19:32<1:27:53,  2.90s/it, lr: 1.0e-04 loss: 5.469e-02]mindexpander_qwen_v1:  39%|###9      | 1181/3000 [1:19:32<1:27:53,  2.90s/it, lr: 1.0e-04 loss: 5.469e-02]mindexpander_qwen_v1:  39%|###9      | 1182/3000 [1:19:32<1:50:12,  3.64s/it, lr: 1.0e-04 loss: 5.469e-02]mindexpander_qwen_v1:  39%|###9      | 1182/3000 [1:19:32<1:50:12,  3.64s/it, lr: 1.0e-04 loss: 5.469e-02]mindexpander_qwen_v1:  39%|###9      | 1182/3000 [1:19:38<1:50:12,  3.64s/it, lr: 1.0e-04 loss: 5.979e-02]mindexpander_qwen_v1:  39%|###9      | 1182/3000 [1:19:38<1:50:12,  3.64s/it, lr: 1.0e-04 loss: 5.979e-02]mindexpander_qwen_v1:  39%|###9      | 1183/3000 [1:19:38<2:06:56,  4.19s/it, lr: 1.0e-04 loss: 5.979e-02]mindexpander_qwen_v1:  39%|###9      | 1183/3000 [1:19:38<2:06:56,  4.19s/it, lr: 1.0e-04 loss: 5.979e-02]mindexpander_qwen_v1:  39%|###9      | 1183/3000 [1:19:40<2:06:56,  4.19s/it, lr: 1.0e-04 loss: 7.684e-03]mindexpander_qwen_v1:  39%|###9      | 1183/3000 [1:19:40<2:06:56,  4.19s/it, lr: 1.0e-04 loss: 7.684e-03]mindexpander_qwen_v1:  39%|###9      | 1184/3000 [1:19:40<1:52:41,  3.72s/it, lr: 1.0e-04 loss: 7.684e-03]mindexpander_qwen_v1:  39%|###9      | 1184/3000 [1:19:40<1:52:41,  3.72s/it, lr: 1.0e-04 loss: 7.684e-03]mindexpander_qwen_v1:  39%|###9      | 1184/3000 [1:19:46<1:52:41,  3.72s/it, lr: 1.0e-04 loss: 7.996e-03]mindexpander_qwen_v1:  39%|###9      | 1184/3000 [1:19:46<1:52:41,  3.72s/it, lr: 1.0e-04 loss: 7.996e-03]mindexpander_qwen_v1:  40%|###9      | 1185/3000 [1:19:46<2:09:43,  4.29s/it, lr: 1.0e-04 loss: 7.996e-03]mindexpander_qwen_v1:  40%|###9      | 1185/3000 [1:19:46<2:09:43,  4.29s/it, lr: 1.0e-04 loss: 7.996e-03]mindexpander_qwen_v1:  40%|###9      | 1185/3000 [1:19:49<2:09:43,  4.29s/it, lr: 1.0e-04 loss: 1.702e-01]mindexpander_qwen_v1:  40%|###9      | 1185/3000 [1:19:49<2:09:43,  4.29s/it, lr: 1.0e-04 loss: 1.702e-01]mindexpander_qwen_v1:  40%|###9      | 1186/3000 [1:19:49<1:55:44,  3.83s/it, lr: 1.0e-04 loss: 1.702e-01]mindexpander_qwen_v1:  40%|###9      | 1186/3000 [1:19:49<1:55:44,  3.83s/it, lr: 1.0e-04 loss: 1.702e-01]mindexpander_qwen_v1:  40%|###9      | 1186/3000 [1:19:52<1:55:44,  3.83s/it, lr: 1.0e-04 loss: 5.606e-02]mindexpander_qwen_v1:  40%|###9      | 1186/3000 [1:19:52<1:55:44,  3.83s/it, lr: 1.0e-04 loss: 5.606e-02]mindexpander_qwen_v1:  40%|###9      | 1187/3000 [1:19:52<1:54:54,  3.80s/it, lr: 1.0e-04 loss: 5.606e-02]mindexpander_qwen_v1:  40%|###9      | 1187/3000 [1:19:52<1:54:54,  3.80s/it, lr: 1.0e-04 loss: 5.606e-02]mindexpander_qwen_v1:  40%|###9      | 1187/3000 [1:19:58<1:54:54,  3.80s/it, lr: 1.0e-04 loss: 1.265e-01]mindexpander_qwen_v1:  40%|###9      | 1187/3000 [1:19:58<1:54:54,  3.80s/it, lr: 1.0e-04 loss: 1.265e-01]mindexpander_qwen_v1:  40%|###9      | 1188/3000 [1:19:58<2:12:04,  4.37s/it, lr: 1.0e-04 loss: 1.265e-01]mindexpander_qwen_v1:  40%|###9      | 1188/3000 [1:19:58<2:12:04,  4.37s/it, lr: 1.0e-04 loss: 1.265e-01]mindexpander_qwen_v1:  40%|###9      | 1188/3000 [1:20:02<2:12:04,  4.37s/it, lr: 1.0e-04 loss: 3.705e-02]mindexpander_qwen_v1:  40%|###9      | 1188/3000 [1:20:02<2:12:04,  4.37s/it, lr: 1.0e-04 loss: 3.705e-02]mindexpander_qwen_v1:  40%|###9      | 1189/3000 [1:20:02<2:06:21,  4.19s/it, lr: 1.0e-04 loss: 3.705e-02]mindexpander_qwen_v1:  40%|###9      | 1189/3000 [1:20:02<2:06:21,  4.19s/it, lr: 1.0e-04 loss: 3.705e-02]mindexpander_qwen_v1:  40%|###9      | 1189/3000 [1:20:08<2:06:21,  4.19s/it, lr: 1.0e-04 loss: 1.178e-01]mindexpander_qwen_v1:  40%|###9      | 1189/3000 [1:20:08<2:06:21,  4.19s/it, lr: 1.0e-04 loss: 1.178e-01]mindexpander_qwen_v1:  40%|###9      | 1190/3000 [1:20:11<2:06:16,  4.19s/it, lr: 1.0e-04 loss: 1.160e-01]mindexpander_qwen_v1:  40%|###9      | 1190/3000 [1:20:11<2:06:16,  4.19s/it, lr: 1.0e-04 loss: 1.160e-01]mindexpander_qwen_v1:  40%|###9      | 1191/3000 [1:20:11<1:34:17,  3.13s/it, lr: 1.0e-04 loss: 1.160e-01]mindexpander_qwen_v1:  40%|###9      | 1191/3000 [1:20:11<1:34:17,  3.13s/it, lr: 1.0e-04 loss: 1.160e-01]mindexpander_qwen_v1:  40%|###9      | 1191/3000 [1:20:15<1:34:17,  3.13s/it, lr: 1.0e-04 loss: 2.207e-02]mindexpander_qwen_v1:  40%|###9      | 1191/3000 [1:20:15<1:34:17,  3.13s/it, lr: 1.0e-04 loss: 2.207e-02]mindexpander_qwen_v1:  40%|###9      | 1192/3000 [1:20:15<1:38:46,  3.28s/it, lr: 1.0e-04 loss: 2.207e-02]mindexpander_qwen_v1:  40%|###9      | 1192/3000 [1:20:15<1:38:46,  3.28s/it, lr: 1.0e-04 loss: 2.207e-02]mindexpander_qwen_v1:  40%|###9      | 1192/3000 [1:20:18<1:38:46,  3.28s/it, lr: 1.0e-04 loss: 1.076e-01]mindexpander_qwen_v1:  40%|###9      | 1192/3000 [1:20:18<1:38:46,  3.28s/it, lr: 1.0e-04 loss: 1.076e-01]mindexpander_qwen_v1:  40%|###9      | 1193/3000 [1:20:18<1:32:13,  3.06s/it, lr: 1.0e-04 loss: 1.076e-01]mindexpander_qwen_v1:  40%|###9      | 1193/3000 [1:20:18<1:32:13,  3.06s/it, lr: 1.0e-04 loss: 1.076e-01]mindexpander_qwen_v1:  40%|###9      | 1193/3000 [1:20:20<1:32:13,  3.06s/it, lr: 1.0e-04 loss: 2.021e-01]mindexpander_qwen_v1:  40%|###9      | 1193/3000 [1:20:20<1:32:13,  3.06s/it, lr: 1.0e-04 loss: 2.021e-01]mindexpander_qwen_v1:  40%|###9      | 1194/3000 [1:20:20<1:28:50,  2.95s/it, lr: 1.0e-04 loss: 2.021e-01]mindexpander_qwen_v1:  40%|###9      | 1194/3000 [1:20:20<1:28:50,  2.95s/it, lr: 1.0e-04 loss: 2.021e-01]mindexpander_qwen_v1:  40%|###9      | 1194/3000 [1:20:26<1:28:50,  2.95s/it, lr: 1.0e-04 loss: 1.357e-01]mindexpander_qwen_v1:  40%|###9      | 1194/3000 [1:20:26<1:28:50,  2.95s/it, lr: 1.0e-04 loss: 1.357e-01]mindexpander_qwen_v1:  40%|###9      | 1195/3000 [1:20:26<1:53:35,  3.78s/it, lr: 1.0e-04 loss: 1.357e-01]mindexpander_qwen_v1:  40%|###9      | 1195/3000 [1:20:26<1:53:35,  3.78s/it, lr: 1.0e-04 loss: 1.357e-01]mindexpander_qwen_v1:  40%|###9      | 1195/3000 [1:20:32<1:53:35,  3.78s/it, lr: 1.0e-04 loss: 1.534e-02]mindexpander_qwen_v1:  40%|###9      | 1195/3000 [1:20:32<1:53:35,  3.78s/it, lr: 1.0e-04 loss: 1.534e-02]mindexpander_qwen_v1:  40%|###9      | 1196/3000 [1:20:32<2:10:55,  4.35s/it, lr: 1.0e-04 loss: 1.534e-02]mindexpander_qwen_v1:  40%|###9      | 1196/3000 [1:20:32<2:10:55,  4.35s/it, lr: 1.0e-04 loss: 1.534e-02]mindexpander_qwen_v1:  40%|###9      | 1196/3000 [1:20:38<2:10:55,  4.35s/it, lr: 1.0e-04 loss: 1.016e-01]mindexpander_qwen_v1:  40%|###9      | 1196/3000 [1:20:38<2:10:55,  4.35s/it, lr: 1.0e-04 loss: 1.016e-01]mindexpander_qwen_v1:  40%|###9      | 1197/3000 [1:20:38<2:23:06,  4.76s/it, lr: 1.0e-04 loss: 1.016e-01]mindexpander_qwen_v1:  40%|###9      | 1197/3000 [1:20:38<2:23:06,  4.76s/it, lr: 1.0e-04 loss: 1.016e-01]mindexpander_qwen_v1:  40%|###9      | 1197/3000 [1:20:42<2:23:06,  4.76s/it, lr: 1.0e-04 loss: 3.681e-02]mindexpander_qwen_v1:  40%|###9      | 1197/3000 [1:20:42<2:23:06,  4.76s/it, lr: 1.0e-04 loss: 3.681e-02]mindexpander_qwen_v1:  40%|###9      | 1198/3000 [1:20:42<2:15:38,  4.52s/it, lr: 1.0e-04 loss: 3.681e-02]mindexpander_qwen_v1:  40%|###9      | 1198/3000 [1:20:42<2:15:38,  4.52s/it, lr: 1.0e-04 loss: 3.681e-02]mindexpander_qwen_v1:  40%|###9      | 1198/3000 [1:20:45<2:15:38,  4.52s/it, lr: 1.0e-04 loss: 3.917e-02]mindexpander_qwen_v1:  40%|###9      | 1198/3000 [1:20:45<2:15:38,  4.52s/it, lr: 1.0e-04 loss: 3.917e-02]mindexpander_qwen_v1:  40%|###9      | 1199/3000 [1:20:45<2:08:43,  4.29s/it, lr: 1.0e-04 loss: 3.917e-02]mindexpander_qwen_v1:  40%|###9      | 1199/3000 [1:20:45<2:08:43,  4.29s/it, lr: 1.0e-04 loss: 3.917e-02]mindexpander_qwen_v1:  40%|###9      | 1199/3000 [1:20:52<2:08:43,  4.29s/it, lr: 1.0e-04 loss: 5.691e-02]mindexpander_qwen_v1:  40%|###9      | 1199/3000 [1:20:52<2:08:43,  4.29s/it, lr: 1.0e-04 loss: 5.691e-02]mindexpander_qwen_v1:  40%|####      | 1200/3000 [1:20:55<2:08:39,  4.29s/it, lr: 1.0e-04 loss: 1.348e-01]mindexpander_qwen_v1:  40%|####      | 1200/3000 [1:20:55<2:08:39,  4.29s/it, lr: 1.0e-04 loss: 1.348e-01]mindexpander_qwen_v1:  40%|####      | 1201/3000 [1:20:55<1:35:29,  3.18s/it, lr: 1.0e-04 loss: 1.348e-01]mindexpander_qwen_v1:  40%|####      | 1201/3000 [1:20:55<1:35:29,  3.18s/it, lr: 1.0e-04 loss: 1.348e-01]mindexpander_qwen_v1:  40%|####      | 1201/3000 [1:20:59<1:35:29,  3.18s/it, lr: 1.0e-04 loss: 1.733e-01]mindexpander_qwen_v1:  40%|####      | 1201/3000 [1:20:59<1:35:29,  3.18s/it, lr: 1.0e-04 loss: 1.733e-01]mindexpander_qwen_v1:  40%|####      | 1202/3000 [1:20:59<1:41:26,  3.39s/it, lr: 1.0e-04 loss: 1.733e-01]mindexpander_qwen_v1:  40%|####      | 1202/3000 [1:20:59<1:41:26,  3.39s/it, lr: 1.0e-04 loss: 1.733e-01]mindexpander_qwen_v1:  40%|####      | 1202/3000 [1:21:02<1:41:26,  3.39s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  40%|####      | 1202/3000 [1:21:02<1:41:26,  3.39s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  40%|####      | 1203/3000 [1:21:02<1:34:08,  3.14s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  40%|####      | 1203/3000 [1:21:02<1:34:08,  3.14s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  40%|####      | 1203/3000 [1:21:08<1:34:08,  3.14s/it, lr: 1.0e-04 loss: 5.378e-02]mindexpander_qwen_v1:  40%|####      | 1203/3000 [1:21:08<1:34:08,  3.14s/it, lr: 1.0e-04 loss: 5.378e-02]mindexpander_qwen_v1:  40%|####      | 1204/3000 [1:21:08<1:55:17,  3.85s/it, lr: 1.0e-04 loss: 5.378e-02]mindexpander_qwen_v1:  40%|####      | 1204/3000 [1:21:08<1:55:17,  3.85s/it, lr: 1.0e-04 loss: 5.378e-02]mindexpander_qwen_v1:  40%|####      | 1204/3000 [1:21:10<1:55:17,  3.85s/it, lr: 1.0e-04 loss: 5.955e-02]mindexpander_qwen_v1:  40%|####      | 1204/3000 [1:21:10<1:55:17,  3.85s/it, lr: 1.0e-04 loss: 5.955e-02]mindexpander_qwen_v1:  40%|####      | 1205/3000 [1:21:10<1:43:34,  3.46s/it, lr: 1.0e-04 loss: 5.955e-02]mindexpander_qwen_v1:  40%|####      | 1205/3000 [1:21:10<1:43:34,  3.46s/it, lr: 1.0e-04 loss: 5.955e-02]mindexpander_qwen_v1:  40%|####      | 1205/3000 [1:21:14<1:43:34,  3.46s/it, lr: 1.0e-04 loss: 3.803e-02]mindexpander_qwen_v1:  40%|####      | 1205/3000 [1:21:14<1:43:34,  3.46s/it, lr: 1.0e-04 loss: 3.803e-02]mindexpander_qwen_v1:  40%|####      | 1206/3000 [1:21:14<1:47:21,  3.59s/it, lr: 1.0e-04 loss: 3.803e-02]mindexpander_qwen_v1:  40%|####      | 1206/3000 [1:21:14<1:47:21,  3.59s/it, lr: 1.0e-04 loss: 3.803e-02]mindexpander_qwen_v1:  40%|####      | 1206/3000 [1:21:16<1:47:21,  3.59s/it, lr: 1.0e-04 loss: 7.475e-02]mindexpander_qwen_v1:  40%|####      | 1206/3000 [1:21:16<1:47:21,  3.59s/it, lr: 1.0e-04 loss: 7.475e-02]mindexpander_qwen_v1:  40%|####      | 1207/3000 [1:21:16<1:37:26,  3.26s/it, lr: 1.0e-04 loss: 7.475e-02]mindexpander_qwen_v1:  40%|####      | 1207/3000 [1:21:16<1:37:26,  3.26s/it, lr: 1.0e-04 loss: 7.475e-02]mindexpander_qwen_v1:  40%|####      | 1207/3000 [1:21:20<1:37:26,  3.26s/it, lr: 1.0e-04 loss: 2.593e-02]mindexpander_qwen_v1:  40%|####      | 1207/3000 [1:21:20<1:37:26,  3.26s/it, lr: 1.0e-04 loss: 2.593e-02]mindexpander_qwen_v1:  40%|####      | 1208/3000 [1:21:20<1:41:34,  3.40s/it, lr: 1.0e-04 loss: 2.593e-02]mindexpander_qwen_v1:  40%|####      | 1208/3000 [1:21:20<1:41:34,  3.40s/it, lr: 1.0e-04 loss: 2.593e-02]mindexpander_qwen_v1:  40%|####      | 1208/3000 [1:21:26<1:41:34,  3.40s/it, lr: 1.0e-04 loss: 1.133e-01]mindexpander_qwen_v1:  40%|####      | 1208/3000 [1:21:26<1:41:34,  3.40s/it, lr: 1.0e-04 loss: 1.133e-01]mindexpander_qwen_v1:  40%|####      | 1209/3000 [1:21:26<2:02:13,  4.09s/it, lr: 1.0e-04 loss: 1.133e-01]mindexpander_qwen_v1:  40%|####      | 1209/3000 [1:21:26<2:02:13,  4.09s/it, lr: 1.0e-04 loss: 1.133e-01]mindexpander_qwen_v1:  40%|####      | 1209/3000 [1:21:32<2:02:13,  4.09s/it, lr: 1.0e-04 loss: 3.644e-02]mindexpander_qwen_v1:  40%|####      | 1209/3000 [1:21:32<2:02:13,  4.09s/it, lr: 1.0e-04 loss: 3.644e-02]mindexpander_qwen_v1:  40%|####      | 1210/3000 [1:21:35<2:02:09,  4.09s/it, lr: 1.0e-04 loss: 4.227e-02]mindexpander_qwen_v1:  40%|####      | 1210/3000 [1:21:35<2:02:09,  4.09s/it, lr: 1.0e-04 loss: 4.227e-02]mindexpander_qwen_v1:  40%|####      | 1211/3000 [1:21:35<1:31:46,  3.08s/it, lr: 1.0e-04 loss: 4.227e-02]mindexpander_qwen_v1:  40%|####      | 1211/3000 [1:21:35<1:31:46,  3.08s/it, lr: 1.0e-04 loss: 4.227e-02]mindexpander_qwen_v1:  40%|####      | 1211/3000 [1:21:38<1:31:46,  3.08s/it, lr: 1.0e-04 loss: 1.880e-01]mindexpander_qwen_v1:  40%|####      | 1211/3000 [1:21:38<1:31:46,  3.08s/it, lr: 1.0e-04 loss: 1.880e-01]mindexpander_qwen_v1:  40%|####      | 1212/3000 [1:21:38<1:27:06,  2.92s/it, lr: 1.0e-04 loss: 1.880e-01]mindexpander_qwen_v1:  40%|####      | 1212/3000 [1:21:38<1:27:06,  2.92s/it, lr: 1.0e-04 loss: 1.880e-01]mindexpander_qwen_v1:  40%|####      | 1212/3000 [1:21:40<1:27:06,  2.92s/it, lr: 1.0e-04 loss: 5.601e-02]mindexpander_qwen_v1:  40%|####      | 1212/3000 [1:21:40<1:27:06,  2.92s/it, lr: 1.0e-04 loss: 5.601e-02]mindexpander_qwen_v1:  40%|####      | 1213/3000 [1:21:40<1:23:22,  2.80s/it, lr: 1.0e-04 loss: 5.601e-02]mindexpander_qwen_v1:  40%|####      | 1213/3000 [1:21:40<1:23:22,  2.80s/it, lr: 1.0e-04 loss: 5.601e-02]mindexpander_qwen_v1:  40%|####      | 1213/3000 [1:21:46<1:23:22,  2.80s/it, lr: 1.0e-04 loss: 6.357e-02]mindexpander_qwen_v1:  40%|####      | 1213/3000 [1:21:46<1:23:22,  2.80s/it, lr: 1.0e-04 loss: 6.357e-02]mindexpander_qwen_v1:  40%|####      | 1214/3000 [1:21:46<1:48:08,  3.63s/it, lr: 1.0e-04 loss: 6.357e-02]mindexpander_qwen_v1:  40%|####      | 1214/3000 [1:21:46<1:48:08,  3.63s/it, lr: 1.0e-04 loss: 6.357e-02]mindexpander_qwen_v1:  40%|####      | 1214/3000 [1:21:49<1:48:08,  3.63s/it, lr: 1.0e-04 loss: 5.770e-02]mindexpander_qwen_v1:  40%|####      | 1214/3000 [1:21:49<1:48:08,  3.63s/it, lr: 1.0e-04 loss: 5.770e-02]mindexpander_qwen_v1:  40%|####      | 1215/3000 [1:21:49<1:38:13,  3.30s/it, lr: 1.0e-04 loss: 5.770e-02]mindexpander_qwen_v1:  40%|####      | 1215/3000 [1:21:49<1:38:13,  3.30s/it, lr: 1.0e-04 loss: 5.770e-02]mindexpander_qwen_v1:  40%|####      | 1215/3000 [1:21:51<1:38:13,  3.30s/it, lr: 1.0e-04 loss: 4.588e-02]mindexpander_qwen_v1:  40%|####      | 1215/3000 [1:21:51<1:38:13,  3.30s/it, lr: 1.0e-04 loss: 4.588e-02]mindexpander_qwen_v1:  41%|####      | 1216/3000 [1:21:51<1:30:56,  3.06s/it, lr: 1.0e-04 loss: 4.588e-02]mindexpander_qwen_v1:  41%|####      | 1216/3000 [1:21:51<1:30:56,  3.06s/it, lr: 1.0e-04 loss: 4.588e-02]mindexpander_qwen_v1:  41%|####      | 1216/3000 [1:21:55<1:30:56,  3.06s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  41%|####      | 1216/3000 [1:21:55<1:30:56,  3.06s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  41%|####      | 1217/3000 [1:21:55<1:36:43,  3.25s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  41%|####      | 1217/3000 [1:21:55<1:36:43,  3.25s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  41%|####      | 1217/3000 [1:22:01<1:36:43,  3.25s/it, lr: 1.0e-04 loss: 5.798e-02]mindexpander_qwen_v1:  41%|####      | 1217/3000 [1:22:01<1:36:43,  3.25s/it, lr: 1.0e-04 loss: 5.798e-02]mindexpander_qwen_v1:  41%|####      | 1218/3000 [1:22:01<1:59:24,  4.02s/it, lr: 1.0e-04 loss: 5.798e-02]mindexpander_qwen_v1:  41%|####      | 1218/3000 [1:22:01<1:59:24,  4.02s/it, lr: 1.0e-04 loss: 5.798e-02]mindexpander_qwen_v1:  41%|####      | 1218/3000 [1:22:07<1:59:24,  4.02s/it, lr: 1.0e-04 loss: 1.242e-02]mindexpander_qwen_v1:  41%|####      | 1218/3000 [1:22:07<1:59:24,  4.02s/it, lr: 1.0e-04 loss: 1.242e-02]mindexpander_qwen_v1:  41%|####      | 1219/3000 [1:22:07<2:14:31,  4.53s/it, lr: 1.0e-04 loss: 1.242e-02]mindexpander_qwen_v1:  41%|####      | 1219/3000 [1:22:07<2:14:31,  4.53s/it, lr: 1.0e-04 loss: 1.242e-02]mindexpander_qwen_v1:  41%|####      | 1219/3000 [1:22:09<2:14:31,  4.53s/it, lr: 1.0e-04 loss: 1.067e-01]mindexpander_qwen_v1:  41%|####      | 1219/3000 [1:22:09<2:14:31,  4.53s/it, lr: 1.0e-04 loss: 1.067e-01]mindexpander_qwen_v1:  41%|####      | 1220/3000 [1:22:15<2:14:26,  4.53s/it, lr: 1.0e-04 loss: 1.833e-02]mindexpander_qwen_v1:  41%|####      | 1220/3000 [1:22:15<2:14:26,  4.53s/it, lr: 1.0e-04 loss: 1.833e-02]mindexpander_qwen_v1:  41%|####      | 1221/3000 [1:22:15<1:51:55,  3.77s/it, lr: 1.0e-04 loss: 1.833e-02]mindexpander_qwen_v1:  41%|####      | 1221/3000 [1:22:15<1:51:55,  3.77s/it, lr: 1.0e-04 loss: 1.833e-02]mindexpander_qwen_v1:  41%|####      | 1221/3000 [1:22:21<1:51:55,  3.77s/it, lr: 1.0e-04 loss: 1.102e-02]mindexpander_qwen_v1:  41%|####      | 1221/3000 [1:22:21<1:51:55,  3.77s/it, lr: 1.0e-04 loss: 1.102e-02]mindexpander_qwen_v1:  41%|####      | 1222/3000 [1:22:21<2:07:12,  4.29s/it, lr: 1.0e-04 loss: 1.102e-02]mindexpander_qwen_v1:  41%|####      | 1222/3000 [1:22:21<2:07:12,  4.29s/it, lr: 1.0e-04 loss: 1.102e-02]mindexpander_qwen_v1:  41%|####      | 1222/3000 [1:22:23<2:07:12,  4.29s/it, lr: 1.0e-04 loss: 8.025e-02]mindexpander_qwen_v1:  41%|####      | 1222/3000 [1:22:23<2:07:12,  4.29s/it, lr: 1.0e-04 loss: 8.025e-02]mindexpander_qwen_v1:  41%|####      | 1223/3000 [1:22:23<1:52:54,  3.81s/it, lr: 1.0e-04 loss: 8.025e-02]mindexpander_qwen_v1:  41%|####      | 1223/3000 [1:22:23<1:52:54,  3.81s/it, lr: 1.0e-04 loss: 8.025e-02]mindexpander_qwen_v1:  41%|####      | 1223/3000 [1:22:29<1:52:54,  3.81s/it, lr: 1.0e-04 loss: 7.896e-02]mindexpander_qwen_v1:  41%|####      | 1223/3000 [1:22:29<1:52:54,  3.81s/it, lr: 1.0e-04 loss: 7.896e-02]mindexpander_qwen_v1:  41%|####      | 1224/3000 [1:22:29<2:08:25,  4.34s/it, lr: 1.0e-04 loss: 7.896e-02]mindexpander_qwen_v1:  41%|####      | 1224/3000 [1:22:29<2:08:25,  4.34s/it, lr: 1.0e-04 loss: 7.896e-02]mindexpander_qwen_v1:  41%|####      | 1224/3000 [1:22:33<2:08:25,  4.34s/it, lr: 1.0e-04 loss: 4.297e-03]mindexpander_qwen_v1:  41%|####      | 1224/3000 [1:22:33<2:08:25,  4.34s/it, lr: 1.0e-04 loss: 4.297e-03]mindexpander_qwen_v1:  41%|####      | 1225/3000 [1:22:33<2:03:23,  4.17s/it, lr: 1.0e-04 loss: 4.297e-03]mindexpander_qwen_v1:  41%|####      | 1225/3000 [1:22:33<2:03:23,  4.17s/it, lr: 1.0e-04 loss: 4.297e-03]mindexpander_qwen_v1:  41%|####      | 1225/3000 [1:22:36<2:03:23,  4.17s/it, lr: 1.0e-04 loss: 6.289e-02]mindexpander_qwen_v1:  41%|####      | 1225/3000 [1:22:36<2:03:23,  4.17s/it, lr: 1.0e-04 loss: 6.289e-02]mindexpander_qwen_v1:  41%|####      | 1226/3000 [1:22:36<2:01:02,  4.09s/it, lr: 1.0e-04 loss: 6.289e-02]mindexpander_qwen_v1:  41%|####      | 1226/3000 [1:22:36<2:01:02,  4.09s/it, lr: 1.0e-04 loss: 6.289e-02]mindexpander_qwen_v1:  41%|####      | 1226/3000 [1:22:40<2:01:02,  4.09s/it, lr: 1.0e-04 loss: 1.512e-02]mindexpander_qwen_v1:  41%|####      | 1226/3000 [1:22:40<2:01:02,  4.09s/it, lr: 1.0e-04 loss: 1.512e-02]mindexpander_qwen_v1:  41%|####      | 1227/3000 [1:22:40<1:57:55,  3.99s/it, lr: 1.0e-04 loss: 1.512e-02]mindexpander_qwen_v1:  41%|####      | 1227/3000 [1:22:40<1:57:55,  3.99s/it, lr: 1.0e-04 loss: 1.512e-02]mindexpander_qwen_v1:  41%|####      | 1227/3000 [1:22:43<1:57:55,  3.99s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  41%|####      | 1227/3000 [1:22:43<1:57:55,  3.99s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  41%|####      | 1228/3000 [1:22:43<1:44:31,  3.54s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  41%|####      | 1228/3000 [1:22:43<1:44:31,  3.54s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  41%|####      | 1228/3000 [1:22:46<1:44:31,  3.54s/it, lr: 1.0e-04 loss: 1.268e-01]mindexpander_qwen_v1:  41%|####      | 1228/3000 [1:22:46<1:44:31,  3.54s/it, lr: 1.0e-04 loss: 1.268e-01]mindexpander_qwen_v1:  41%|####      | 1229/3000 [1:22:46<1:46:10,  3.60s/it, lr: 1.0e-04 loss: 1.268e-01]mindexpander_qwen_v1:  41%|####      | 1229/3000 [1:22:46<1:46:10,  3.60s/it, lr: 1.0e-04 loss: 1.268e-01]mindexpander_qwen_v1:  41%|####      | 1229/3000 [1:22:49<1:46:10,  3.60s/it, lr: 1.0e-04 loss: 7.696e-02]mindexpander_qwen_v1:  41%|####      | 1229/3000 [1:22:49<1:46:10,  3.60s/it, lr: 1.0e-04 loss: 7.696e-02]mindexpander_qwen_v1:  41%|####1     | 1230/3000 [1:22:53<1:46:06,  3.60s/it, lr: 1.0e-04 loss: 3.336e-03]mindexpander_qwen_v1:  41%|####1     | 1230/3000 [1:22:53<1:46:06,  3.60s/it, lr: 1.0e-04 loss: 3.336e-03]mindexpander_qwen_v1:  41%|####1     | 1231/3000 [1:22:53<1:22:42,  2.81s/it, lr: 1.0e-04 loss: 3.336e-03]mindexpander_qwen_v1:  41%|####1     | 1231/3000 [1:22:53<1:22:42,  2.81s/it, lr: 1.0e-04 loss: 3.336e-03]mindexpander_qwen_v1:  41%|####1     | 1231/3000 [1:22:59<1:22:42,  2.81s/it, lr: 1.0e-04 loss: 8.394e-03]mindexpander_qwen_v1:  41%|####1     | 1231/3000 [1:22:59<1:22:42,  2.81s/it, lr: 1.0e-04 loss: 8.394e-03]mindexpander_qwen_v1:  41%|####1     | 1232/3000 [1:22:59<1:44:01,  3.53s/it, lr: 1.0e-04 loss: 8.394e-03]mindexpander_qwen_v1:  41%|####1     | 1232/3000 [1:22:59<1:44:01,  3.53s/it, lr: 1.0e-04 loss: 8.394e-03]mindexpander_qwen_v1:  41%|####1     | 1232/3000 [1:23:01<1:44:01,  3.53s/it, lr: 1.0e-04 loss: 1.368e-01]mindexpander_qwen_v1:  41%|####1     | 1232/3000 [1:23:01<1:44:01,  3.53s/it, lr: 1.0e-04 loss: 1.368e-01]mindexpander_qwen_v1:  41%|####1     | 1233/3000 [1:23:01<1:35:41,  3.25s/it, lr: 1.0e-04 loss: 1.368e-01]mindexpander_qwen_v1:  41%|####1     | 1233/3000 [1:23:01<1:35:41,  3.25s/it, lr: 1.0e-04 loss: 1.368e-01]mindexpander_qwen_v1:  41%|####1     | 1233/3000 [1:23:07<1:35:41,  3.25s/it, lr: 1.0e-04 loss: 8.791e-03]mindexpander_qwen_v1:  41%|####1     | 1233/3000 [1:23:07<1:35:41,  3.25s/it, lr: 1.0e-04 loss: 8.791e-03]mindexpander_qwen_v1:  41%|####1     | 1234/3000 [1:23:07<1:56:23,  3.95s/it, lr: 1.0e-04 loss: 8.791e-03]mindexpander_qwen_v1:  41%|####1     | 1234/3000 [1:23:07<1:56:23,  3.95s/it, lr: 1.0e-04 loss: 8.791e-03]mindexpander_qwen_v1:  41%|####1     | 1234/3000 [1:23:11<1:56:23,  3.95s/it, lr: 1.0e-04 loss: 2.027e-02]mindexpander_qwen_v1:  41%|####1     | 1234/3000 [1:23:11<1:56:23,  3.95s/it, lr: 1.0e-04 loss: 2.027e-02]mindexpander_qwen_v1:  41%|####1     | 1235/3000 [1:23:11<1:54:30,  3.89s/it, lr: 1.0e-04 loss: 2.027e-02]mindexpander_qwen_v1:  41%|####1     | 1235/3000 [1:23:11<1:54:30,  3.89s/it, lr: 1.0e-04 loss: 2.027e-02]mindexpander_qwen_v1:  41%|####1     | 1235/3000 [1:23:17<1:54:30,  3.89s/it, lr: 1.0e-04 loss: 5.486e-02]mindexpander_qwen_v1:  41%|####1     | 1235/3000 [1:23:17<1:54:30,  3.89s/it, lr: 1.0e-04 loss: 5.486e-02]mindexpander_qwen_v1:  41%|####1     | 1236/3000 [1:23:17<2:09:55,  4.42s/it, lr: 1.0e-04 loss: 5.486e-02]mindexpander_qwen_v1:  41%|####1     | 1236/3000 [1:23:17<2:09:55,  4.42s/it, lr: 1.0e-04 loss: 5.486e-02]mindexpander_qwen_v1:  41%|####1     | 1236/3000 [1:23:19<2:09:55,  4.42s/it, lr: 1.0e-04 loss: 1.701e-01]mindexpander_qwen_v1:  41%|####1     | 1236/3000 [1:23:19<2:09:55,  4.42s/it, lr: 1.0e-04 loss: 1.701e-01]mindexpander_qwen_v1:  41%|####1     | 1237/3000 [1:23:19<1:53:08,  3.85s/it, lr: 1.0e-04 loss: 1.701e-01]mindexpander_qwen_v1:  41%|####1     | 1237/3000 [1:23:19<1:53:08,  3.85s/it, lr: 1.0e-04 loss: 1.701e-01]mindexpander_qwen_v1:  41%|####1     | 1237/3000 [1:23:25<1:53:08,  3.85s/it, lr: 1.0e-04 loss: 1.207e-01]mindexpander_qwen_v1:  41%|####1     | 1237/3000 [1:23:25<1:53:08,  3.85s/it, lr: 1.0e-04 loss: 1.207e-01]mindexpander_qwen_v1:  41%|####1     | 1238/3000 [1:23:25<2:10:13,  4.43s/it, lr: 1.0e-04 loss: 1.207e-01]mindexpander_qwen_v1:  41%|####1     | 1238/3000 [1:23:25<2:10:13,  4.43s/it, lr: 1.0e-04 loss: 1.207e-01]mindexpander_qwen_v1:  41%|####1     | 1238/3000 [1:23:31<2:10:13,  4.43s/it, lr: 1.0e-04 loss: 1.075e-01]mindexpander_qwen_v1:  41%|####1     | 1238/3000 [1:23:31<2:10:13,  4.43s/it, lr: 1.0e-04 loss: 1.075e-01]mindexpander_qwen_v1:  41%|####1     | 1239/3000 [1:23:31<2:21:28,  4.82s/it, lr: 1.0e-04 loss: 1.075e-01]mindexpander_qwen_v1:  41%|####1     | 1239/3000 [1:23:31<2:21:28,  4.82s/it, lr: 1.0e-04 loss: 1.075e-01]mindexpander_qwen_v1:  41%|####1     | 1239/3000 [1:23:36<2:21:28,  4.82s/it, lr: 1.0e-04 loss: 1.340e-02]mindexpander_qwen_v1:  41%|####1     | 1239/3000 [1:23:36<2:21:28,  4.82s/it, lr: 1.0e-04 loss: 1.340e-02]mindexpander_qwen_v1:  41%|####1     | 1240/3000 [1:23:40<2:21:23,  4.82s/it, lr: 1.0e-04 loss: 9.918e-02]mindexpander_qwen_v1:  41%|####1     | 1240/3000 [1:23:40<2:21:23,  4.82s/it, lr: 1.0e-04 loss: 9.918e-02]mindexpander_qwen_v1:  41%|####1     | 1241/3000 [1:23:40<1:42:50,  3.51s/it, lr: 1.0e-04 loss: 9.918e-02]mindexpander_qwen_v1:  41%|####1     | 1241/3000 [1:23:40<1:42:50,  3.51s/it, lr: 1.0e-04 loss: 9.918e-02]mindexpander_qwen_v1:  41%|####1     | 1241/3000 [1:23:43<1:42:50,  3.51s/it, lr: 1.0e-04 loss: 2.129e-02]mindexpander_qwen_v1:  41%|####1     | 1241/3000 [1:23:43<1:42:50,  3.51s/it, lr: 1.0e-04 loss: 2.129e-02]mindexpander_qwen_v1:  41%|####1     | 1242/3000 [1:23:43<1:35:05,  3.25s/it, lr: 1.0e-04 loss: 2.129e-02]mindexpander_qwen_v1:  41%|####1     | 1242/3000 [1:23:43<1:35:05,  3.25s/it, lr: 1.0e-04 loss: 2.129e-02]mindexpander_qwen_v1:  41%|####1     | 1242/3000 [1:23:45<1:35:05,  3.25s/it, lr: 1.0e-04 loss: 4.874e-03]mindexpander_qwen_v1:  41%|####1     | 1242/3000 [1:23:45<1:35:05,  3.25s/it, lr: 1.0e-04 loss: 4.874e-03]mindexpander_qwen_v1:  41%|####1     | 1243/3000 [1:23:45<1:28:55,  3.04s/it, lr: 1.0e-04 loss: 4.874e-03]mindexpander_qwen_v1:  41%|####1     | 1243/3000 [1:23:45<1:28:55,  3.04s/it, lr: 1.0e-04 loss: 4.874e-03]mindexpander_qwen_v1:  41%|####1     | 1243/3000 [1:23:51<1:28:55,  3.04s/it, lr: 1.0e-04 loss: 6.243e-02]mindexpander_qwen_v1:  41%|####1     | 1243/3000 [1:23:51<1:28:55,  3.04s/it, lr: 1.0e-04 loss: 6.243e-02]mindexpander_qwen_v1:  41%|####1     | 1244/3000 [1:23:51<1:50:24,  3.77s/it, lr: 1.0e-04 loss: 6.243e-02]mindexpander_qwen_v1:  41%|####1     | 1244/3000 [1:23:51<1:50:24,  3.77s/it, lr: 1.0e-04 loss: 6.243e-02]mindexpander_qwen_v1:  41%|####1     | 1244/3000 [1:23:54<1:50:24,  3.77s/it, lr: 1.0e-04 loss: 3.883e-02]mindexpander_qwen_v1:  41%|####1     | 1244/3000 [1:23:54<1:50:24,  3.77s/it, lr: 1.0e-04 loss: 3.883e-02]mindexpander_qwen_v1:  42%|####1     | 1245/3000 [1:23:54<1:41:11,  3.46s/it, lr: 1.0e-04 loss: 3.883e-02]mindexpander_qwen_v1:  42%|####1     | 1245/3000 [1:23:54<1:41:11,  3.46s/it, lr: 1.0e-04 loss: 3.883e-02]mindexpander_qwen_v1:  42%|####1     | 1245/3000 [1:23:56<1:41:11,  3.46s/it, lr: 1.0e-04 loss: 2.052e-02]mindexpander_qwen_v1:  42%|####1     | 1245/3000 [1:23:56<1:41:11,  3.46s/it, lr: 1.0e-04 loss: 2.052e-02]mindexpander_qwen_v1:  42%|####1     | 1246/3000 [1:23:56<1:32:37,  3.17s/it, lr: 1.0e-04 loss: 2.052e-02]mindexpander_qwen_v1:  42%|####1     | 1246/3000 [1:23:56<1:32:37,  3.17s/it, lr: 1.0e-04 loss: 2.052e-02]mindexpander_qwen_v1:  42%|####1     | 1246/3000 [1:24:00<1:32:37,  3.17s/it, lr: 1.0e-04 loss: 1.741e-01]mindexpander_qwen_v1:  42%|####1     | 1246/3000 [1:24:00<1:32:37,  3.17s/it, lr: 1.0e-04 loss: 1.741e-01]mindexpander_qwen_v1:  42%|####1     | 1247/3000 [1:24:00<1:37:20,  3.33s/it, lr: 1.0e-04 loss: 1.741e-01]mindexpander_qwen_v1:  42%|####1     | 1247/3000 [1:24:00<1:37:20,  3.33s/it, lr: 1.0e-04 loss: 1.741e-01]mindexpander_qwen_v1:  42%|####1     | 1247/3000 [1:24:06<1:37:20,  3.33s/it, lr: 1.0e-04 loss: 3.416e-02]mindexpander_qwen_v1:  42%|####1     | 1247/3000 [1:24:06<1:37:20,  3.33s/it, lr: 1.0e-04 loss: 3.416e-02]mindexpander_qwen_v1:  42%|####1     | 1248/3000 [1:24:06<1:57:52,  4.04s/it, lr: 1.0e-04 loss: 3.416e-02]mindexpander_qwen_v1:  42%|####1     | 1248/3000 [1:24:06<1:57:52,  4.04s/it, lr: 1.0e-04 loss: 3.416e-02]mindexpander_qwen_v1:  42%|####1     | 1248/3000 [1:24:08<1:57:52,  4.04s/it, lr: 1.0e-04 loss: 1.345e-01]mindexpander_qwen_v1:  42%|####1     | 1248/3000 [1:24:08<1:57:52,  4.04s/it, lr: 1.0e-04 loss: 1.345e-01]mindexpander_qwen_v1:  42%|####1     | 1249/3000 [1:24:08<1:45:55,  3.63s/it, lr: 1.0e-04 loss: 1.345e-01]mindexpander_qwen_v1:  42%|####1     | 1249/3000 [1:24:08<1:45:55,  3.63s/it, lr: 1.0e-04 loss: 1.345e-01]mindexpander_qwen_v1:  42%|####1     | 1249/3000 [1:24:12<1:45:55,  3.63s/it, lr: 1.0e-04 loss: 1.574e-02]mindexpander_qwen_v1:  42%|####1     | 1249/3000 [1:24:12<1:45:55,  3.63s/it, lr: 1.0e-04 loss: 1.574e-02]
+Saving at step 1250
+Saved checkpoint to /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000001250.safetensors
+Saved optimizer to /app/ai-toolkit/output/mindexpander_qwen_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000000250.safetensors
+
+
+Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:   0%|          | 0/2 [00:00<?, ?it/s][A[A
+
+Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.39s/it]Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.39s/it][A[A
+
+Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.58s/it]Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.58s/it][A[A
+
+                                                                                                                                [A[Amindexpander_qwen_v1:  42%|####1     | 1250/3000 [1:24:16<1:45:51,  3.63s/it, lr: 1.0e-04 loss: 1.371e-01]mindexpander_qwen_v1:  42%|####1     | 1250/3000 [1:24:16<1:45:51,  3.63s/it, lr: 1.0e-04 loss: 1.371e-01]mindexpander_qwen_v1:  42%|####1     | 1251/3000 [1:24:16<1:23:36,  2.87s/it, lr: 1.0e-04 loss: 1.371e-01]mindexpander_qwen_v1:  42%|####1     | 1251/3000 [1:24:16<1:23:36,  2.87s/it, lr: 1.0e-04 loss: 1.371e-01]mindexpander_qwen_v1:  42%|####1     | 1251/3000 [1:24:18<1:23:36,  2.87s/it, lr: 1.0e-04 loss: 1.901e-01]mindexpander_qwen_v1:  42%|####1     | 1251/3000 [1:24:18<1:23:36,  2.87s/it, lr: 1.0e-04 loss: 1.901e-01]mindexpander_qwen_v1:  42%|####1     | 1252/3000 [1:24:18<1:20:30,  2.76s/it, lr: 1.0e-04 loss: 1.901e-01]mindexpander_qwen_v1:  42%|####1     | 1252/3000 [1:24:18<1:20:30,  2.76s/it, lr: 1.0e-04 loss: 1.901e-01]mindexpander_qwen_v1:  42%|####1     | 1252/3000 [1:24:24<1:20:30,  2.76s/it, lr: 1.0e-04 loss: 4.564e-02]mindexpander_qwen_v1:  42%|####1     | 1252/3000 [1:24:24<1:20:30,  2.76s/it, lr: 1.0e-04 loss: 4.564e-02]mindexpander_qwen_v1:  42%|####1     | 1253/3000 [1:24:24<1:43:00,  3.54s/it, lr: 1.0e-04 loss: 4.564e-02]mindexpander_qwen_v1:  42%|####1     | 1253/3000 [1:24:24<1:43:00,  3.54s/it, lr: 1.0e-04 loss: 4.564e-02]mindexpander_qwen_v1:  42%|####1     | 1253/3000 [1:24:28<1:43:00,  3.54s/it, lr: 1.0e-04 loss: 1.208e-02]mindexpander_qwen_v1:  42%|####1     | 1253/3000 [1:24:28<1:43:00,  3.54s/it, lr: 1.0e-04 loss: 1.208e-02]mindexpander_qwen_v1:  42%|####1     | 1254/3000 [1:24:28<1:45:39,  3.63s/it, lr: 1.0e-04 loss: 1.208e-02]mindexpander_qwen_v1:  42%|####1     | 1254/3000 [1:24:28<1:45:39,  3.63s/it, lr: 1.0e-04 loss: 1.208e-02]mindexpander_qwen_v1:  42%|####1     | 1254/3000 [1:24:32<1:45:39,  3.63s/it, lr: 1.0e-04 loss: 4.479e-02]mindexpander_qwen_v1:  42%|####1     | 1254/3000 [1:24:32<1:45:39,  3.63s/it, lr: 1.0e-04 loss: 4.479e-02]mindexpander_qwen_v1:  42%|####1     | 1255/3000 [1:24:32<1:46:27,  3.66s/it, lr: 1.0e-04 loss: 4.479e-02]mindexpander_qwen_v1:  42%|####1     | 1255/3000 [1:24:32<1:46:27,  3.66s/it, lr: 1.0e-04 loss: 4.479e-02]mindexpander_qwen_v1:  42%|####1     | 1255/3000 [1:24:34<1:46:27,  3.66s/it, lr: 1.0e-04 loss: 2.945e-02]mindexpander_qwen_v1:  42%|####1     | 1255/3000 [1:24:34<1:46:27,  3.66s/it, lr: 1.0e-04 loss: 2.945e-02]mindexpander_qwen_v1:  42%|####1     | 1256/3000 [1:24:34<1:36:18,  3.31s/it, lr: 1.0e-04 loss: 2.945e-02]mindexpander_qwen_v1:  42%|####1     | 1256/3000 [1:24:34<1:36:18,  3.31s/it, lr: 1.0e-04 loss: 2.945e-02]mindexpander_qwen_v1:  42%|####1     | 1256/3000 [1:24:38<1:36:18,  3.31s/it, lr: 1.0e-04 loss: 1.934e-02]mindexpander_qwen_v1:  42%|####1     | 1256/3000 [1:24:38<1:36:18,  3.31s/it, lr: 1.0e-04 loss: 1.934e-02]mindexpander_qwen_v1:  42%|####1     | 1257/3000 [1:24:38<1:39:46,  3.43s/it, lr: 1.0e-04 loss: 1.934e-02]mindexpander_qwen_v1:  42%|####1     | 1257/3000 [1:24:38<1:39:46,  3.43s/it, lr: 1.0e-04 loss: 1.934e-02]mindexpander_qwen_v1:  42%|####1     | 1257/3000 [1:24:42<1:39:46,  3.43s/it, lr: 1.0e-04 loss: 1.324e-01]mindexpander_qwen_v1:  42%|####1     | 1257/3000 [1:24:42<1:39:46,  3.43s/it, lr: 1.0e-04 loss: 1.324e-01]mindexpander_qwen_v1:  42%|####1     | 1258/3000 [1:24:42<1:43:39,  3.57s/it, lr: 1.0e-04 loss: 1.324e-01]mindexpander_qwen_v1:  42%|####1     | 1258/3000 [1:24:42<1:43:39,  3.57s/it, lr: 1.0e-04 loss: 1.324e-01]mindexpander_qwen_v1:  42%|####1     | 1258/3000 [1:24:48<1:43:39,  3.57s/it, lr: 1.0e-04 loss: 1.807e-01]mindexpander_qwen_v1:  42%|####1     | 1258/3000 [1:24:48<1:43:39,  3.57s/it, lr: 1.0e-04 loss: 1.807e-01]mindexpander_qwen_v1:  42%|####1     | 1259/3000 [1:24:48<2:02:09,  4.21s/it, lr: 1.0e-04 loss: 1.807e-01]mindexpander_qwen_v1:  42%|####1     | 1259/3000 [1:24:48<2:02:09,  4.21s/it, lr: 1.0e-04 loss: 1.807e-01]mindexpander_qwen_v1:  42%|####1     | 1259/3000 [1:24:54<2:02:09,  4.21s/it, lr: 1.0e-04 loss: 1.817e-01]mindexpander_qwen_v1:  42%|####1     | 1259/3000 [1:24:54<2:02:09,  4.21s/it, lr: 1.0e-04 loss: 1.817e-01]mindexpander_qwen_v1:  42%|####2     | 1260/3000 [1:24:57<2:02:05,  4.21s/it, lr: 1.0e-04 loss: 2.479e-03]mindexpander_qwen_v1:  42%|####2     | 1260/3000 [1:24:57<2:02:05,  4.21s/it, lr: 1.0e-04 loss: 2.479e-03]mindexpander_qwen_v1:  42%|####2     | 1261/3000 [1:24:57<1:31:02,  3.14s/it, lr: 1.0e-04 loss: 2.479e-03]mindexpander_qwen_v1:  42%|####2     | 1261/3000 [1:24:57<1:31:02,  3.14s/it, lr: 1.0e-04 loss: 2.479e-03]mindexpander_qwen_v1:  42%|####2     | 1261/3000 [1:25:01<1:31:02,  3.14s/it, lr: 1.0e-04 loss: 6.579e-02]mindexpander_qwen_v1:  42%|####2     | 1261/3000 [1:25:01<1:31:02,  3.14s/it, lr: 1.0e-04 loss: 6.579e-02]mindexpander_qwen_v1:  42%|####2     | 1262/3000 [1:25:01<1:36:56,  3.35s/it, lr: 1.0e-04 loss: 6.579e-02]mindexpander_qwen_v1:  42%|####2     | 1262/3000 [1:25:01<1:36:56,  3.35s/it, lr: 1.0e-04 loss: 6.579e-02]mindexpander_qwen_v1:  42%|####2     | 1262/3000 [1:25:07<1:36:56,  3.35s/it, lr: 1.0e-04 loss: 6.025e-02]mindexpander_qwen_v1:  42%|####2     | 1262/3000 [1:25:07<1:36:56,  3.35s/it, lr: 1.0e-04 loss: 6.025e-02]mindexpander_qwen_v1:  42%|####2     | 1263/3000 [1:25:07<1:54:57,  3.97s/it, lr: 1.0e-04 loss: 6.025e-02]mindexpander_qwen_v1:  42%|####2     | 1263/3000 [1:25:07<1:54:57,  3.97s/it, lr: 1.0e-04 loss: 6.025e-02]mindexpander_qwen_v1:  42%|####2     | 1263/3000 [1:25:10<1:54:57,  3.97s/it, lr: 1.0e-04 loss: 5.399e-02]mindexpander_qwen_v1:  42%|####2     | 1263/3000 [1:25:10<1:54:57,  3.97s/it, lr: 1.0e-04 loss: 5.399e-02]mindexpander_qwen_v1:  42%|####2     | 1264/3000 [1:25:10<1:43:00,  3.56s/it, lr: 1.0e-04 loss: 5.399e-02]mindexpander_qwen_v1:  42%|####2     | 1264/3000 [1:25:10<1:43:00,  3.56s/it, lr: 1.0e-04 loss: 5.399e-02]mindexpander_qwen_v1:  42%|####2     | 1264/3000 [1:25:15<1:43:00,  3.56s/it, lr: 1.0e-04 loss: 4.088e-02]mindexpander_qwen_v1:  42%|####2     | 1264/3000 [1:25:15<1:43:00,  3.56s/it, lr: 1.0e-04 loss: 4.088e-02]mindexpander_qwen_v1:  42%|####2     | 1265/3000 [1:25:15<2:00:34,  4.17s/it, lr: 1.0e-04 loss: 4.088e-02]mindexpander_qwen_v1:  42%|####2     | 1265/3000 [1:25:15<2:00:34,  4.17s/it, lr: 1.0e-04 loss: 4.088e-02]mindexpander_qwen_v1:  42%|####2     | 1265/3000 [1:25:18<2:00:34,  4.17s/it, lr: 1.0e-04 loss: 1.647e-01]mindexpander_qwen_v1:  42%|####2     | 1265/3000 [1:25:18<2:00:34,  4.17s/it, lr: 1.0e-04 loss: 1.647e-01]mindexpander_qwen_v1:  42%|####2     | 1266/3000 [1:25:18<1:47:53,  3.73s/it, lr: 1.0e-04 loss: 1.647e-01]mindexpander_qwen_v1:  42%|####2     | 1266/3000 [1:25:18<1:47:53,  3.73s/it, lr: 1.0e-04 loss: 1.647e-01]mindexpander_qwen_v1:  42%|####2     | 1266/3000 [1:25:22<1:47:53,  3.73s/it, lr: 1.0e-04 loss: 1.429e-02]mindexpander_qwen_v1:  42%|####2     | 1266/3000 [1:25:22<1:47:53,  3.73s/it, lr: 1.0e-04 loss: 1.429e-02]mindexpander_qwen_v1:  42%|####2     | 1267/3000 [1:25:22<1:47:51,  3.73s/it, lr: 1.0e-04 loss: 1.429e-02]mindexpander_qwen_v1:  42%|####2     | 1267/3000 [1:25:22<1:47:51,  3.73s/it, lr: 1.0e-04 loss: 1.429e-02]mindexpander_qwen_v1:  42%|####2     | 1267/3000 [1:25:24<1:47:51,  3.73s/it, lr: 1.0e-04 loss: 1.112e-01]mindexpander_qwen_v1:  42%|####2     | 1267/3000 [1:25:24<1:47:51,  3.73s/it, lr: 1.0e-04 loss: 1.112e-01]mindexpander_qwen_v1:  42%|####2     | 1268/3000 [1:25:24<1:37:03,  3.36s/it, lr: 1.0e-04 loss: 1.112e-01]mindexpander_qwen_v1:  42%|####2     | 1268/3000 [1:25:24<1:37:03,  3.36s/it, lr: 1.0e-04 loss: 1.112e-01]mindexpander_qwen_v1:  42%|####2     | 1268/3000 [1:25:28<1:37:03,  3.36s/it, lr: 1.0e-04 loss: 2.030e-02]mindexpander_qwen_v1:  42%|####2     | 1268/3000 [1:25:28<1:37:03,  3.36s/it, lr: 1.0e-04 loss: 2.030e-02]mindexpander_qwen_v1:  42%|####2     | 1269/3000 [1:25:28<1:40:10,  3.47s/it, lr: 1.0e-04 loss: 2.030e-02]mindexpander_qwen_v1:  42%|####2     | 1269/3000 [1:25:28<1:40:10,  3.47s/it, lr: 1.0e-04 loss: 2.030e-02]mindexpander_qwen_v1:  42%|####2     | 1269/3000 [1:25:31<1:40:10,  3.47s/it, lr: 1.0e-04 loss: 1.792e-01]mindexpander_qwen_v1:  42%|####2     | 1269/3000 [1:25:31<1:40:10,  3.47s/it, lr: 1.0e-04 loss: 1.792e-01]mindexpander_qwen_v1:  42%|####2     | 1270/3000 [1:25:33<1:40:06,  3.47s/it, lr: 1.0e-04 loss: 3.256e-02]mindexpander_qwen_v1:  42%|####2     | 1270/3000 [1:25:33<1:40:06,  3.47s/it, lr: 1.0e-04 loss: 3.256e-02]mindexpander_qwen_v1:  42%|####2     | 1271/3000 [1:25:33<1:10:26,  2.44s/it, lr: 1.0e-04 loss: 3.256e-02]mindexpander_qwen_v1:  42%|####2     | 1271/3000 [1:25:33<1:10:26,  2.44s/it, lr: 1.0e-04 loss: 3.256e-02]mindexpander_qwen_v1:  42%|####2     | 1271/3000 [1:25:37<1:10:26,  2.44s/it, lr: 1.0e-04 loss: 8.615e-02]mindexpander_qwen_v1:  42%|####2     | 1271/3000 [1:25:37<1:10:26,  2.44s/it, lr: 1.0e-04 loss: 8.615e-02]mindexpander_qwen_v1:  42%|####2     | 1272/3000 [1:25:37<1:19:31,  2.76s/it, lr: 1.0e-04 loss: 8.615e-02]mindexpander_qwen_v1:  42%|####2     | 1272/3000 [1:25:37<1:19:31,  2.76s/it, lr: 1.0e-04 loss: 8.615e-02]mindexpander_qwen_v1:  42%|####2     | 1272/3000 [1:25:39<1:19:31,  2.76s/it, lr: 1.0e-04 loss: 3.818e-02]mindexpander_qwen_v1:  42%|####2     | 1272/3000 [1:25:39<1:19:31,  2.76s/it, lr: 1.0e-04 loss: 3.818e-02]mindexpander_qwen_v1:  42%|####2     | 1273/3000 [1:25:39<1:17:07,  2.68s/it, lr: 1.0e-04 loss: 3.818e-02]mindexpander_qwen_v1:  42%|####2     | 1273/3000 [1:25:39<1:17:07,  2.68s/it, lr: 1.0e-04 loss: 3.818e-02]mindexpander_qwen_v1:  42%|####2     | 1273/3000 [1:25:45<1:17:07,  2.68s/it, lr: 1.0e-04 loss: 5.166e-02]mindexpander_qwen_v1:  42%|####2     | 1273/3000 [1:25:45<1:17:07,  2.68s/it, lr: 1.0e-04 loss: 5.166e-02]mindexpander_qwen_v1:  42%|####2     | 1274/3000 [1:25:45<1:41:55,  3.54s/it, lr: 1.0e-04 loss: 5.166e-02]mindexpander_qwen_v1:  42%|####2     | 1274/3000 [1:25:45<1:41:55,  3.54s/it, lr: 1.0e-04 loss: 5.166e-02]mindexpander_qwen_v1:  42%|####2     | 1274/3000 [1:25:51<1:41:55,  3.54s/it, lr: 1.0e-04 loss: 5.711e-02]mindexpander_qwen_v1:  42%|####2     | 1274/3000 [1:25:51<1:41:55,  3.54s/it, lr: 1.0e-04 loss: 5.711e-02]mindexpander_qwen_v1:  42%|####2     | 1275/3000 [1:25:51<1:59:27,  4.16s/it, lr: 1.0e-04 loss: 5.711e-02]mindexpander_qwen_v1:  42%|####2     | 1275/3000 [1:25:51<1:59:27,  4.16s/it, lr: 1.0e-04 loss: 5.711e-02]mindexpander_qwen_v1:  42%|####2     | 1275/3000 [1:25:57<1:59:27,  4.16s/it, lr: 1.0e-04 loss: 2.328e-02]mindexpander_qwen_v1:  42%|####2     | 1275/3000 [1:25:57<1:59:27,  4.16s/it, lr: 1.0e-04 loss: 2.328e-02]mindexpander_qwen_v1:  43%|####2     | 1276/3000 [1:25:57<2:12:23,  4.61s/it, lr: 1.0e-04 loss: 2.328e-02]mindexpander_qwen_v1:  43%|####2     | 1276/3000 [1:25:57<2:12:23,  4.61s/it, lr: 1.0e-04 loss: 2.328e-02]mindexpander_qwen_v1:  43%|####2     | 1276/3000 [1:26:00<2:12:23,  4.61s/it, lr: 1.0e-04 loss: 1.877e-01]mindexpander_qwen_v1:  43%|####2     | 1276/3000 [1:26:00<2:12:23,  4.61s/it, lr: 1.0e-04 loss: 1.877e-01]mindexpander_qwen_v1:  43%|####2     | 1277/3000 [1:26:00<2:05:02,  4.35s/it, lr: 1.0e-04 loss: 1.877e-01]mindexpander_qwen_v1:  43%|####2     | 1277/3000 [1:26:00<2:05:02,  4.35s/it, lr: 1.0e-04 loss: 1.877e-01]mindexpander_qwen_v1:  43%|####2     | 1277/3000 [1:26:06<2:05:02,  4.35s/it, lr: 1.0e-04 loss: 1.699e-01]mindexpander_qwen_v1:  43%|####2     | 1277/3000 [1:26:06<2:05:02,  4.35s/it, lr: 1.0e-04 loss: 1.699e-01]mindexpander_qwen_v1:  43%|####2     | 1278/3000 [1:26:06<2:17:46,  4.80s/it, lr: 1.0e-04 loss: 1.699e-01]mindexpander_qwen_v1:  43%|####2     | 1278/3000 [1:26:06<2:17:46,  4.80s/it, lr: 1.0e-04 loss: 1.699e-01]mindexpander_qwen_v1:  43%|####2     | 1278/3000 [1:26:12<2:17:46,  4.80s/it, lr: 1.0e-04 loss: 2.248e-03]mindexpander_qwen_v1:  43%|####2     | 1278/3000 [1:26:12<2:17:46,  4.80s/it, lr: 1.0e-04 loss: 2.248e-03]mindexpander_qwen_v1:  43%|####2     | 1279/3000 [1:26:12<2:25:41,  5.08s/it, lr: 1.0e-04 loss: 2.248e-03]mindexpander_qwen_v1:  43%|####2     | 1279/3000 [1:26:12<2:25:41,  5.08s/it, lr: 1.0e-04 loss: 2.248e-03]mindexpander_qwen_v1:  43%|####2     | 1279/3000 [1:26:14<2:25:41,  5.08s/it, lr: 1.0e-04 loss: 2.116e-02]mindexpander_qwen_v1:  43%|####2     | 1279/3000 [1:26:14<2:25:41,  5.08s/it, lr: 1.0e-04 loss: 2.116e-02]mindexpander_qwen_v1:  43%|####2     | 1280/3000 [1:26:18<2:25:36,  5.08s/it, lr: 1.0e-04 loss: 9.732e-02]mindexpander_qwen_v1:  43%|####2     | 1280/3000 [1:26:18<2:25:36,  5.08s/it, lr: 1.0e-04 loss: 9.732e-02]mindexpander_qwen_v1:  43%|####2     | 1281/3000 [1:26:18<1:43:25,  3.61s/it, lr: 1.0e-04 loss: 9.732e-02]mindexpander_qwen_v1:  43%|####2     | 1281/3000 [1:26:18<1:43:25,  3.61s/it, lr: 1.0e-04 loss: 9.732e-02]mindexpander_qwen_v1:  43%|####2     | 1281/3000 [1:26:21<1:43:25,  3.61s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:  43%|####2     | 1281/3000 [1:26:21<1:43:25,  3.61s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:  43%|####2     | 1282/3000 [1:26:21<1:36:41,  3.38s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:  43%|####2     | 1282/3000 [1:26:21<1:36:41,  3.38s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:  43%|####2     | 1282/3000 [1:26:25<1:36:41,  3.38s/it, lr: 1.0e-04 loss: 1.756e-01]mindexpander_qwen_v1:  43%|####2     | 1282/3000 [1:26:25<1:36:41,  3.38s/it, lr: 1.0e-04 loss: 1.756e-01]mindexpander_qwen_v1:  43%|####2     | 1283/3000 [1:26:25<1:39:19,  3.47s/it, lr: 1.0e-04 loss: 1.756e-01]mindexpander_qwen_v1:  43%|####2     | 1283/3000 [1:26:25<1:39:19,  3.47s/it, lr: 1.0e-04 loss: 1.756e-01]mindexpander_qwen_v1:  43%|####2     | 1283/3000 [1:26:28<1:39:19,  3.47s/it, lr: 1.0e-04 loss: 1.700e-01]mindexpander_qwen_v1:  43%|####2     | 1283/3000 [1:26:28<1:39:19,  3.47s/it, lr: 1.0e-04 loss: 1.700e-01]mindexpander_qwen_v1:  43%|####2     | 1284/3000 [1:26:28<1:41:36,  3.55s/it, lr: 1.0e-04 loss: 1.700e-01]mindexpander_qwen_v1:  43%|####2     | 1284/3000 [1:26:28<1:41:36,  3.55s/it, lr: 1.0e-04 loss: 1.700e-01]mindexpander_qwen_v1:  43%|####2     | 1284/3000 [1:26:34<1:41:36,  3.55s/it, lr: 1.0e-04 loss: 9.315e-02]mindexpander_qwen_v1:  43%|####2     | 1284/3000 [1:26:34<1:41:36,  3.55s/it, lr: 1.0e-04 loss: 9.315e-02]mindexpander_qwen_v1:  43%|####2     | 1285/3000 [1:26:34<1:59:40,  4.19s/it, lr: 1.0e-04 loss: 9.315e-02]mindexpander_qwen_v1:  43%|####2     | 1285/3000 [1:26:34<1:59:40,  4.19s/it, lr: 1.0e-04 loss: 9.315e-02]mindexpander_qwen_v1:  43%|####2     | 1285/3000 [1:26:40<1:59:40,  4.19s/it, lr: 1.0e-04 loss: 8.835e-02]mindexpander_qwen_v1:  43%|####2     | 1285/3000 [1:26:40<1:59:40,  4.19s/it, lr: 1.0e-04 loss: 8.835e-02]mindexpander_qwen_v1:  43%|####2     | 1286/3000 [1:26:40<2:14:23,  4.70s/it, lr: 1.0e-04 loss: 8.835e-02]mindexpander_qwen_v1:  43%|####2     | 1286/3000 [1:26:40<2:14:23,  4.70s/it, lr: 1.0e-04 loss: 8.835e-02]mindexpander_qwen_v1:  43%|####2     | 1286/3000 [1:26:43<2:14:23,  4.70s/it, lr: 1.0e-04 loss: 2.274e-02]mindexpander_qwen_v1:  43%|####2     | 1286/3000 [1:26:43<2:14:23,  4.70s/it, lr: 1.0e-04 loss: 2.274e-02]mindexpander_qwen_v1:  43%|####2     | 1287/3000 [1:26:43<1:56:45,  4.09s/it, lr: 1.0e-04 loss: 2.274e-02]mindexpander_qwen_v1:  43%|####2     | 1287/3000 [1:26:43<1:56:45,  4.09s/it, lr: 1.0e-04 loss: 2.274e-02]mindexpander_qwen_v1:  43%|####2     | 1287/3000 [1:26:45<1:56:45,  4.09s/it, lr: 1.0e-04 loss: 2.014e-01]mindexpander_qwen_v1:  43%|####2     | 1287/3000 [1:26:45<1:56:45,  4.09s/it, lr: 1.0e-04 loss: 2.014e-01]mindexpander_qwen_v1:  43%|####2     | 1288/3000 [1:26:45<1:44:18,  3.66s/it, lr: 1.0e-04 loss: 2.014e-01]mindexpander_qwen_v1:  43%|####2     | 1288/3000 [1:26:45<1:44:18,  3.66s/it, lr: 1.0e-04 loss: 2.014e-01]mindexpander_qwen_v1:  43%|####2     | 1288/3000 [1:26:49<1:44:18,  3.66s/it, lr: 1.0e-04 loss: 1.832e-01]mindexpander_qwen_v1:  43%|####2     | 1288/3000 [1:26:49<1:44:18,  3.66s/it, lr: 1.0e-04 loss: 1.832e-01]mindexpander_qwen_v1:  43%|####2     | 1289/3000 [1:26:49<1:45:20,  3.69s/it, lr: 1.0e-04 loss: 1.832e-01]mindexpander_qwen_v1:  43%|####2     | 1289/3000 [1:26:49<1:45:20,  3.69s/it, lr: 1.0e-04 loss: 1.832e-01]mindexpander_qwen_v1:  43%|####2     | 1289/3000 [1:26:54<1:45:20,  3.69s/it, lr: 1.0e-04 loss: 1.494e-01]mindexpander_qwen_v1:  43%|####2     | 1289/3000 [1:26:54<1:45:20,  3.69s/it, lr: 1.0e-04 loss: 1.494e-01]mindexpander_qwen_v1:  43%|####3     | 1290/3000 [1:26:58<1:45:16,  3.69s/it, lr: 1.0e-04 loss: 1.768e-01]mindexpander_qwen_v1:  43%|####3     | 1290/3000 [1:26:58<1:45:16,  3.69s/it, lr: 1.0e-04 loss: 1.768e-01]mindexpander_qwen_v1:  43%|####3     | 1291/3000 [1:26:58<1:23:47,  2.94s/it, lr: 1.0e-04 loss: 1.768e-01]mindexpander_qwen_v1:  43%|####3     | 1291/3000 [1:26:58<1:23:47,  2.94s/it, lr: 1.0e-04 loss: 1.768e-01]mindexpander_qwen_v1:  43%|####3     | 1291/3000 [1:27:00<1:23:47,  2.94s/it, lr: 1.0e-04 loss: 3.049e-02]mindexpander_qwen_v1:  43%|####3     | 1291/3000 [1:27:00<1:23:47,  2.94s/it, lr: 1.0e-04 loss: 3.049e-02]mindexpander_qwen_v1:  43%|####3     | 1292/3000 [1:27:00<1:20:30,  2.83s/it, lr: 1.0e-04 loss: 3.049e-02]mindexpander_qwen_v1:  43%|####3     | 1292/3000 [1:27:00<1:20:30,  2.83s/it, lr: 1.0e-04 loss: 3.049e-02]mindexpander_qwen_v1:  43%|####3     | 1292/3000 [1:27:03<1:20:30,  2.83s/it, lr: 1.0e-04 loss: 1.857e-01]mindexpander_qwen_v1:  43%|####3     | 1292/3000 [1:27:03<1:20:30,  2.83s/it, lr: 1.0e-04 loss: 1.857e-01]mindexpander_qwen_v1:  43%|####3     | 1293/3000 [1:27:03<1:17:46,  2.73s/it, lr: 1.0e-04 loss: 1.857e-01]mindexpander_qwen_v1:  43%|####3     | 1293/3000 [1:27:03<1:17:46,  2.73s/it, lr: 1.0e-04 loss: 1.857e-01]mindexpander_qwen_v1:  43%|####3     | 1293/3000 [1:27:07<1:17:46,  2.73s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  43%|####3     | 1293/3000 [1:27:07<1:17:46,  2.73s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  43%|####3     | 1294/3000 [1:27:07<1:26:45,  3.05s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  43%|####3     | 1294/3000 [1:27:07<1:26:45,  3.05s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  43%|####3     | 1294/3000 [1:27:13<1:26:45,  3.05s/it, lr: 1.0e-04 loss: 4.127e-02]mindexpander_qwen_v1:  43%|####3     | 1294/3000 [1:27:13<1:26:45,  3.05s/it, lr: 1.0e-04 loss: 4.127e-02]mindexpander_qwen_v1:  43%|####3     | 1295/3000 [1:27:13<1:50:08,  3.88s/it, lr: 1.0e-04 loss: 4.127e-02]mindexpander_qwen_v1:  43%|####3     | 1295/3000 [1:27:13<1:50:08,  3.88s/it, lr: 1.0e-04 loss: 4.127e-02]mindexpander_qwen_v1:  43%|####3     | 1295/3000 [1:27:16<1:50:08,  3.88s/it, lr: 1.0e-04 loss: 5.296e-02]mindexpander_qwen_v1:  43%|####3     | 1295/3000 [1:27:16<1:50:08,  3.88s/it, lr: 1.0e-04 loss: 5.296e-02]mindexpander_qwen_v1:  43%|####3     | 1296/3000 [1:27:16<1:48:55,  3.84s/it, lr: 1.0e-04 loss: 5.296e-02]mindexpander_qwen_v1:  43%|####3     | 1296/3000 [1:27:16<1:48:55,  3.84s/it, lr: 1.0e-04 loss: 5.296e-02]mindexpander_qwen_v1:  43%|####3     | 1296/3000 [1:27:19<1:48:55,  3.84s/it, lr: 1.0e-04 loss: 4.555e-03]mindexpander_qwen_v1:  43%|####3     | 1296/3000 [1:27:19<1:48:55,  3.84s/it, lr: 1.0e-04 loss: 4.555e-03]mindexpander_qwen_v1:  43%|####3     | 1297/3000 [1:27:19<1:38:54,  3.48s/it, lr: 1.0e-04 loss: 4.555e-03]mindexpander_qwen_v1:  43%|####3     | 1297/3000 [1:27:19<1:38:54,  3.48s/it, lr: 1.0e-04 loss: 4.555e-03]mindexpander_qwen_v1:  43%|####3     | 1297/3000 [1:27:25<1:38:54,  3.48s/it, lr: 1.0e-04 loss: 1.379e-01]mindexpander_qwen_v1:  43%|####3     | 1297/3000 [1:27:25<1:38:54,  3.48s/it, lr: 1.0e-04 loss: 1.379e-01]mindexpander_qwen_v1:  43%|####3     | 1298/3000 [1:27:25<1:57:35,  4.15s/it, lr: 1.0e-04 loss: 1.379e-01]mindexpander_qwen_v1:  43%|####3     | 1298/3000 [1:27:25<1:57:35,  4.15s/it, lr: 1.0e-04 loss: 1.379e-01]mindexpander_qwen_v1:  43%|####3     | 1298/3000 [1:27:27<1:57:35,  4.15s/it, lr: 1.0e-04 loss: 3.697e-02]mindexpander_qwen_v1:  43%|####3     | 1298/3000 [1:27:27<1:57:35,  4.15s/it, lr: 1.0e-04 loss: 3.697e-02]mindexpander_qwen_v1:  43%|####3     | 1299/3000 [1:27:27<1:43:23,  3.65s/it, lr: 1.0e-04 loss: 3.697e-02]mindexpander_qwen_v1:  43%|####3     | 1299/3000 [1:27:27<1:43:23,  3.65s/it, lr: 1.0e-04 loss: 3.697e-02]mindexpander_qwen_v1:  43%|####3     | 1299/3000 [1:27:33<1:43:23,  3.65s/it, lr: 1.0e-04 loss: 1.825e-01]mindexpander_qwen_v1:  43%|####3     | 1299/3000 [1:27:33<1:43:23,  3.65s/it, lr: 1.0e-04 loss: 1.825e-01]mindexpander_qwen_v1:  43%|####3     | 1300/3000 [1:27:39<1:43:19,  3.65s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  43%|####3     | 1300/3000 [1:27:39<1:43:19,  3.65s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  43%|####3     | 1301/3000 [1:27:39<1:34:15,  3.33s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  43%|####3     | 1301/3000 [1:27:39<1:34:15,  3.33s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  43%|####3     | 1301/3000 [1:27:43<1:34:15,  3.33s/it, lr: 1.0e-04 loss: 6.472e-02]mindexpander_qwen_v1:  43%|####3     | 1301/3000 [1:27:43<1:34:15,  3.33s/it, lr: 1.0e-04 loss: 6.472e-02]mindexpander_qwen_v1:  43%|####3     | 1302/3000 [1:27:43<1:36:59,  3.43s/it, lr: 1.0e-04 loss: 6.472e-02]mindexpander_qwen_v1:  43%|####3     | 1302/3000 [1:27:43<1:36:59,  3.43s/it, lr: 1.0e-04 loss: 6.472e-02]mindexpander_qwen_v1:  43%|####3     | 1302/3000 [1:27:46<1:36:59,  3.43s/it, lr: 1.0e-04 loss: 1.779e-01]mindexpander_qwen_v1:  43%|####3     | 1302/3000 [1:27:46<1:36:59,  3.43s/it, lr: 1.0e-04 loss: 1.779e-01]mindexpander_qwen_v1:  43%|####3     | 1303/3000 [1:27:46<1:39:10,  3.51s/it, lr: 1.0e-04 loss: 1.779e-01]mindexpander_qwen_v1:  43%|####3     | 1303/3000 [1:27:46<1:39:10,  3.51s/it, lr: 1.0e-04 loss: 1.779e-01]mindexpander_qwen_v1:  43%|####3     | 1303/3000 [1:27:49<1:39:10,  3.51s/it, lr: 1.0e-04 loss: 1.405e-01]mindexpander_qwen_v1:  43%|####3     | 1303/3000 [1:27:49<1:39:10,  3.51s/it, lr: 1.0e-04 loss: 1.405e-01]mindexpander_qwen_v1:  43%|####3     | 1304/3000 [1:27:49<1:30:58,  3.22s/it, lr: 1.0e-04 loss: 1.405e-01]mindexpander_qwen_v1:  43%|####3     | 1304/3000 [1:27:49<1:30:58,  3.22s/it, lr: 1.0e-04 loss: 1.405e-01]mindexpander_qwen_v1:  43%|####3     | 1304/3000 [1:27:53<1:30:58,  3.22s/it, lr: 1.0e-04 loss: 1.090e-01]mindexpander_qwen_v1:  43%|####3     | 1304/3000 [1:27:53<1:30:58,  3.22s/it, lr: 1.0e-04 loss: 1.090e-01]mindexpander_qwen_v1:  44%|####3     | 1305/3000 [1:27:53<1:36:22,  3.41s/it, lr: 1.0e-04 loss: 1.090e-01]mindexpander_qwen_v1:  44%|####3     | 1305/3000 [1:27:53<1:36:22,  3.41s/it, lr: 1.0e-04 loss: 1.090e-01]mindexpander_qwen_v1:  44%|####3     | 1305/3000 [1:27:58<1:36:22,  3.41s/it, lr: 1.0e-04 loss: 6.991e-02]mindexpander_qwen_v1:  44%|####3     | 1305/3000 [1:27:58<1:36:22,  3.41s/it, lr: 1.0e-04 loss: 6.991e-02]mindexpander_qwen_v1:  44%|####3     | 1306/3000 [1:27:58<1:55:08,  4.08s/it, lr: 1.0e-04 loss: 6.991e-02]mindexpander_qwen_v1:  44%|####3     | 1306/3000 [1:27:58<1:55:08,  4.08s/it, lr: 1.0e-04 loss: 6.991e-02]mindexpander_qwen_v1:  44%|####3     | 1306/3000 [1:28:01<1:55:08,  4.08s/it, lr: 1.0e-04 loss: 6.737e-02]mindexpander_qwen_v1:  44%|####3     | 1306/3000 [1:28:01<1:55:08,  4.08s/it, lr: 1.0e-04 loss: 6.737e-02]mindexpander_qwen_v1:  44%|####3     | 1307/3000 [1:28:01<1:41:45,  3.61s/it, lr: 1.0e-04 loss: 6.737e-02]mindexpander_qwen_v1:  44%|####3     | 1307/3000 [1:28:01<1:41:45,  3.61s/it, lr: 1.0e-04 loss: 6.737e-02]mindexpander_qwen_v1:  44%|####3     | 1307/3000 [1:28:03<1:41:45,  3.61s/it, lr: 1.0e-04 loss: 1.048e-02]mindexpander_qwen_v1:  44%|####3     | 1307/3000 [1:28:03<1:41:45,  3.61s/it, lr: 1.0e-04 loss: 1.048e-02]mindexpander_qwen_v1:  44%|####3     | 1308/3000 [1:28:03<1:32:05,  3.27s/it, lr: 1.0e-04 loss: 1.048e-02]mindexpander_qwen_v1:  44%|####3     | 1308/3000 [1:28:03<1:32:05,  3.27s/it, lr: 1.0e-04 loss: 1.048e-02]mindexpander_qwen_v1:  44%|####3     | 1308/3000 [1:28:06<1:32:05,  3.27s/it, lr: 1.0e-04 loss: 3.267e-02]mindexpander_qwen_v1:  44%|####3     | 1308/3000 [1:28:06<1:32:05,  3.27s/it, lr: 1.0e-04 loss: 3.267e-02]mindexpander_qwen_v1:  44%|####3     | 1309/3000 [1:28:06<1:26:50,  3.08s/it, lr: 1.0e-04 loss: 3.267e-02]mindexpander_qwen_v1:  44%|####3     | 1309/3000 [1:28:06<1:26:50,  3.08s/it, lr: 1.0e-04 loss: 3.267e-02]mindexpander_qwen_v1:  44%|####3     | 1309/3000 [1:28:10<1:26:50,  3.08s/it, lr: 1.0e-04 loss: 1.852e-01]mindexpander_qwen_v1:  44%|####3     | 1309/3000 [1:28:10<1:26:50,  3.08s/it, lr: 1.0e-04 loss: 1.852e-01]mindexpander_qwen_v1:  44%|####3     | 1310/3000 [1:28:12<1:26:46,  3.08s/it, lr: 1.0e-04 loss: 2.079e-02]mindexpander_qwen_v1:  44%|####3     | 1310/3000 [1:28:12<1:26:46,  3.08s/it, lr: 1.0e-04 loss: 2.079e-02]mindexpander_qwen_v1:  44%|####3     | 1311/3000 [1:28:12<1:02:49,  2.23s/it, lr: 1.0e-04 loss: 2.079e-02]mindexpander_qwen_v1:  44%|####3     | 1311/3000 [1:28:12<1:02:49,  2.23s/it, lr: 1.0e-04 loss: 2.079e-02]mindexpander_qwen_v1:  44%|####3     | 1311/3000 [1:28:16<1:02:49,  2.23s/it, lr: 1.0e-04 loss: 1.973e-01]mindexpander_qwen_v1:  44%|####3     | 1311/3000 [1:28:16<1:02:49,  2.23s/it, lr: 1.0e-04 loss: 1.973e-01]mindexpander_qwen_v1:  44%|####3     | 1312/3000 [1:28:16<1:13:14,  2.60s/it, lr: 1.0e-04 loss: 1.973e-01]mindexpander_qwen_v1:  44%|####3     | 1312/3000 [1:28:16<1:13:14,  2.60s/it, lr: 1.0e-04 loss: 1.973e-01]mindexpander_qwen_v1:  44%|####3     | 1312/3000 [1:28:22<1:13:14,  2.60s/it, lr: 1.0e-04 loss: 9.628e-03]mindexpander_qwen_v1:  44%|####3     | 1312/3000 [1:28:22<1:13:14,  2.60s/it, lr: 1.0e-04 loss: 9.628e-03]mindexpander_qwen_v1:  44%|####3     | 1313/3000 [1:28:22<1:37:13,  3.46s/it, lr: 1.0e-04 loss: 9.628e-03]mindexpander_qwen_v1:  44%|####3     | 1313/3000 [1:28:22<1:37:13,  3.46s/it, lr: 1.0e-04 loss: 9.628e-03]mindexpander_qwen_v1:  44%|####3     | 1313/3000 [1:28:25<1:37:13,  3.46s/it, lr: 1.0e-04 loss: 7.588e-02]mindexpander_qwen_v1:  44%|####3     | 1313/3000 [1:28:25<1:37:13,  3.46s/it, lr: 1.0e-04 loss: 7.588e-02]mindexpander_qwen_v1:  44%|####3     | 1314/3000 [1:28:25<1:39:21,  3.54s/it, lr: 1.0e-04 loss: 7.588e-02]mindexpander_qwen_v1:  44%|####3     | 1314/3000 [1:28:25<1:39:21,  3.54s/it, lr: 1.0e-04 loss: 7.588e-02]mindexpander_qwen_v1:  44%|####3     | 1314/3000 [1:28:31<1:39:21,  3.54s/it, lr: 1.0e-04 loss: 7.341e-03]mindexpander_qwen_v1:  44%|####3     | 1314/3000 [1:28:31<1:39:21,  3.54s/it, lr: 1.0e-04 loss: 7.341e-03]mindexpander_qwen_v1:  44%|####3     | 1315/3000 [1:28:31<1:56:38,  4.15s/it, lr: 1.0e-04 loss: 7.341e-03]mindexpander_qwen_v1:  44%|####3     | 1315/3000 [1:28:31<1:56:38,  4.15s/it, lr: 1.0e-04 loss: 7.341e-03]mindexpander_qwen_v1:  44%|####3     | 1315/3000 [1:28:37<1:56:38,  4.15s/it, lr: 1.0e-04 loss: 2.213e-02]mindexpander_qwen_v1:  44%|####3     | 1315/3000 [1:28:37<1:56:38,  4.15s/it, lr: 1.0e-04 loss: 2.213e-02]mindexpander_qwen_v1:  44%|####3     | 1316/3000 [1:28:37<2:09:21,  4.61s/it, lr: 1.0e-04 loss: 2.213e-02]mindexpander_qwen_v1:  44%|####3     | 1316/3000 [1:28:37<2:09:21,  4.61s/it, lr: 1.0e-04 loss: 2.213e-02]mindexpander_qwen_v1:  44%|####3     | 1316/3000 [1:28:40<2:09:21,  4.61s/it, lr: 1.0e-04 loss: 8.994e-02]mindexpander_qwen_v1:  44%|####3     | 1316/3000 [1:28:40<2:09:21,  4.61s/it, lr: 1.0e-04 loss: 8.994e-02]mindexpander_qwen_v1:  44%|####3     | 1317/3000 [1:28:40<1:53:11,  4.04s/it, lr: 1.0e-04 loss: 8.994e-02]mindexpander_qwen_v1:  44%|####3     | 1317/3000 [1:28:40<1:53:11,  4.04s/it, lr: 1.0e-04 loss: 8.994e-02]mindexpander_qwen_v1:  44%|####3     | 1317/3000 [1:28:45<1:53:11,  4.04s/it, lr: 1.0e-04 loss: 1.316e-01]mindexpander_qwen_v1:  44%|####3     | 1317/3000 [1:28:45<1:53:11,  4.04s/it, lr: 1.0e-04 loss: 1.316e-01]mindexpander_qwen_v1:  44%|####3     | 1318/3000 [1:28:45<2:07:14,  4.54s/it, lr: 1.0e-04 loss: 1.316e-01]mindexpander_qwen_v1:  44%|####3     | 1318/3000 [1:28:45<2:07:14,  4.54s/it, lr: 1.0e-04 loss: 1.316e-01]mindexpander_qwen_v1:  44%|####3     | 1318/3000 [1:28:51<2:07:14,  4.54s/it, lr: 1.0e-04 loss: 9.527e-03]mindexpander_qwen_v1:  44%|####3     | 1318/3000 [1:28:51<2:07:14,  4.54s/it, lr: 1.0e-04 loss: 9.527e-03]mindexpander_qwen_v1:  44%|####3     | 1319/3000 [1:28:51<2:17:10,  4.90s/it, lr: 1.0e-04 loss: 9.527e-03]mindexpander_qwen_v1:  44%|####3     | 1319/3000 [1:28:51<2:17:10,  4.90s/it, lr: 1.0e-04 loss: 9.527e-03]mindexpander_qwen_v1:  44%|####3     | 1319/3000 [1:28:55<2:17:10,  4.90s/it, lr: 1.0e-04 loss: 1.503e-01]mindexpander_qwen_v1:  44%|####3     | 1319/3000 [1:28:55<2:17:10,  4.90s/it, lr: 1.0e-04 loss: 1.503e-01]mindexpander_qwen_v1:  44%|####4     | 1320/3000 [1:29:01<2:17:05,  4.90s/it, lr: 1.0e-04 loss: 1.328e-01]mindexpander_qwen_v1:  44%|####4     | 1320/3000 [1:29:01<2:17:05,  4.90s/it, lr: 1.0e-04 loss: 1.328e-01]mindexpander_qwen_v1:  44%|####4     | 1321/3000 [1:29:01<1:52:32,  4.02s/it, lr: 1.0e-04 loss: 1.328e-01]mindexpander_qwen_v1:  44%|####4     | 1321/3000 [1:29:01<1:52:32,  4.02s/it, lr: 1.0e-04 loss: 1.328e-01]mindexpander_qwen_v1:  44%|####4     | 1321/3000 [1:29:05<1:52:32,  4.02s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  44%|####4     | 1321/3000 [1:29:05<1:52:32,  4.02s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  44%|####4     | 1322/3000 [1:29:05<1:50:29,  3.95s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  44%|####4     | 1322/3000 [1:29:05<1:50:29,  3.95s/it, lr: 1.0e-04 loss: 1.060e-01]mindexpander_qwen_v1:  44%|####4     | 1322/3000 [1:29:11<1:50:29,  3.95s/it, lr: 1.0e-04 loss: 1.576e-01]mindexpander_qwen_v1:  44%|####4     | 1322/3000 [1:29:11<1:50:29,  3.95s/it, lr: 1.0e-04 loss: 1.576e-01]mindexpander_qwen_v1:  44%|####4     | 1323/3000 [1:29:11<2:03:28,  4.42s/it, lr: 1.0e-04 loss: 1.576e-01]mindexpander_qwen_v1:  44%|####4     | 1323/3000 [1:29:11<2:03:28,  4.42s/it, lr: 1.0e-04 loss: 1.576e-01]mindexpander_qwen_v1:  44%|####4     | 1323/3000 [1:29:16<2:03:28,  4.42s/it, lr: 1.0e-04 loss: 8.889e-02]mindexpander_qwen_v1:  44%|####4     | 1323/3000 [1:29:16<2:03:28,  4.42s/it, lr: 1.0e-04 loss: 8.889e-02]mindexpander_qwen_v1:  44%|####4     | 1324/3000 [1:29:16<2:13:28,  4.78s/it, lr: 1.0e-04 loss: 8.889e-02]mindexpander_qwen_v1:  44%|####4     | 1324/3000 [1:29:16<2:13:28,  4.78s/it, lr: 1.0e-04 loss: 8.889e-02]mindexpander_qwen_v1:  44%|####4     | 1324/3000 [1:29:20<2:13:28,  4.78s/it, lr: 1.0e-04 loss: 8.053e-02]mindexpander_qwen_v1:  44%|####4     | 1324/3000 [1:29:20<2:13:28,  4.78s/it, lr: 1.0e-04 loss: 8.053e-02]mindexpander_qwen_v1:  44%|####4     | 1325/3000 [1:29:20<2:06:46,  4.54s/it, lr: 1.0e-04 loss: 8.053e-02]mindexpander_qwen_v1:  44%|####4     | 1325/3000 [1:29:20<2:06:46,  4.54s/it, lr: 1.0e-04 loss: 8.053e-02]mindexpander_qwen_v1:  44%|####4     | 1325/3000 [1:29:26<2:06:46,  4.54s/it, lr: 1.0e-04 loss: 1.758e-02]mindexpander_qwen_v1:  44%|####4     | 1325/3000 [1:29:26<2:06:46,  4.54s/it, lr: 1.0e-04 loss: 1.758e-02]mindexpander_qwen_v1:  44%|####4     | 1326/3000 [1:29:26<2:16:20,  4.89s/it, lr: 1.0e-04 loss: 1.758e-02]mindexpander_qwen_v1:  44%|####4     | 1326/3000 [1:29:26<2:16:20,  4.89s/it, lr: 1.0e-04 loss: 1.758e-02]mindexpander_qwen_v1:  44%|####4     | 1326/3000 [1:29:30<2:16:20,  4.89s/it, lr: 1.0e-04 loss: 1.930e-01]mindexpander_qwen_v1:  44%|####4     | 1326/3000 [1:29:30<2:16:20,  4.89s/it, lr: 1.0e-04 loss: 1.930e-01]mindexpander_qwen_v1:  44%|####4     | 1327/3000 [1:29:30<2:07:00,  4.56s/it, lr: 1.0e-04 loss: 1.930e-01]mindexpander_qwen_v1:  44%|####4     | 1327/3000 [1:29:30<2:07:00,  4.56s/it, lr: 1.0e-04 loss: 1.930e-01]mindexpander_qwen_v1:  44%|####4     | 1327/3000 [1:29:32<2:07:00,  4.56s/it, lr: 1.0e-04 loss: 1.248e-02]mindexpander_qwen_v1:  44%|####4     | 1327/3000 [1:29:32<2:07:00,  4.56s/it, lr: 1.0e-04 loss: 1.248e-02]mindexpander_qwen_v1:  44%|####4     | 1328/3000 [1:29:32<1:49:48,  3.94s/it, lr: 1.0e-04 loss: 1.248e-02]mindexpander_qwen_v1:  44%|####4     | 1328/3000 [1:29:32<1:49:48,  3.94s/it, lr: 1.0e-04 loss: 1.248e-02]mindexpander_qwen_v1:  44%|####4     | 1328/3000 [1:29:38<1:49:48,  3.94s/it, lr: 1.0e-04 loss: 1.530e-01]mindexpander_qwen_v1:  44%|####4     | 1328/3000 [1:29:38<1:49:48,  3.94s/it, lr: 1.0e-04 loss: 1.530e-01]mindexpander_qwen_v1:  44%|####4     | 1329/3000 [1:29:38<2:05:53,  4.52s/it, lr: 1.0e-04 loss: 1.530e-01]mindexpander_qwen_v1:  44%|####4     | 1329/3000 [1:29:38<2:05:53,  4.52s/it, lr: 1.0e-04 loss: 1.530e-01]mindexpander_qwen_v1:  44%|####4     | 1329/3000 [1:29:41<2:05:53,  4.52s/it, lr: 1.0e-04 loss: 1.714e-01]mindexpander_qwen_v1:  44%|####4     | 1329/3000 [1:29:41<2:05:53,  4.52s/it, lr: 1.0e-04 loss: 1.714e-01]mindexpander_qwen_v1:  44%|####4     | 1330/3000 [1:29:43<2:05:48,  4.52s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  44%|####4     | 1330/3000 [1:29:43<2:05:48,  4.52s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  44%|####4     | 1331/3000 [1:29:43<1:23:48,  3.01s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  44%|####4     | 1331/3000 [1:29:43<1:23:48,  3.01s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  44%|####4     | 1331/3000 [1:29:47<1:23:48,  3.01s/it, lr: 1.0e-04 loss: 8.968e-02]mindexpander_qwen_v1:  44%|####4     | 1331/3000 [1:29:47<1:23:48,  3.01s/it, lr: 1.0e-04 loss: 8.968e-02]mindexpander_qwen_v1:  44%|####4     | 1332/3000 [1:29:47<1:28:44,  3.19s/it, lr: 1.0e-04 loss: 8.968e-02]mindexpander_qwen_v1:  44%|####4     | 1332/3000 [1:29:47<1:28:44,  3.19s/it, lr: 1.0e-04 loss: 8.968e-02]mindexpander_qwen_v1:  44%|####4     | 1332/3000 [1:29:51<1:28:44,  3.19s/it, lr: 1.0e-04 loss: 1.754e-01]mindexpander_qwen_v1:  44%|####4     | 1332/3000 [1:29:51<1:28:44,  3.19s/it, lr: 1.0e-04 loss: 1.754e-01]mindexpander_qwen_v1:  44%|####4     | 1333/3000 [1:29:51<1:33:53,  3.38s/it, lr: 1.0e-04 loss: 1.754e-01]mindexpander_qwen_v1:  44%|####4     | 1333/3000 [1:29:51<1:33:53,  3.38s/it, lr: 1.0e-04 loss: 1.754e-01]mindexpander_qwen_v1:  44%|####4     | 1333/3000 [1:29:56<1:33:53,  3.38s/it, lr: 1.0e-04 loss: 1.181e-01]mindexpander_qwen_v1:  44%|####4     | 1333/3000 [1:29:56<1:33:53,  3.38s/it, lr: 1.0e-04 loss: 1.181e-01]mindexpander_qwen_v1:  44%|####4     | 1334/3000 [1:29:56<1:51:40,  4.02s/it, lr: 1.0e-04 loss: 1.181e-01]mindexpander_qwen_v1:  44%|####4     | 1334/3000 [1:29:56<1:51:40,  4.02s/it, lr: 1.0e-04 loss: 1.181e-01]mindexpander_qwen_v1:  44%|####4     | 1334/3000 [1:29:59<1:51:40,  4.02s/it, lr: 1.0e-04 loss: 1.606e-01]mindexpander_qwen_v1:  44%|####4     | 1334/3000 [1:29:59<1:51:40,  4.02s/it, lr: 1.0e-04 loss: 1.606e-01]mindexpander_qwen_v1:  44%|####4     | 1335/3000 [1:29:59<1:39:25,  3.58s/it, lr: 1.0e-04 loss: 1.606e-01]mindexpander_qwen_v1:  44%|####4     | 1335/3000 [1:29:59<1:39:25,  3.58s/it, lr: 1.0e-04 loss: 1.606e-01]mindexpander_qwen_v1:  44%|####4     | 1335/3000 [1:30:01<1:39:25,  3.58s/it, lr: 1.0e-04 loss: 2.955e-02]mindexpander_qwen_v1:  44%|####4     | 1335/3000 [1:30:01<1:39:25,  3.58s/it, lr: 1.0e-04 loss: 2.955e-02]mindexpander_qwen_v1:  45%|####4     | 1336/3000 [1:30:01<1:30:20,  3.26s/it, lr: 1.0e-04 loss: 2.955e-02]mindexpander_qwen_v1:  45%|####4     | 1336/3000 [1:30:01<1:30:20,  3.26s/it, lr: 1.0e-04 loss: 2.955e-02]mindexpander_qwen_v1:  45%|####4     | 1336/3000 [1:30:07<1:30:20,  3.26s/it, lr: 1.0e-04 loss: 1.834e-01]mindexpander_qwen_v1:  45%|####4     | 1336/3000 [1:30:07<1:30:20,  3.26s/it, lr: 1.0e-04 loss: 1.834e-01]mindexpander_qwen_v1:  45%|####4     | 1337/3000 [1:30:07<1:51:21,  4.02s/it, lr: 1.0e-04 loss: 1.834e-01]mindexpander_qwen_v1:  45%|####4     | 1337/3000 [1:30:07<1:51:21,  4.02s/it, lr: 1.0e-04 loss: 1.834e-01]mindexpander_qwen_v1:  45%|####4     | 1337/3000 [1:30:11<1:51:21,  4.02s/it, lr: 1.0e-04 loss: 1.588e-01]mindexpander_qwen_v1:  45%|####4     | 1337/3000 [1:30:11<1:51:21,  4.02s/it, lr: 1.0e-04 loss: 1.588e-01]mindexpander_qwen_v1:  45%|####4     | 1338/3000 [1:30:11<1:49:01,  3.94s/it, lr: 1.0e-04 loss: 1.588e-01]mindexpander_qwen_v1:  45%|####4     | 1338/3000 [1:30:11<1:49:01,  3.94s/it, lr: 1.0e-04 loss: 1.588e-01]mindexpander_qwen_v1:  45%|####4     | 1338/3000 [1:30:13<1:49:01,  3.94s/it, lr: 1.0e-04 loss: 1.723e-02]mindexpander_qwen_v1:  45%|####4     | 1338/3000 [1:30:13<1:49:01,  3.94s/it, lr: 1.0e-04 loss: 1.723e-02]mindexpander_qwen_v1:  45%|####4     | 1339/3000 [1:30:13<1:36:47,  3.50s/it, lr: 1.0e-04 loss: 1.723e-02]mindexpander_qwen_v1:  45%|####4     | 1339/3000 [1:30:13<1:36:47,  3.50s/it, lr: 1.0e-04 loss: 1.723e-02]mindexpander_qwen_v1:  45%|####4     | 1339/3000 [1:30:17<1:36:47,  3.50s/it, lr: 1.0e-04 loss: 8.598e-02]mindexpander_qwen_v1:  45%|####4     | 1339/3000 [1:30:17<1:36:47,  3.50s/it, lr: 1.0e-04 loss: 8.598e-02]mindexpander_qwen_v1:  45%|####4     | 1340/3000 [1:30:21<1:36:43,  3.50s/it, lr: 1.0e-04 loss: 4.395e-02]mindexpander_qwen_v1:  45%|####4     | 1340/3000 [1:30:21<1:36:43,  3.50s/it, lr: 1.0e-04 loss: 4.395e-02]mindexpander_qwen_v1:  45%|####4     | 1341/3000 [1:30:21<1:17:10,  2.79s/it, lr: 1.0e-04 loss: 4.395e-02]mindexpander_qwen_v1:  45%|####4     | 1341/3000 [1:30:21<1:17:10,  2.79s/it, lr: 1.0e-04 loss: 4.395e-02]mindexpander_qwen_v1:  45%|####4     | 1341/3000 [1:30:27<1:17:10,  2.79s/it, lr: 1.0e-04 loss: 9.171e-02]mindexpander_qwen_v1:  45%|####4     | 1341/3000 [1:30:27<1:17:10,  2.79s/it, lr: 1.0e-04 loss: 9.171e-02]mindexpander_qwen_v1:  45%|####4     | 1342/3000 [1:30:27<1:37:15,  3.52s/it, lr: 1.0e-04 loss: 9.171e-02]mindexpander_qwen_v1:  45%|####4     | 1342/3000 [1:30:27<1:37:15,  3.52s/it, lr: 1.0e-04 loss: 9.171e-02]mindexpander_qwen_v1:  45%|####4     | 1342/3000 [1:30:33<1:37:15,  3.52s/it, lr: 1.0e-04 loss: 2.903e-02]mindexpander_qwen_v1:  45%|####4     | 1342/3000 [1:30:33<1:37:15,  3.52s/it, lr: 1.0e-04 loss: 2.903e-02]mindexpander_qwen_v1:  45%|####4     | 1343/3000 [1:30:33<1:53:13,  4.10s/it, lr: 1.0e-04 loss: 2.903e-02]mindexpander_qwen_v1:  45%|####4     | 1343/3000 [1:30:33<1:53:13,  4.10s/it, lr: 1.0e-04 loss: 2.903e-02]mindexpander_qwen_v1:  45%|####4     | 1343/3000 [1:30:38<1:53:13,  4.10s/it, lr: 1.0e-04 loss: 4.332e-02]mindexpander_qwen_v1:  45%|####4     | 1343/3000 [1:30:38<1:53:13,  4.10s/it, lr: 1.0e-04 loss: 4.332e-02]mindexpander_qwen_v1:  45%|####4     | 1344/3000 [1:30:38<2:05:31,  4.55s/it, lr: 1.0e-04 loss: 4.332e-02]mindexpander_qwen_v1:  45%|####4     | 1344/3000 [1:30:38<2:05:31,  4.55s/it, lr: 1.0e-04 loss: 4.332e-02]mindexpander_qwen_v1:  45%|####4     | 1344/3000 [1:30:41<2:05:31,  4.55s/it, lr: 1.0e-04 loss: 1.147e-01]mindexpander_qwen_v1:  45%|####4     | 1344/3000 [1:30:41<2:05:31,  4.55s/it, lr: 1.0e-04 loss: 1.147e-01]mindexpander_qwen_v1:  45%|####4     | 1345/3000 [1:30:41<1:50:45,  4.02s/it, lr: 1.0e-04 loss: 1.147e-01]mindexpander_qwen_v1:  45%|####4     | 1345/3000 [1:30:41<1:50:45,  4.02s/it, lr: 1.0e-04 loss: 1.147e-01]mindexpander_qwen_v1:  45%|####4     | 1345/3000 [1:30:43<1:50:45,  4.02s/it, lr: 1.0e-04 loss: 1.217e-01]mindexpander_qwen_v1:  45%|####4     | 1345/3000 [1:30:43<1:50:45,  4.02s/it, lr: 1.0e-04 loss: 1.217e-01]mindexpander_qwen_v1:  45%|####4     | 1346/3000 [1:30:43<1:38:20,  3.57s/it, lr: 1.0e-04 loss: 1.217e-01]mindexpander_qwen_v1:  45%|####4     | 1346/3000 [1:30:43<1:38:20,  3.57s/it, lr: 1.0e-04 loss: 1.217e-01]mindexpander_qwen_v1:  45%|####4     | 1346/3000 [1:30:47<1:38:20,  3.57s/it, lr: 1.0e-04 loss: 1.865e-01]mindexpander_qwen_v1:  45%|####4     | 1346/3000 [1:30:47<1:38:20,  3.57s/it, lr: 1.0e-04 loss: 1.865e-01]mindexpander_qwen_v1:  45%|####4     | 1347/3000 [1:30:47<1:39:39,  3.62s/it, lr: 1.0e-04 loss: 1.865e-01]mindexpander_qwen_v1:  45%|####4     | 1347/3000 [1:30:47<1:39:39,  3.62s/it, lr: 1.0e-04 loss: 1.865e-01]mindexpander_qwen_v1:  45%|####4     | 1347/3000 [1:30:50<1:39:39,  3.62s/it, lr: 1.0e-04 loss: 1.215e-01]mindexpander_qwen_v1:  45%|####4     | 1347/3000 [1:30:50<1:39:39,  3.62s/it, lr: 1.0e-04 loss: 1.215e-01]mindexpander_qwen_v1:  45%|####4     | 1348/3000 [1:30:50<1:30:06,  3.27s/it, lr: 1.0e-04 loss: 1.215e-01]mindexpander_qwen_v1:  45%|####4     | 1348/3000 [1:30:50<1:30:06,  3.27s/it, lr: 1.0e-04 loss: 1.215e-01]mindexpander_qwen_v1:  45%|####4     | 1348/3000 [1:30:52<1:30:06,  3.27s/it, lr: 1.0e-04 loss: 6.320e-02]mindexpander_qwen_v1:  45%|####4     | 1348/3000 [1:30:52<1:30:06,  3.27s/it, lr: 1.0e-04 loss: 6.320e-02]mindexpander_qwen_v1:  45%|####4     | 1349/3000 [1:30:52<1:24:52,  3.08s/it, lr: 1.0e-04 loss: 6.320e-02]mindexpander_qwen_v1:  45%|####4     | 1349/3000 [1:30:52<1:24:52,  3.08s/it, lr: 1.0e-04 loss: 6.320e-02]mindexpander_qwen_v1:  45%|####4     | 1349/3000 [1:30:56<1:24:52,  3.08s/it, lr: 1.0e-04 loss: 1.749e-02]mindexpander_qwen_v1:  45%|####4     | 1349/3000 [1:30:56<1:24:52,  3.08s/it, lr: 1.0e-04 loss: 1.749e-02]mindexpander_qwen_v1:  45%|####5     | 1350/3000 [1:30:59<1:24:49,  3.08s/it, lr: 1.0e-04 loss: 8.509e-02]mindexpander_qwen_v1:  45%|####5     | 1350/3000 [1:30:59<1:24:49,  3.08s/it, lr: 1.0e-04 loss: 8.509e-02]mindexpander_qwen_v1:  45%|####5     | 1351/3000 [1:30:59<1:01:25,  2.24s/it, lr: 1.0e-04 loss: 8.509e-02]mindexpander_qwen_v1:  45%|####5     | 1351/3000 [1:30:59<1:01:25,  2.24s/it, lr: 1.0e-04 loss: 8.509e-02]mindexpander_qwen_v1:  45%|####5     | 1351/3000 [1:31:01<1:01:25,  2.24s/it, lr: 1.0e-04 loss: 9.074e-02]mindexpander_qwen_v1:  45%|####5     | 1351/3000 [1:31:01<1:01:25,  2.24s/it, lr: 1.0e-04 loss: 9.074e-02]mindexpander_qwen_v1:  45%|####5     | 1352/3000 [1:31:01<1:02:48,  2.29s/it, lr: 1.0e-04 loss: 9.074e-02]mindexpander_qwen_v1:  45%|####5     | 1352/3000 [1:31:01<1:02:48,  2.29s/it, lr: 1.0e-04 loss: 9.074e-02]mindexpander_qwen_v1:  45%|####5     | 1352/3000 [1:31:07<1:02:48,  2.29s/it, lr: 1.0e-04 loss: 5.896e-02]mindexpander_qwen_v1:  45%|####5     | 1352/3000 [1:31:07<1:02:48,  2.29s/it, lr: 1.0e-04 loss: 5.896e-02]mindexpander_qwen_v1:  45%|####5     | 1353/3000 [1:31:07<1:28:53,  3.24s/it, lr: 1.0e-04 loss: 5.896e-02]mindexpander_qwen_v1:  45%|####5     | 1353/3000 [1:31:07<1:28:53,  3.24s/it, lr: 1.0e-04 loss: 5.896e-02]mindexpander_qwen_v1:  45%|####5     | 1353/3000 [1:31:11<1:28:53,  3.24s/it, lr: 1.0e-04 loss: 1.355e-01]mindexpander_qwen_v1:  45%|####5     | 1353/3000 [1:31:11<1:28:53,  3.24s/it, lr: 1.0e-04 loss: 1.355e-01]mindexpander_qwen_v1:  45%|####5     | 1354/3000 [1:31:11<1:32:26,  3.37s/it, lr: 1.0e-04 loss: 1.355e-01]mindexpander_qwen_v1:  45%|####5     | 1354/3000 [1:31:11<1:32:26,  3.37s/it, lr: 1.0e-04 loss: 1.355e-01]mindexpander_qwen_v1:  45%|####5     | 1354/3000 [1:31:13<1:32:26,  3.37s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  45%|####5     | 1354/3000 [1:31:13<1:32:26,  3.37s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  45%|####5     | 1355/3000 [1:31:13<1:25:18,  3.11s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  45%|####5     | 1355/3000 [1:31:13<1:25:18,  3.11s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  45%|####5     | 1355/3000 [1:31:19<1:25:18,  3.11s/it, lr: 1.0e-04 loss: 1.749e-01]mindexpander_qwen_v1:  45%|####5     | 1355/3000 [1:31:19<1:25:18,  3.11s/it, lr: 1.0e-04 loss: 1.749e-01]mindexpander_qwen_v1:  45%|####5     | 1356/3000 [1:31:19<1:45:55,  3.87s/it, lr: 1.0e-04 loss: 1.749e-01]mindexpander_qwen_v1:  45%|####5     | 1356/3000 [1:31:19<1:45:55,  3.87s/it, lr: 1.0e-04 loss: 1.749e-01]mindexpander_qwen_v1:  45%|####5     | 1356/3000 [1:31:25<1:45:55,  3.87s/it, lr: 1.0e-04 loss: 1.352e-01]mindexpander_qwen_v1:  45%|####5     | 1356/3000 [1:31:25<1:45:55,  3.87s/it, lr: 1.0e-04 loss: 1.352e-01]mindexpander_qwen_v1:  45%|####5     | 1357/3000 [1:31:25<2:02:18,  4.47s/it, lr: 1.0e-04 loss: 1.352e-01]mindexpander_qwen_v1:  45%|####5     | 1357/3000 [1:31:25<2:02:18,  4.47s/it, lr: 1.0e-04 loss: 1.352e-01]mindexpander_qwen_v1:  45%|####5     | 1357/3000 [1:31:31<2:02:18,  4.47s/it, lr: 1.0e-04 loss: 1.678e-01]mindexpander_qwen_v1:  45%|####5     | 1357/3000 [1:31:31<2:02:18,  4.47s/it, lr: 1.0e-04 loss: 1.678e-01]mindexpander_qwen_v1:  45%|####5     | 1358/3000 [1:31:31<2:12:31,  4.84s/it, lr: 1.0e-04 loss: 1.678e-01]mindexpander_qwen_v1:  45%|####5     | 1358/3000 [1:31:31<2:12:31,  4.84s/it, lr: 1.0e-04 loss: 1.678e-01]mindexpander_qwen_v1:  45%|####5     | 1358/3000 [1:31:37<2:12:31,  4.84s/it, lr: 1.0e-04 loss: 2.082e-02]mindexpander_qwen_v1:  45%|####5     | 1358/3000 [1:31:37<2:12:31,  4.84s/it, lr: 1.0e-04 loss: 2.082e-02]mindexpander_qwen_v1:  45%|####5     | 1359/3000 [1:31:37<2:19:52,  5.11s/it, lr: 1.0e-04 loss: 2.082e-02]mindexpander_qwen_v1:  45%|####5     | 1359/3000 [1:31:37<2:19:52,  5.11s/it, lr: 1.0e-04 loss: 2.082e-02]mindexpander_qwen_v1:  45%|####5     | 1359/3000 [1:31:41<2:19:52,  5.11s/it, lr: 1.0e-04 loss: 1.143e-01]mindexpander_qwen_v1:  45%|####5     | 1359/3000 [1:31:41<2:19:52,  5.11s/it, lr: 1.0e-04 loss: 1.143e-01]mindexpander_qwen_v1:  45%|####5     | 1360/3000 [1:31:43<2:19:47,  5.11s/it, lr: 1.0e-04 loss: 1.815e-01]mindexpander_qwen_v1:  45%|####5     | 1360/3000 [1:31:43<2:19:47,  5.11s/it, lr: 1.0e-04 loss: 1.815e-01]mindexpander_qwen_v1:  45%|####5     | 1361/3000 [1:31:43<1:31:08,  3.34s/it, lr: 1.0e-04 loss: 1.815e-01]mindexpander_qwen_v1:  45%|####5     | 1361/3000 [1:31:43<1:31:08,  3.34s/it, lr: 1.0e-04 loss: 1.815e-01]mindexpander_qwen_v1:  45%|####5     | 1361/3000 [1:31:49<1:31:08,  3.34s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  45%|####5     | 1361/3000 [1:31:49<1:31:08,  3.34s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  45%|####5     | 1362/3000 [1:31:49<1:47:20,  3.93s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  45%|####5     | 1362/3000 [1:31:49<1:47:20,  3.93s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  45%|####5     | 1362/3000 [1:31:52<1:47:20,  3.93s/it, lr: 1.0e-04 loss: 4.928e-02]mindexpander_qwen_v1:  45%|####5     | 1362/3000 [1:31:52<1:47:20,  3.93s/it, lr: 1.0e-04 loss: 4.928e-02]mindexpander_qwen_v1:  45%|####5     | 1363/3000 [1:31:52<1:45:54,  3.88s/it, lr: 1.0e-04 loss: 4.928e-02]mindexpander_qwen_v1:  45%|####5     | 1363/3000 [1:31:52<1:45:54,  3.88s/it, lr: 1.0e-04 loss: 4.928e-02]mindexpander_qwen_v1:  45%|####5     | 1363/3000 [1:31:56<1:45:54,  3.88s/it, lr: 1.0e-04 loss: 9.395e-02]mindexpander_qwen_v1:  45%|####5     | 1363/3000 [1:31:56<1:45:54,  3.88s/it, lr: 1.0e-04 loss: 9.395e-02]mindexpander_qwen_v1:  45%|####5     | 1364/3000 [1:31:56<1:46:08,  3.89s/it, lr: 1.0e-04 loss: 9.395e-02]mindexpander_qwen_v1:  45%|####5     | 1364/3000 [1:31:56<1:46:08,  3.89s/it, lr: 1.0e-04 loss: 9.395e-02]mindexpander_qwen_v1:  45%|####5     | 1364/3000 [1:31:59<1:46:08,  3.89s/it, lr: 1.0e-04 loss: 4.534e-02]mindexpander_qwen_v1:  45%|####5     | 1364/3000 [1:31:59<1:46:08,  3.89s/it, lr: 1.0e-04 loss: 4.534e-02]mindexpander_qwen_v1:  46%|####5     | 1365/3000 [1:31:59<1:35:05,  3.49s/it, lr: 1.0e-04 loss: 4.534e-02]mindexpander_qwen_v1:  46%|####5     | 1365/3000 [1:31:59<1:35:05,  3.49s/it, lr: 1.0e-04 loss: 4.534e-02]mindexpander_qwen_v1:  46%|####5     | 1365/3000 [1:32:03<1:35:05,  3.49s/it, lr: 1.0e-04 loss: 3.682e-02]mindexpander_qwen_v1:  46%|####5     | 1365/3000 [1:32:03<1:35:05,  3.49s/it, lr: 1.0e-04 loss: 3.682e-02]mindexpander_qwen_v1:  46%|####5     | 1366/3000 [1:32:03<1:36:57,  3.56s/it, lr: 1.0e-04 loss: 3.682e-02]mindexpander_qwen_v1:  46%|####5     | 1366/3000 [1:32:03<1:36:57,  3.56s/it, lr: 1.0e-04 loss: 3.682e-02]mindexpander_qwen_v1:  46%|####5     | 1366/3000 [1:32:06<1:36:57,  3.56s/it, lr: 1.0e-04 loss: 9.429e-02]mindexpander_qwen_v1:  46%|####5     | 1366/3000 [1:32:06<1:36:57,  3.56s/it, lr: 1.0e-04 loss: 9.429e-02]mindexpander_qwen_v1:  46%|####5     | 1367/3000 [1:32:06<1:38:20,  3.61s/it, lr: 1.0e-04 loss: 9.429e-02]mindexpander_qwen_v1:  46%|####5     | 1367/3000 [1:32:06<1:38:20,  3.61s/it, lr: 1.0e-04 loss: 9.429e-02]mindexpander_qwen_v1:  46%|####5     | 1367/3000 [1:32:10<1:38:20,  3.61s/it, lr: 1.0e-04 loss: 9.885e-02]mindexpander_qwen_v1:  46%|####5     | 1367/3000 [1:32:10<1:38:20,  3.61s/it, lr: 1.0e-04 loss: 9.885e-02]mindexpander_qwen_v1:  46%|####5     | 1368/3000 [1:32:10<1:40:41,  3.70s/it, lr: 1.0e-04 loss: 9.885e-02]mindexpander_qwen_v1:  46%|####5     | 1368/3000 [1:32:10<1:40:41,  3.70s/it, lr: 1.0e-04 loss: 9.885e-02]mindexpander_qwen_v1:  46%|####5     | 1368/3000 [1:32:14<1:40:41,  3.70s/it, lr: 1.0e-04 loss: 1.271e-01]mindexpander_qwen_v1:  46%|####5     | 1368/3000 [1:32:14<1:40:41,  3.70s/it, lr: 1.0e-04 loss: 1.271e-01]mindexpander_qwen_v1:  46%|####5     | 1369/3000 [1:32:14<1:40:54,  3.71s/it, lr: 1.0e-04 loss: 1.271e-01]mindexpander_qwen_v1:  46%|####5     | 1369/3000 [1:32:14<1:40:54,  3.71s/it, lr: 1.0e-04 loss: 1.271e-01]mindexpander_qwen_v1:  46%|####5     | 1369/3000 [1:32:16<1:40:54,  3.71s/it, lr: 1.0e-04 loss: 1.552e-01]mindexpander_qwen_v1:  46%|####5     | 1369/3000 [1:32:16<1:40:54,  3.71s/it, lr: 1.0e-04 loss: 1.552e-01]mindexpander_qwen_v1:  46%|####5     | 1370/3000 [1:32:22<1:40:51,  3.71s/it, lr: 1.0e-04 loss: 2.564e-02]mindexpander_qwen_v1:  46%|####5     | 1370/3000 [1:32:22<1:40:51,  3.71s/it, lr: 1.0e-04 loss: 2.564e-02]mindexpander_qwen_v1:  46%|####5     | 1371/3000 [1:32:22<1:30:24,  3.33s/it, lr: 1.0e-04 loss: 2.564e-02]mindexpander_qwen_v1:  46%|####5     | 1371/3000 [1:32:22<1:30:24,  3.33s/it, lr: 1.0e-04 loss: 2.564e-02]mindexpander_qwen_v1:  46%|####5     | 1371/3000 [1:32:28<1:30:24,  3.33s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:  46%|####5     | 1371/3000 [1:32:28<1:30:24,  3.33s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:  46%|####5     | 1372/3000 [1:32:28<1:47:21,  3.96s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:  46%|####5     | 1372/3000 [1:32:28<1:47:21,  3.96s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:  46%|####5     | 1372/3000 [1:32:30<1:47:21,  3.96s/it, lr: 1.0e-04 loss: 1.043e-01]mindexpander_qwen_v1:  46%|####5     | 1372/3000 [1:32:30<1:47:21,  3.96s/it, lr: 1.0e-04 loss: 1.043e-01]mindexpander_qwen_v1:  46%|####5     | 1373/3000 [1:32:30<1:36:38,  3.56s/it, lr: 1.0e-04 loss: 1.043e-01]mindexpander_qwen_v1:  46%|####5     | 1373/3000 [1:32:30<1:36:38,  3.56s/it, lr: 1.0e-04 loss: 1.043e-01]mindexpander_qwen_v1:  46%|####5     | 1373/3000 [1:32:33<1:36:38,  3.56s/it, lr: 1.0e-04 loss: 1.253e-01]mindexpander_qwen_v1:  46%|####5     | 1373/3000 [1:32:33<1:36:38,  3.56s/it, lr: 1.0e-04 loss: 1.253e-01]mindexpander_qwen_v1:  46%|####5     | 1374/3000 [1:32:33<1:28:20,  3.26s/it, lr: 1.0e-04 loss: 1.253e-01]mindexpander_qwen_v1:  46%|####5     | 1374/3000 [1:32:33<1:28:20,  3.26s/it, lr: 1.0e-04 loss: 1.253e-01]mindexpander_qwen_v1:  46%|####5     | 1374/3000 [1:32:35<1:28:20,  3.26s/it, lr: 1.0e-04 loss: 6.469e-02]mindexpander_qwen_v1:  46%|####5     | 1374/3000 [1:32:35<1:28:20,  3.26s/it, lr: 1.0e-04 loss: 6.469e-02]mindexpander_qwen_v1:  46%|####5     | 1375/3000 [1:32:35<1:22:07,  3.03s/it, lr: 1.0e-04 loss: 6.469e-02]mindexpander_qwen_v1:  46%|####5     | 1375/3000 [1:32:35<1:22:07,  3.03s/it, lr: 1.0e-04 loss: 6.469e-02]mindexpander_qwen_v1:  46%|####5     | 1375/3000 [1:32:41<1:22:07,  3.03s/it, lr: 1.0e-04 loss: 1.817e-01]mindexpander_qwen_v1:  46%|####5     | 1375/3000 [1:32:41<1:22:07,  3.03s/it, lr: 1.0e-04 loss: 1.817e-01]mindexpander_qwen_v1:  46%|####5     | 1376/3000 [1:32:41<1:44:12,  3.85s/it, lr: 1.0e-04 loss: 1.817e-01]mindexpander_qwen_v1:  46%|####5     | 1376/3000 [1:32:41<1:44:12,  3.85s/it, lr: 1.0e-04 loss: 1.817e-01]mindexpander_qwen_v1:  46%|####5     | 1376/3000 [1:32:44<1:44:12,  3.85s/it, lr: 1.0e-04 loss: 4.165e-02]mindexpander_qwen_v1:  46%|####5     | 1376/3000 [1:32:44<1:44:12,  3.85s/it, lr: 1.0e-04 loss: 4.165e-02]mindexpander_qwen_v1:  46%|####5     | 1377/3000 [1:32:44<1:33:12,  3.45s/it, lr: 1.0e-04 loss: 4.165e-02]mindexpander_qwen_v1:  46%|####5     | 1377/3000 [1:32:44<1:33:12,  3.45s/it, lr: 1.0e-04 loss: 4.165e-02]mindexpander_qwen_v1:  46%|####5     | 1377/3000 [1:32:47<1:33:12,  3.45s/it, lr: 1.0e-04 loss: 5.251e-02]mindexpander_qwen_v1:  46%|####5     | 1377/3000 [1:32:47<1:33:12,  3.45s/it, lr: 1.0e-04 loss: 5.251e-02]mindexpander_qwen_v1:  46%|####5     | 1378/3000 [1:32:47<1:35:31,  3.53s/it, lr: 1.0e-04 loss: 5.251e-02]mindexpander_qwen_v1:  46%|####5     | 1378/3000 [1:32:47<1:35:31,  3.53s/it, lr: 1.0e-04 loss: 5.251e-02]mindexpander_qwen_v1:  46%|####5     | 1378/3000 [1:32:53<1:35:31,  3.53s/it, lr: 1.0e-04 loss: 1.354e-01]mindexpander_qwen_v1:  46%|####5     | 1378/3000 [1:32:53<1:35:31,  3.53s/it, lr: 1.0e-04 loss: 1.354e-01]mindexpander_qwen_v1:  46%|####5     | 1379/3000 [1:32:53<1:53:22,  4.20s/it, lr: 1.0e-04 loss: 1.354e-01]mindexpander_qwen_v1:  46%|####5     | 1379/3000 [1:32:53<1:53:22,  4.20s/it, lr: 1.0e-04 loss: 1.354e-01]mindexpander_qwen_v1:  46%|####5     | 1379/3000 [1:32:56<1:53:22,  4.20s/it, lr: 1.0e-04 loss: 5.052e-03]mindexpander_qwen_v1:  46%|####5     | 1379/3000 [1:32:56<1:53:22,  4.20s/it, lr: 1.0e-04 loss: 5.052e-03]mindexpander_qwen_v1:  46%|####6     | 1380/3000 [1:33:00<1:53:18,  4.20s/it, lr: 1.0e-04 loss: 5.973e-02]mindexpander_qwen_v1:  46%|####6     | 1380/3000 [1:33:00<1:53:18,  4.20s/it, lr: 1.0e-04 loss: 5.973e-02]mindexpander_qwen_v1:  46%|####6     | 1381/3000 [1:33:00<1:24:34,  3.13s/it, lr: 1.0e-04 loss: 5.973e-02]mindexpander_qwen_v1:  46%|####6     | 1381/3000 [1:33:00<1:24:34,  3.13s/it, lr: 1.0e-04 loss: 5.973e-02]mindexpander_qwen_v1:  46%|####6     | 1381/3000 [1:33:04<1:24:34,  3.13s/it, lr: 1.0e-04 loss: 1.261e-01]mindexpander_qwen_v1:  46%|####6     | 1381/3000 [1:33:04<1:24:34,  3.13s/it, lr: 1.0e-04 loss: 1.261e-01]mindexpander_qwen_v1:  46%|####6     | 1382/3000 [1:33:04<1:28:32,  3.28s/it, lr: 1.0e-04 loss: 1.261e-01]mindexpander_qwen_v1:  46%|####6     | 1382/3000 [1:33:04<1:28:32,  3.28s/it, lr: 1.0e-04 loss: 1.261e-01]mindexpander_qwen_v1:  46%|####6     | 1382/3000 [1:33:06<1:28:32,  3.28s/it, lr: 1.0e-04 loss: 1.879e-01]mindexpander_qwen_v1:  46%|####6     | 1382/3000 [1:33:06<1:28:32,  3.28s/it, lr: 1.0e-04 loss: 1.879e-01]mindexpander_qwen_v1:  46%|####6     | 1383/3000 [1:33:06<1:22:35,  3.06s/it, lr: 1.0e-04 loss: 1.879e-01]mindexpander_qwen_v1:  46%|####6     | 1383/3000 [1:33:06<1:22:35,  3.06s/it, lr: 1.0e-04 loss: 1.879e-01]mindexpander_qwen_v1:  46%|####6     | 1383/3000 [1:33:09<1:22:35,  3.06s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  46%|####6     | 1383/3000 [1:33:09<1:22:35,  3.06s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  46%|####6     | 1384/3000 [1:33:09<1:19:37,  2.96s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  46%|####6     | 1384/3000 [1:33:09<1:19:37,  2.96s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  46%|####6     | 1384/3000 [1:33:11<1:19:37,  2.96s/it, lr: 1.0e-04 loss: 5.296e-02]mindexpander_qwen_v1:  46%|####6     | 1384/3000 [1:33:11<1:19:37,  2.96s/it, lr: 1.0e-04 loss: 5.296e-02]mindexpander_qwen_v1:  46%|####6     | 1385/3000 [1:33:11<1:15:49,  2.82s/it, lr: 1.0e-04 loss: 5.296e-02]mindexpander_qwen_v1:  46%|####6     | 1385/3000 [1:33:11<1:15:49,  2.82s/it, lr: 1.0e-04 loss: 5.296e-02]mindexpander_qwen_v1:  46%|####6     | 1385/3000 [1:33:15<1:15:49,  2.82s/it, lr: 1.0e-04 loss: 3.873e-02]mindexpander_qwen_v1:  46%|####6     | 1385/3000 [1:33:15<1:15:49,  2.82s/it, lr: 1.0e-04 loss: 3.873e-02]mindexpander_qwen_v1:  46%|####6     | 1386/3000 [1:33:15<1:22:50,  3.08s/it, lr: 1.0e-04 loss: 3.873e-02]mindexpander_qwen_v1:  46%|####6     | 1386/3000 [1:33:15<1:22:50,  3.08s/it, lr: 1.0e-04 loss: 3.873e-02]mindexpander_qwen_v1:  46%|####6     | 1386/3000 [1:33:21<1:22:50,  3.08s/it, lr: 1.0e-04 loss: 3.925e-02]mindexpander_qwen_v1:  46%|####6     | 1386/3000 [1:33:21<1:22:50,  3.08s/it, lr: 1.0e-04 loss: 3.925e-02]mindexpander_qwen_v1:  46%|####6     | 1387/3000 [1:33:21<1:43:39,  3.86s/it, lr: 1.0e-04 loss: 3.925e-02]mindexpander_qwen_v1:  46%|####6     | 1387/3000 [1:33:21<1:43:39,  3.86s/it, lr: 1.0e-04 loss: 3.925e-02]mindexpander_qwen_v1:  46%|####6     | 1387/3000 [1:33:27<1:43:39,  3.86s/it, lr: 1.0e-04 loss: 7.290e-02]mindexpander_qwen_v1:  46%|####6     | 1387/3000 [1:33:27<1:43:39,  3.86s/it, lr: 1.0e-04 loss: 7.290e-02]mindexpander_qwen_v1:  46%|####6     | 1388/3000 [1:33:27<1:59:33,  4.45s/it, lr: 1.0e-04 loss: 7.290e-02]mindexpander_qwen_v1:  46%|####6     | 1388/3000 [1:33:27<1:59:33,  4.45s/it, lr: 1.0e-04 loss: 7.290e-02]mindexpander_qwen_v1:  46%|####6     | 1388/3000 [1:33:32<1:59:33,  4.45s/it, lr: 1.0e-04 loss: 1.800e-01]mindexpander_qwen_v1:  46%|####6     | 1388/3000 [1:33:32<1:59:33,  4.45s/it, lr: 1.0e-04 loss: 1.800e-01]mindexpander_qwen_v1:  46%|####6     | 1389/3000 [1:33:32<2:09:49,  4.83s/it, lr: 1.0e-04 loss: 1.800e-01]mindexpander_qwen_v1:  46%|####6     | 1389/3000 [1:33:32<2:09:49,  4.83s/it, lr: 1.0e-04 loss: 1.800e-01]mindexpander_qwen_v1:  46%|####6     | 1389/3000 [1:33:38<2:09:49,  4.83s/it, lr: 1.0e-04 loss: 4.279e-02]mindexpander_qwen_v1:  46%|####6     | 1389/3000 [1:33:38<2:09:49,  4.83s/it, lr: 1.0e-04 loss: 4.279e-02]mindexpander_qwen_v1:  46%|####6     | 1390/3000 [1:33:44<2:09:44,  4.83s/it, lr: 1.0e-04 loss: 2.124e-02]mindexpander_qwen_v1:  46%|####6     | 1390/3000 [1:33:44<2:09:44,  4.83s/it, lr: 1.0e-04 loss: 2.124e-02]mindexpander_qwen_v1:  46%|####6     | 1391/3000 [1:33:44<1:45:37,  3.94s/it, lr: 1.0e-04 loss: 2.124e-02]mindexpander_qwen_v1:  46%|####6     | 1391/3000 [1:33:44<1:45:37,  3.94s/it, lr: 1.0e-04 loss: 2.124e-02]mindexpander_qwen_v1:  46%|####6     | 1391/3000 [1:33:47<1:45:37,  3.94s/it, lr: 1.0e-04 loss: 2.470e-02]mindexpander_qwen_v1:  46%|####6     | 1391/3000 [1:33:47<1:45:37,  3.94s/it, lr: 1.0e-04 loss: 2.470e-02]mindexpander_qwen_v1:  46%|####6     | 1392/3000 [1:33:47<1:37:02,  3.62s/it, lr: 1.0e-04 loss: 2.470e-02]mindexpander_qwen_v1:  46%|####6     | 1392/3000 [1:33:47<1:37:02,  3.62s/it, lr: 1.0e-04 loss: 2.470e-02]mindexpander_qwen_v1:  46%|####6     | 1392/3000 [1:33:49<1:37:02,  3.62s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:  46%|####6     | 1392/3000 [1:33:49<1:37:02,  3.62s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:  46%|####6     | 1393/3000 [1:33:49<1:28:47,  3.32s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:  46%|####6     | 1393/3000 [1:33:49<1:28:47,  3.32s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:  46%|####6     | 1393/3000 [1:33:53<1:28:47,  3.32s/it, lr: 1.0e-04 loss: 7.275e-02]mindexpander_qwen_v1:  46%|####6     | 1393/3000 [1:33:53<1:28:47,  3.32s/it, lr: 1.0e-04 loss: 7.275e-02]mindexpander_qwen_v1:  46%|####6     | 1394/3000 [1:33:53<1:31:48,  3.43s/it, lr: 1.0e-04 loss: 7.275e-02]mindexpander_qwen_v1:  46%|####6     | 1394/3000 [1:33:53<1:31:48,  3.43s/it, lr: 1.0e-04 loss: 7.275e-02]mindexpander_qwen_v1:  46%|####6     | 1394/3000 [1:33:55<1:31:48,  3.43s/it, lr: 1.0e-04 loss: 1.878e-01]mindexpander_qwen_v1:  46%|####6     | 1394/3000 [1:33:55<1:31:48,  3.43s/it, lr: 1.0e-04 loss: 1.878e-01]mindexpander_qwen_v1:  46%|####6     | 1395/3000 [1:33:55<1:24:23,  3.15s/it, lr: 1.0e-04 loss: 1.878e-01]mindexpander_qwen_v1:  46%|####6     | 1395/3000 [1:33:55<1:24:23,  3.15s/it, lr: 1.0e-04 loss: 1.878e-01]mindexpander_qwen_v1:  46%|####6     | 1395/3000 [1:34:01<1:24:23,  3.15s/it, lr: 1.0e-04 loss: 1.350e-01]mindexpander_qwen_v1:  46%|####6     | 1395/3000 [1:34:01<1:24:23,  3.15s/it, lr: 1.0e-04 loss: 1.350e-01]mindexpander_qwen_v1:  47%|####6     | 1396/3000 [1:34:01<1:45:10,  3.93s/it, lr: 1.0e-04 loss: 1.350e-01]mindexpander_qwen_v1:  47%|####6     | 1396/3000 [1:34:01<1:45:10,  3.93s/it, lr: 1.0e-04 loss: 1.350e-01]mindexpander_qwen_v1:  47%|####6     | 1396/3000 [1:34:04<1:45:10,  3.93s/it, lr: 1.0e-04 loss: 7.479e-02]mindexpander_qwen_v1:  47%|####6     | 1396/3000 [1:34:04<1:45:10,  3.93s/it, lr: 1.0e-04 loss: 7.479e-02]mindexpander_qwen_v1:  47%|####6     | 1397/3000 [1:34:04<1:33:35,  3.50s/it, lr: 1.0e-04 loss: 7.479e-02]mindexpander_qwen_v1:  47%|####6     | 1397/3000 [1:34:04<1:33:35,  3.50s/it, lr: 1.0e-04 loss: 7.479e-02]mindexpander_qwen_v1:  47%|####6     | 1397/3000 [1:34:06<1:33:35,  3.50s/it, lr: 1.0e-04 loss: 1.816e-03]mindexpander_qwen_v1:  47%|####6     | 1397/3000 [1:34:06<1:33:35,  3.50s/it, lr: 1.0e-04 loss: 1.816e-03]mindexpander_qwen_v1:  47%|####6     | 1398/3000 [1:34:06<1:25:20,  3.20s/it, lr: 1.0e-04 loss: 1.816e-03]mindexpander_qwen_v1:  47%|####6     | 1398/3000 [1:34:06<1:25:20,  3.20s/it, lr: 1.0e-04 loss: 1.816e-03]mindexpander_qwen_v1:  47%|####6     | 1398/3000 [1:34:12<1:25:20,  3.20s/it, lr: 1.0e-04 loss: 6.698e-02]mindexpander_qwen_v1:  47%|####6     | 1398/3000 [1:34:12<1:25:20,  3.20s/it, lr: 1.0e-04 loss: 6.698e-02]mindexpander_qwen_v1:  47%|####6     | 1399/3000 [1:34:12<1:45:24,  3.95s/it, lr: 1.0e-04 loss: 6.698e-02]mindexpander_qwen_v1:  47%|####6     | 1399/3000 [1:34:12<1:45:24,  3.95s/it, lr: 1.0e-04 loss: 6.698e-02]mindexpander_qwen_v1:  47%|####6     | 1399/3000 [1:34:16<1:45:24,  3.95s/it, lr: 1.0e-04 loss: 1.947e-01]mindexpander_qwen_v1:  47%|####6     | 1399/3000 [1:34:16<1:45:24,  3.95s/it, lr: 1.0e-04 loss: 1.947e-01]mindexpander_qwen_v1:  47%|####6     | 1400/3000 [1:34:18<1:45:20,  3.95s/it, lr: 1.0e-04 loss: 2.944e-02]mindexpander_qwen_v1:  47%|####6     | 1400/3000 [1:34:18<1:45:20,  3.95s/it, lr: 1.0e-04 loss: 2.944e-02]mindexpander_qwen_v1:  47%|####6     | 1401/3000 [1:34:18<1:12:03,  2.70s/it, lr: 1.0e-04 loss: 2.944e-02]mindexpander_qwen_v1:  47%|####6     | 1401/3000 [1:34:18<1:12:03,  2.70s/it, lr: 1.0e-04 loss: 2.944e-02]mindexpander_qwen_v1:  47%|####6     | 1401/3000 [1:34:22<1:12:03,  2.70s/it, lr: 1.0e-04 loss: 2.422e-02]mindexpander_qwen_v1:  47%|####6     | 1401/3000 [1:34:22<1:12:03,  2.70s/it, lr: 1.0e-04 loss: 2.422e-02]mindexpander_qwen_v1:  47%|####6     | 1402/3000 [1:34:22<1:18:49,  2.96s/it, lr: 1.0e-04 loss: 2.422e-02]mindexpander_qwen_v1:  47%|####6     | 1402/3000 [1:34:22<1:18:49,  2.96s/it, lr: 1.0e-04 loss: 2.422e-02]mindexpander_qwen_v1:  47%|####6     | 1402/3000 [1:34:26<1:18:49,  2.96s/it, lr: 1.0e-04 loss: 3.177e-02]mindexpander_qwen_v1:  47%|####6     | 1402/3000 [1:34:26<1:18:49,  2.96s/it, lr: 1.0e-04 loss: 3.177e-02]mindexpander_qwen_v1:  47%|####6     | 1403/3000 [1:34:26<1:24:05,  3.16s/it, lr: 1.0e-04 loss: 3.177e-02]mindexpander_qwen_v1:  47%|####6     | 1403/3000 [1:34:26<1:24:05,  3.16s/it, lr: 1.0e-04 loss: 3.177e-02]mindexpander_qwen_v1:  47%|####6     | 1403/3000 [1:34:32<1:24:05,  3.16s/it, lr: 1.0e-04 loss: 1.226e-01]mindexpander_qwen_v1:  47%|####6     | 1403/3000 [1:34:32<1:24:05,  3.16s/it, lr: 1.0e-04 loss: 1.226e-01]mindexpander_qwen_v1:  47%|####6     | 1404/3000 [1:34:32<1:43:38,  3.90s/it, lr: 1.0e-04 loss: 1.226e-01]mindexpander_qwen_v1:  47%|####6     | 1404/3000 [1:34:32<1:43:38,  3.90s/it, lr: 1.0e-04 loss: 1.226e-01]mindexpander_qwen_v1:  47%|####6     | 1404/3000 [1:34:35<1:43:38,  3.90s/it, lr: 1.0e-04 loss: 2.918e-02]mindexpander_qwen_v1:  47%|####6     | 1404/3000 [1:34:35<1:43:38,  3.90s/it, lr: 1.0e-04 loss: 2.918e-02]mindexpander_qwen_v1:  47%|####6     | 1405/3000 [1:34:35<1:42:23,  3.85s/it, lr: 1.0e-04 loss: 2.918e-02]mindexpander_qwen_v1:  47%|####6     | 1405/3000 [1:34:35<1:42:23,  3.85s/it, lr: 1.0e-04 loss: 2.918e-02]mindexpander_qwen_v1:  47%|####6     | 1405/3000 [1:34:41<1:42:23,  3.85s/it, lr: 1.0e-04 loss: 1.455e-01]mindexpander_qwen_v1:  47%|####6     | 1405/3000 [1:34:41<1:42:23,  3.85s/it, lr: 1.0e-04 loss: 1.455e-01]mindexpander_qwen_v1:  47%|####6     | 1406/3000 [1:34:41<1:56:49,  4.40s/it, lr: 1.0e-04 loss: 1.455e-01]mindexpander_qwen_v1:  47%|####6     | 1406/3000 [1:34:41<1:56:49,  4.40s/it, lr: 1.0e-04 loss: 1.455e-01]mindexpander_qwen_v1:  47%|####6     | 1406/3000 [1:34:47<1:56:49,  4.40s/it, lr: 1.0e-04 loss: 7.128e-02]mindexpander_qwen_v1:  47%|####6     | 1406/3000 [1:34:47<1:56:49,  4.40s/it, lr: 1.0e-04 loss: 7.128e-02]mindexpander_qwen_v1:  47%|####6     | 1407/3000 [1:34:47<2:07:12,  4.79s/it, lr: 1.0e-04 loss: 7.128e-02]mindexpander_qwen_v1:  47%|####6     | 1407/3000 [1:34:47<2:07:12,  4.79s/it, lr: 1.0e-04 loss: 7.128e-02]mindexpander_qwen_v1:  47%|####6     | 1407/3000 [1:34:51<2:07:12,  4.79s/it, lr: 1.0e-04 loss: 2.367e-02]mindexpander_qwen_v1:  47%|####6     | 1407/3000 [1:34:51<2:07:12,  4.79s/it, lr: 1.0e-04 loss: 2.367e-02]mindexpander_qwen_v1:  47%|####6     | 1408/3000 [1:34:51<2:00:25,  4.54s/it, lr: 1.0e-04 loss: 2.367e-02]mindexpander_qwen_v1:  47%|####6     | 1408/3000 [1:34:51<2:00:25,  4.54s/it, lr: 1.0e-04 loss: 2.367e-02]mindexpander_qwen_v1:  47%|####6     | 1408/3000 [1:34:54<2:00:25,  4.54s/it, lr: 1.0e-04 loss: 5.841e-02]mindexpander_qwen_v1:  47%|####6     | 1408/3000 [1:34:54<2:00:25,  4.54s/it, lr: 1.0e-04 loss: 5.841e-02]mindexpander_qwen_v1:  47%|####6     | 1409/3000 [1:34:54<1:54:06,  4.30s/it, lr: 1.0e-04 loss: 5.841e-02]mindexpander_qwen_v1:  47%|####6     | 1409/3000 [1:34:54<1:54:06,  4.30s/it, lr: 1.0e-04 loss: 5.841e-02]mindexpander_qwen_v1:  47%|####6     | 1409/3000 [1:35:01<1:54:06,  4.30s/it, lr: 1.0e-04 loss: 1.603e-01]mindexpander_qwen_v1:  47%|####6     | 1409/3000 [1:35:01<1:54:06,  4.30s/it, lr: 1.0e-04 loss: 1.603e-01]mindexpander_qwen_v1:  47%|####6     | 1410/3000 [1:35:03<1:54:02,  4.30s/it, lr: 1.0e-04 loss: 3.970e-02]mindexpander_qwen_v1:  47%|####6     | 1410/3000 [1:35:03<1:54:02,  4.30s/it, lr: 1.0e-04 loss: 3.970e-02]mindexpander_qwen_v1:  47%|####7     | 1411/3000 [1:35:03<1:16:46,  2.90s/it, lr: 1.0e-04 loss: 3.970e-02]mindexpander_qwen_v1:  47%|####7     | 1411/3000 [1:35:03<1:16:46,  2.90s/it, lr: 1.0e-04 loss: 3.970e-02]mindexpander_qwen_v1:  47%|####7     | 1411/3000 [1:35:07<1:16:46,  2.90s/it, lr: 1.0e-04 loss: 1.636e-01]mindexpander_qwen_v1:  47%|####7     | 1411/3000 [1:35:07<1:16:46,  2.90s/it, lr: 1.0e-04 loss: 1.636e-01]mindexpander_qwen_v1:  47%|####7     | 1412/3000 [1:35:07<1:23:59,  3.17s/it, lr: 1.0e-04 loss: 1.636e-01]mindexpander_qwen_v1:  47%|####7     | 1412/3000 [1:35:07<1:23:59,  3.17s/it, lr: 1.0e-04 loss: 1.636e-01]mindexpander_qwen_v1:  47%|####7     | 1412/3000 [1:35:11<1:23:59,  3.17s/it, lr: 1.0e-04 loss: 5.727e-02]mindexpander_qwen_v1:  47%|####7     | 1412/3000 [1:35:11<1:23:59,  3.17s/it, lr: 1.0e-04 loss: 5.727e-02]mindexpander_qwen_v1:  47%|####7     | 1413/3000 [1:35:11<1:27:49,  3.32s/it, lr: 1.0e-04 loss: 5.727e-02]mindexpander_qwen_v1:  47%|####7     | 1413/3000 [1:35:11<1:27:49,  3.32s/it, lr: 1.0e-04 loss: 5.727e-02]mindexpander_qwen_v1:  47%|####7     | 1413/3000 [1:35:17<1:27:49,  3.32s/it, lr: 1.0e-04 loss: 7.551e-02]mindexpander_qwen_v1:  47%|####7     | 1413/3000 [1:35:17<1:27:49,  3.32s/it, lr: 1.0e-04 loss: 7.551e-02]mindexpander_qwen_v1:  47%|####7     | 1414/3000 [1:35:17<1:45:18,  3.98s/it, lr: 1.0e-04 loss: 7.551e-02]mindexpander_qwen_v1:  47%|####7     | 1414/3000 [1:35:17<1:45:18,  3.98s/it, lr: 1.0e-04 loss: 7.551e-02]mindexpander_qwen_v1:  47%|####7     | 1414/3000 [1:35:19<1:45:18,  3.98s/it, lr: 1.0e-04 loss: 1.002e-01]mindexpander_qwen_v1:  47%|####7     | 1414/3000 [1:35:19<1:45:18,  3.98s/it, lr: 1.0e-04 loss: 1.002e-01]mindexpander_qwen_v1:  47%|####7     | 1415/3000 [1:35:19<1:33:57,  3.56s/it, lr: 1.0e-04 loss: 1.002e-01]mindexpander_qwen_v1:  47%|####7     | 1415/3000 [1:35:19<1:33:57,  3.56s/it, lr: 1.0e-04 loss: 1.002e-01]mindexpander_qwen_v1:  47%|####7     | 1415/3000 [1:35:23<1:33:57,  3.56s/it, lr: 1.0e-04 loss: 1.881e-01]mindexpander_qwen_v1:  47%|####7     | 1415/3000 [1:35:23<1:33:57,  3.56s/it, lr: 1.0e-04 loss: 1.881e-01]mindexpander_qwen_v1:  47%|####7     | 1416/3000 [1:35:23<1:36:44,  3.66s/it, lr: 1.0e-04 loss: 1.881e-01]mindexpander_qwen_v1:  47%|####7     | 1416/3000 [1:35:23<1:36:44,  3.66s/it, lr: 1.0e-04 loss: 1.881e-01]mindexpander_qwen_v1:  47%|####7     | 1416/3000 [1:35:29<1:36:44,  3.66s/it, lr: 1.0e-04 loss: 1.309e-01]mindexpander_qwen_v1:  47%|####7     | 1416/3000 [1:35:29<1:36:44,  3.66s/it, lr: 1.0e-04 loss: 1.309e-01]mindexpander_qwen_v1:  47%|####7     | 1417/3000 [1:35:29<1:52:46,  4.27s/it, lr: 1.0e-04 loss: 1.309e-01]mindexpander_qwen_v1:  47%|####7     | 1417/3000 [1:35:29<1:52:46,  4.27s/it, lr: 1.0e-04 loss: 1.309e-01]mindexpander_qwen_v1:  47%|####7     | 1417/3000 [1:35:32<1:52:46,  4.27s/it, lr: 1.0e-04 loss: 1.008e-01]mindexpander_qwen_v1:  47%|####7     | 1417/3000 [1:35:32<1:52:46,  4.27s/it, lr: 1.0e-04 loss: 1.008e-01]mindexpander_qwen_v1:  47%|####7     | 1418/3000 [1:35:32<1:48:36,  4.12s/it, lr: 1.0e-04 loss: 1.008e-01]mindexpander_qwen_v1:  47%|####7     | 1418/3000 [1:35:32<1:48:36,  4.12s/it, lr: 1.0e-04 loss: 1.008e-01]mindexpander_qwen_v1:  47%|####7     | 1418/3000 [1:35:35<1:48:36,  4.12s/it, lr: 1.0e-04 loss: 8.878e-02]mindexpander_qwen_v1:  47%|####7     | 1418/3000 [1:35:35<1:48:36,  4.12s/it, lr: 1.0e-04 loss: 8.878e-02]mindexpander_qwen_v1:  47%|####7     | 1419/3000 [1:35:35<1:35:39,  3.63s/it, lr: 1.0e-04 loss: 8.878e-02]mindexpander_qwen_v1:  47%|####7     | 1419/3000 [1:35:35<1:35:39,  3.63s/it, lr: 1.0e-04 loss: 8.878e-02]mindexpander_qwen_v1:  47%|####7     | 1419/3000 [1:35:41<1:35:39,  3.63s/it, lr: 1.0e-04 loss: 5.290e-02]mindexpander_qwen_v1:  47%|####7     | 1419/3000 [1:35:41<1:35:39,  3.63s/it, lr: 1.0e-04 loss: 5.290e-02]mindexpander_qwen_v1:  47%|####7     | 1420/3000 [1:35:43<1:35:36,  3.63s/it, lr: 1.0e-04 loss: 5.433e-02]mindexpander_qwen_v1:  47%|####7     | 1420/3000 [1:35:43<1:35:36,  3.63s/it, lr: 1.0e-04 loss: 5.433e-02]mindexpander_qwen_v1:  47%|####7     | 1421/3000 [1:35:43<1:06:37,  2.53s/it, lr: 1.0e-04 loss: 5.433e-02]mindexpander_qwen_v1:  47%|####7     | 1421/3000 [1:35:43<1:06:37,  2.53s/it, lr: 1.0e-04 loss: 5.433e-02]mindexpander_qwen_v1:  47%|####7     | 1421/3000 [1:35:47<1:06:37,  2.53s/it, lr: 1.0e-04 loss: 1.410e-01]mindexpander_qwen_v1:  47%|####7     | 1421/3000 [1:35:47<1:06:37,  2.53s/it, lr: 1.0e-04 loss: 1.410e-01]mindexpander_qwen_v1:  47%|####7     | 1422/3000 [1:35:47<1:14:31,  2.83s/it, lr: 1.0e-04 loss: 1.410e-01]mindexpander_qwen_v1:  47%|####7     | 1422/3000 [1:35:47<1:14:31,  2.83s/it, lr: 1.0e-04 loss: 1.410e-01]mindexpander_qwen_v1:  47%|####7     | 1422/3000 [1:35:53<1:14:31,  2.83s/it, lr: 1.0e-04 loss: 1.163e-01]mindexpander_qwen_v1:  47%|####7     | 1422/3000 [1:35:53<1:14:31,  2.83s/it, lr: 1.0e-04 loss: 1.163e-01]mindexpander_qwen_v1:  47%|####7     | 1423/3000 [1:35:53<1:34:30,  3.60s/it, lr: 1.0e-04 loss: 1.163e-01]mindexpander_qwen_v1:  47%|####7     | 1423/3000 [1:35:53<1:34:30,  3.60s/it, lr: 1.0e-04 loss: 1.163e-01]mindexpander_qwen_v1:  47%|####7     | 1423/3000 [1:35:55<1:34:30,  3.60s/it, lr: 1.0e-04 loss: 5.222e-02]mindexpander_qwen_v1:  47%|####7     | 1423/3000 [1:35:55<1:34:30,  3.60s/it, lr: 1.0e-04 loss: 5.222e-02]mindexpander_qwen_v1:  47%|####7     | 1424/3000 [1:35:55<1:27:50,  3.34s/it, lr: 1.0e-04 loss: 5.222e-02]mindexpander_qwen_v1:  47%|####7     | 1424/3000 [1:35:55<1:27:50,  3.34s/it, lr: 1.0e-04 loss: 5.222e-02]mindexpander_qwen_v1:  47%|####7     | 1424/3000 [1:36:01<1:27:50,  3.34s/it, lr: 1.0e-04 loss: 1.377e-02]mindexpander_qwen_v1:  47%|####7     | 1424/3000 [1:36:01<1:27:50,  3.34s/it, lr: 1.0e-04 loss: 1.377e-02]mindexpander_qwen_v1:  48%|####7     | 1425/3000 [1:36:01<1:45:25,  4.02s/it, lr: 1.0e-04 loss: 1.377e-02]mindexpander_qwen_v1:  48%|####7     | 1425/3000 [1:36:01<1:45:25,  4.02s/it, lr: 1.0e-04 loss: 1.377e-02]mindexpander_qwen_v1:  48%|####7     | 1425/3000 [1:36:07<1:45:25,  4.02s/it, lr: 1.0e-04 loss: 2.488e-02]mindexpander_qwen_v1:  48%|####7     | 1425/3000 [1:36:07<1:45:25,  4.02s/it, lr: 1.0e-04 loss: 2.488e-02]mindexpander_qwen_v1:  48%|####7     | 1426/3000 [1:36:07<1:58:21,  4.51s/it, lr: 1.0e-04 loss: 2.488e-02]mindexpander_qwen_v1:  48%|####7     | 1426/3000 [1:36:07<1:58:21,  4.51s/it, lr: 1.0e-04 loss: 2.488e-02]mindexpander_qwen_v1:  48%|####7     | 1426/3000 [1:36:09<1:58:21,  4.51s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  48%|####7     | 1426/3000 [1:36:09<1:58:21,  4.51s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  48%|####7     | 1427/3000 [1:36:09<1:42:37,  3.91s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  48%|####7     | 1427/3000 [1:36:09<1:42:37,  3.91s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  48%|####7     | 1427/3000 [1:36:13<1:42:37,  3.91s/it, lr: 1.0e-04 loss: 1.261e-01]mindexpander_qwen_v1:  48%|####7     | 1427/3000 [1:36:13<1:42:37,  3.91s/it, lr: 1.0e-04 loss: 1.261e-01]mindexpander_qwen_v1:  48%|####7     | 1428/3000 [1:36:13<1:42:41,  3.92s/it, lr: 1.0e-04 loss: 1.261e-01]mindexpander_qwen_v1:  48%|####7     | 1428/3000 [1:36:13<1:42:41,  3.92s/it, lr: 1.0e-04 loss: 1.261e-01]mindexpander_qwen_v1:  48%|####7     | 1428/3000 [1:36:17<1:42:41,  3.92s/it, lr: 1.0e-04 loss: 3.436e-02]mindexpander_qwen_v1:  48%|####7     | 1428/3000 [1:36:17<1:42:41,  3.92s/it, lr: 1.0e-04 loss: 3.436e-02]mindexpander_qwen_v1:  48%|####7     | 1429/3000 [1:36:17<1:41:12,  3.87s/it, lr: 1.0e-04 loss: 3.436e-02]mindexpander_qwen_v1:  48%|####7     | 1429/3000 [1:36:17<1:41:12,  3.87s/it, lr: 1.0e-04 loss: 3.436e-02]mindexpander_qwen_v1:  48%|####7     | 1429/3000 [1:36:20<1:41:12,  3.87s/it, lr: 1.0e-04 loss: 8.341e-02]mindexpander_qwen_v1:  48%|####7     | 1429/3000 [1:36:20<1:41:12,  3.87s/it, lr: 1.0e-04 loss: 8.341e-02]mindexpander_qwen_v1:  48%|####7     | 1430/3000 [1:36:23<1:41:09,  3.87s/it, lr: 1.0e-04 loss: 3.994e-02]mindexpander_qwen_v1:  48%|####7     | 1430/3000 [1:36:23<1:41:09,  3.87s/it, lr: 1.0e-04 loss: 3.994e-02]mindexpander_qwen_v1:  48%|####7     | 1431/3000 [1:36:23<1:17:14,  2.95s/it, lr: 1.0e-04 loss: 3.994e-02]mindexpander_qwen_v1:  48%|####7     | 1431/3000 [1:36:23<1:17:14,  2.95s/it, lr: 1.0e-04 loss: 3.994e-02]mindexpander_qwen_v1:  48%|####7     | 1431/3000 [1:36:27<1:17:14,  2.95s/it, lr: 1.0e-04 loss: 1.109e-01]mindexpander_qwen_v1:  48%|####7     | 1431/3000 [1:36:27<1:17:14,  2.95s/it, lr: 1.0e-04 loss: 1.109e-01]mindexpander_qwen_v1:  48%|####7     | 1432/3000 [1:36:27<1:23:40,  3.20s/it, lr: 1.0e-04 loss: 1.109e-01]mindexpander_qwen_v1:  48%|####7     | 1432/3000 [1:36:27<1:23:40,  3.20s/it, lr: 1.0e-04 loss: 1.109e-01]mindexpander_qwen_v1:  48%|####7     | 1432/3000 [1:36:30<1:23:40,  3.20s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  48%|####7     | 1432/3000 [1:36:30<1:23:40,  3.20s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  48%|####7     | 1433/3000 [1:36:30<1:18:31,  3.01s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  48%|####7     | 1433/3000 [1:36:30<1:18:31,  3.01s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  48%|####7     | 1433/3000 [1:36:35<1:18:31,  3.01s/it, lr: 1.0e-04 loss: 3.734e-02]mindexpander_qwen_v1:  48%|####7     | 1433/3000 [1:36:35<1:18:31,  3.01s/it, lr: 1.0e-04 loss: 3.734e-02]mindexpander_qwen_v1:  48%|####7     | 1434/3000 [1:36:35<1:37:56,  3.75s/it, lr: 1.0e-04 loss: 3.734e-02]mindexpander_qwen_v1:  48%|####7     | 1434/3000 [1:36:35<1:37:56,  3.75s/it, lr: 1.0e-04 loss: 3.734e-02]mindexpander_qwen_v1:  48%|####7     | 1434/3000 [1:36:38<1:37:56,  3.75s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  48%|####7     | 1434/3000 [1:36:38<1:37:56,  3.75s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  48%|####7     | 1435/3000 [1:36:38<1:28:30,  3.39s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  48%|####7     | 1435/3000 [1:36:38<1:28:30,  3.39s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  48%|####7     | 1435/3000 [1:36:41<1:28:30,  3.39s/it, lr: 1.0e-04 loss: 1.240e-01]mindexpander_qwen_v1:  48%|####7     | 1435/3000 [1:36:41<1:28:30,  3.39s/it, lr: 1.0e-04 loss: 1.240e-01]mindexpander_qwen_v1:  48%|####7     | 1436/3000 [1:36:41<1:23:04,  3.19s/it, lr: 1.0e-04 loss: 1.240e-01]mindexpander_qwen_v1:  48%|####7     | 1436/3000 [1:36:41<1:23:04,  3.19s/it, lr: 1.0e-04 loss: 1.240e-01]mindexpander_qwen_v1:  48%|####7     | 1436/3000 [1:36:46<1:23:04,  3.19s/it, lr: 1.0e-04 loss: 1.001e-01]mindexpander_qwen_v1:  48%|####7     | 1436/3000 [1:36:46<1:23:04,  3.19s/it, lr: 1.0e-04 loss: 1.001e-01]mindexpander_qwen_v1:  48%|####7     | 1437/3000 [1:36:46<1:42:30,  3.94s/it, lr: 1.0e-04 loss: 1.001e-01]mindexpander_qwen_v1:  48%|####7     | 1437/3000 [1:36:46<1:42:30,  3.94s/it, lr: 1.0e-04 loss: 1.001e-01]mindexpander_qwen_v1:  48%|####7     | 1437/3000 [1:36:52<1:42:30,  3.94s/it, lr: 1.0e-04 loss: 3.264e-02]mindexpander_qwen_v1:  48%|####7     | 1437/3000 [1:36:52<1:42:30,  3.94s/it, lr: 1.0e-04 loss: 3.264e-02]mindexpander_qwen_v1:  48%|####7     | 1438/3000 [1:36:52<1:56:15,  4.47s/it, lr: 1.0e-04 loss: 3.264e-02]mindexpander_qwen_v1:  48%|####7     | 1438/3000 [1:36:52<1:56:15,  4.47s/it, lr: 1.0e-04 loss: 3.264e-02]mindexpander_qwen_v1:  48%|####7     | 1438/3000 [1:36:56<1:56:15,  4.47s/it, lr: 1.0e-04 loss: 5.252e-02]mindexpander_qwen_v1:  48%|####7     | 1438/3000 [1:36:56<1:56:15,  4.47s/it, lr: 1.0e-04 loss: 5.252e-02]mindexpander_qwen_v1:  48%|####7     | 1439/3000 [1:36:56<1:50:38,  4.25s/it, lr: 1.0e-04 loss: 5.252e-02]mindexpander_qwen_v1:  48%|####7     | 1439/3000 [1:36:56<1:50:38,  4.25s/it, lr: 1.0e-04 loss: 5.252e-02]mindexpander_qwen_v1:  48%|####7     | 1439/3000 [1:37:02<1:50:38,  4.25s/it, lr: 1.0e-04 loss: 3.296e-02]mindexpander_qwen_v1:  48%|####7     | 1439/3000 [1:37:02<1:50:38,  4.25s/it, lr: 1.0e-04 loss: 3.296e-02]mindexpander_qwen_v1:  48%|####8     | 1440/3000 [1:37:05<1:50:34,  4.25s/it, lr: 1.0e-04 loss: 2.629e-02]mindexpander_qwen_v1:  48%|####8     | 1440/3000 [1:37:05<1:50:34,  4.25s/it, lr: 1.0e-04 loss: 2.629e-02]mindexpander_qwen_v1:  48%|####8     | 1441/3000 [1:37:05<1:14:39,  2.87s/it, lr: 1.0e-04 loss: 2.629e-02]mindexpander_qwen_v1:  48%|####8     | 1441/3000 [1:37:05<1:14:39,  2.87s/it, lr: 1.0e-04 loss: 2.629e-02]mindexpander_qwen_v1:  48%|####8     | 1441/3000 [1:37:08<1:14:39,  2.87s/it, lr: 1.0e-04 loss: 1.066e-01]mindexpander_qwen_v1:  48%|####8     | 1441/3000 [1:37:08<1:14:39,  2.87s/it, lr: 1.0e-04 loss: 1.066e-01]mindexpander_qwen_v1:  48%|####8     | 1442/3000 [1:37:08<1:20:19,  3.09s/it, lr: 1.0e-04 loss: 1.066e-01]mindexpander_qwen_v1:  48%|####8     | 1442/3000 [1:37:08<1:20:19,  3.09s/it, lr: 1.0e-04 loss: 1.066e-01]mindexpander_qwen_v1:  48%|####8     | 1442/3000 [1:37:11<1:20:19,  3.09s/it, lr: 1.0e-04 loss: 4.275e-02]mindexpander_qwen_v1:  48%|####8     | 1442/3000 [1:37:11<1:20:19,  3.09s/it, lr: 1.0e-04 loss: 4.275e-02]mindexpander_qwen_v1:  48%|####8     | 1443/3000 [1:37:11<1:16:03,  2.93s/it, lr: 1.0e-04 loss: 4.275e-02]mindexpander_qwen_v1:  48%|####8     | 1443/3000 [1:37:11<1:16:03,  2.93s/it, lr: 1.0e-04 loss: 4.275e-02]mindexpander_qwen_v1:  48%|####8     | 1443/3000 [1:37:14<1:16:03,  2.93s/it, lr: 1.0e-04 loss: 1.347e-01]mindexpander_qwen_v1:  48%|####8     | 1443/3000 [1:37:14<1:16:03,  2.93s/it, lr: 1.0e-04 loss: 1.347e-01]mindexpander_qwen_v1:  48%|####8     | 1444/3000 [1:37:14<1:14:21,  2.87s/it, lr: 1.0e-04 loss: 1.347e-01]mindexpander_qwen_v1:  48%|####8     | 1444/3000 [1:37:14<1:14:21,  2.87s/it, lr: 1.0e-04 loss: 1.347e-01]mindexpander_qwen_v1:  48%|####8     | 1444/3000 [1:37:19<1:14:21,  2.87s/it, lr: 1.0e-04 loss: 1.714e-02]mindexpander_qwen_v1:  48%|####8     | 1444/3000 [1:37:19<1:14:21,  2.87s/it, lr: 1.0e-04 loss: 1.714e-02]mindexpander_qwen_v1:  48%|####8     | 1445/3000 [1:37:19<1:35:18,  3.68s/it, lr: 1.0e-04 loss: 1.714e-02]mindexpander_qwen_v1:  48%|####8     | 1445/3000 [1:37:19<1:35:18,  3.68s/it, lr: 1.0e-04 loss: 1.714e-02]mindexpander_qwen_v1:  48%|####8     | 1445/3000 [1:37:23<1:35:18,  3.68s/it, lr: 1.0e-04 loss: 1.174e-01]mindexpander_qwen_v1:  48%|####8     | 1445/3000 [1:37:23<1:35:18,  3.68s/it, lr: 1.0e-04 loss: 1.174e-01]mindexpander_qwen_v1:  48%|####8     | 1446/3000 [1:37:23<1:35:50,  3.70s/it, lr: 1.0e-04 loss: 1.174e-01]mindexpander_qwen_v1:  48%|####8     | 1446/3000 [1:37:23<1:35:50,  3.70s/it, lr: 1.0e-04 loss: 1.174e-01]mindexpander_qwen_v1:  48%|####8     | 1446/3000 [1:37:26<1:35:50,  3.70s/it, lr: 1.0e-04 loss: 1.949e-02]mindexpander_qwen_v1:  48%|####8     | 1446/3000 [1:37:26<1:35:50,  3.70s/it, lr: 1.0e-04 loss: 1.949e-02]mindexpander_qwen_v1:  48%|####8     | 1447/3000 [1:37:26<1:26:34,  3.35s/it, lr: 1.0e-04 loss: 1.949e-02]mindexpander_qwen_v1:  48%|####8     | 1447/3000 [1:37:26<1:26:34,  3.35s/it, lr: 1.0e-04 loss: 1.949e-02]mindexpander_qwen_v1:  48%|####8     | 1447/3000 [1:37:30<1:26:34,  3.35s/it, lr: 1.0e-04 loss: 1.753e-01]mindexpander_qwen_v1:  48%|####8     | 1447/3000 [1:37:30<1:26:34,  3.35s/it, lr: 1.0e-04 loss: 1.753e-01]mindexpander_qwen_v1:  48%|####8     | 1448/3000 [1:37:30<1:31:06,  3.52s/it, lr: 1.0e-04 loss: 1.753e-01]mindexpander_qwen_v1:  48%|####8     | 1448/3000 [1:37:30<1:31:06,  3.52s/it, lr: 1.0e-04 loss: 1.753e-01]mindexpander_qwen_v1:  48%|####8     | 1448/3000 [1:37:32<1:31:06,  3.52s/it, lr: 1.0e-04 loss: 2.248e-02]mindexpander_qwen_v1:  48%|####8     | 1448/3000 [1:37:32<1:31:06,  3.52s/it, lr: 1.0e-04 loss: 2.248e-02]mindexpander_qwen_v1:  48%|####8     | 1449/3000 [1:37:32<1:22:55,  3.21s/it, lr: 1.0e-04 loss: 2.248e-02]mindexpander_qwen_v1:  48%|####8     | 1449/3000 [1:37:32<1:22:55,  3.21s/it, lr: 1.0e-04 loss: 2.248e-02]mindexpander_qwen_v1:  48%|####8     | 1449/3000 [1:37:34<1:22:55,  3.21s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  48%|####8     | 1449/3000 [1:37:34<1:22:55,  3.21s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  48%|####8     | 1450/3000 [1:37:38<1:22:52,  3.21s/it, lr: 1.0e-04 loss: 1.790e-03]mindexpander_qwen_v1:  48%|####8     | 1450/3000 [1:37:38<1:22:52,  3.21s/it, lr: 1.0e-04 loss: 1.790e-03]mindexpander_qwen_v1:  48%|####8     | 1451/3000 [1:37:38<1:07:01,  2.60s/it, lr: 1.0e-04 loss: 1.790e-03]mindexpander_qwen_v1:  48%|####8     | 1451/3000 [1:37:38<1:07:01,  2.60s/it, lr: 1.0e-04 loss: 1.790e-03]mindexpander_qwen_v1:  48%|####8     | 1451/3000 [1:37:44<1:07:01,  2.60s/it, lr: 1.0e-04 loss: 3.399e-02]mindexpander_qwen_v1:  48%|####8     | 1451/3000 [1:37:44<1:07:01,  2.60s/it, lr: 1.0e-04 loss: 3.399e-02]mindexpander_qwen_v1:  48%|####8     | 1452/3000 [1:37:44<1:28:02,  3.41s/it, lr: 1.0e-04 loss: 3.399e-02]mindexpander_qwen_v1:  48%|####8     | 1452/3000 [1:37:44<1:28:02,  3.41s/it, lr: 1.0e-04 loss: 3.399e-02]mindexpander_qwen_v1:  48%|####8     | 1452/3000 [1:37:50<1:28:02,  3.41s/it, lr: 1.0e-04 loss: 1.292e-02]mindexpander_qwen_v1:  48%|####8     | 1452/3000 [1:37:50<1:28:02,  3.41s/it, lr: 1.0e-04 loss: 1.292e-02]mindexpander_qwen_v1:  48%|####8     | 1453/3000 [1:37:50<1:43:42,  4.02s/it, lr: 1.0e-04 loss: 1.292e-02]mindexpander_qwen_v1:  48%|####8     | 1453/3000 [1:37:50<1:43:42,  4.02s/it, lr: 1.0e-04 loss: 1.292e-02]mindexpander_qwen_v1:  48%|####8     | 1453/3000 [1:37:54<1:43:42,  4.02s/it, lr: 1.0e-04 loss: 3.805e-02]mindexpander_qwen_v1:  48%|####8     | 1453/3000 [1:37:54<1:43:42,  4.02s/it, lr: 1.0e-04 loss: 3.805e-02]mindexpander_qwen_v1:  48%|####8     | 1454/3000 [1:37:54<1:41:41,  3.95s/it, lr: 1.0e-04 loss: 3.805e-02]mindexpander_qwen_v1:  48%|####8     | 1454/3000 [1:37:54<1:41:41,  3.95s/it, lr: 1.0e-04 loss: 3.805e-02]mindexpander_qwen_v1:  48%|####8     | 1454/3000 [1:37:59<1:41:41,  3.95s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  48%|####8     | 1454/3000 [1:37:59<1:41:41,  3.95s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  48%|####8     | 1455/3000 [1:37:59<1:54:38,  4.45s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  48%|####8     | 1455/3000 [1:37:59<1:54:38,  4.45s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  48%|####8     | 1455/3000 [1:38:05<1:54:38,  4.45s/it, lr: 1.0e-04 loss: 7.375e-02]mindexpander_qwen_v1:  48%|####8     | 1455/3000 [1:38:05<1:54:38,  4.45s/it, lr: 1.0e-04 loss: 7.375e-02]mindexpander_qwen_v1:  49%|####8     | 1456/3000 [1:38:05<2:05:14,  4.87s/it, lr: 1.0e-04 loss: 7.375e-02]mindexpander_qwen_v1:  49%|####8     | 1456/3000 [1:38:05<2:05:14,  4.87s/it, lr: 1.0e-04 loss: 7.375e-02]mindexpander_qwen_v1:  49%|####8     | 1456/3000 [1:38:09<2:05:14,  4.87s/it, lr: 1.0e-04 loss: 4.042e-02]mindexpander_qwen_v1:  49%|####8     | 1456/3000 [1:38:09<2:05:14,  4.87s/it, lr: 1.0e-04 loss: 4.042e-02]mindexpander_qwen_v1:  49%|####8     | 1457/3000 [1:38:09<1:56:48,  4.54s/it, lr: 1.0e-04 loss: 4.042e-02]mindexpander_qwen_v1:  49%|####8     | 1457/3000 [1:38:09<1:56:48,  4.54s/it, lr: 1.0e-04 loss: 4.042e-02]mindexpander_qwen_v1:  49%|####8     | 1457/3000 [1:38:15<1:56:48,  4.54s/it, lr: 1.0e-04 loss: 1.363e-01]mindexpander_qwen_v1:  49%|####8     | 1457/3000 [1:38:15<1:56:48,  4.54s/it, lr: 1.0e-04 loss: 1.363e-01]mindexpander_qwen_v1:  49%|####8     | 1458/3000 [1:38:15<2:05:53,  4.90s/it, lr: 1.0e-04 loss: 1.363e-01]mindexpander_qwen_v1:  49%|####8     | 1458/3000 [1:38:15<2:05:53,  4.90s/it, lr: 1.0e-04 loss: 1.363e-01]mindexpander_qwen_v1:  49%|####8     | 1458/3000 [1:38:21<2:05:53,  4.90s/it, lr: 1.0e-04 loss: 2.359e-02]mindexpander_qwen_v1:  49%|####8     | 1458/3000 [1:38:21<2:05:53,  4.90s/it, lr: 1.0e-04 loss: 2.359e-02]mindexpander_qwen_v1:  49%|####8     | 1459/3000 [1:38:21<2:12:23,  5.16s/it, lr: 1.0e-04 loss: 2.359e-02]mindexpander_qwen_v1:  49%|####8     | 1459/3000 [1:38:21<2:12:23,  5.16s/it, lr: 1.0e-04 loss: 2.359e-02]mindexpander_qwen_v1:  49%|####8     | 1459/3000 [1:38:23<2:12:23,  5.16s/it, lr: 1.0e-04 loss: 1.564e-01]mindexpander_qwen_v1:  49%|####8     | 1459/3000 [1:38:23<2:12:23,  5.16s/it, lr: 1.0e-04 loss: 1.564e-01]mindexpander_qwen_v1:  49%|####8     | 1460/3000 [1:38:29<2:12:18,  5.16s/it, lr: 1.0e-04 loss: 4.185e-02]mindexpander_qwen_v1:  49%|####8     | 1460/3000 [1:38:29<2:12:18,  5.16s/it, lr: 1.0e-04 loss: 4.185e-02]mindexpander_qwen_v1:  49%|####8     | 1461/3000 [1:38:29<1:45:34,  4.12s/it, lr: 1.0e-04 loss: 4.185e-02]mindexpander_qwen_v1:  49%|####8     | 1461/3000 [1:38:29<1:45:34,  4.12s/it, lr: 1.0e-04 loss: 4.185e-02]mindexpander_qwen_v1:  49%|####8     | 1461/3000 [1:38:35<1:45:34,  4.12s/it, lr: 1.0e-04 loss: 1.923e-02]mindexpander_qwen_v1:  49%|####8     | 1461/3000 [1:38:35<1:45:34,  4.12s/it, lr: 1.0e-04 loss: 1.923e-02]mindexpander_qwen_v1:  49%|####8     | 1462/3000 [1:38:35<1:55:52,  4.52s/it, lr: 1.0e-04 loss: 1.923e-02]mindexpander_qwen_v1:  49%|####8     | 1462/3000 [1:38:35<1:55:52,  4.52s/it, lr: 1.0e-04 loss: 1.923e-02]mindexpander_qwen_v1:  49%|####8     | 1462/3000 [1:38:37<1:55:52,  4.52s/it, lr: 1.0e-04 loss: 1.463e-01]mindexpander_qwen_v1:  49%|####8     | 1462/3000 [1:38:37<1:55:52,  4.52s/it, lr: 1.0e-04 loss: 1.463e-01]mindexpander_qwen_v1:  49%|####8     | 1463/3000 [1:38:37<1:42:00,  3.98s/it, lr: 1.0e-04 loss: 1.463e-01]mindexpander_qwen_v1:  49%|####8     | 1463/3000 [1:38:37<1:42:00,  3.98s/it, lr: 1.0e-04 loss: 1.463e-01]mindexpander_qwen_v1:  49%|####8     | 1463/3000 [1:38:40<1:42:00,  3.98s/it, lr: 1.0e-04 loss: 1.362e-01]mindexpander_qwen_v1:  49%|####8     | 1463/3000 [1:38:40<1:42:00,  3.98s/it, lr: 1.0e-04 loss: 1.362e-01]mindexpander_qwen_v1:  49%|####8     | 1464/3000 [1:38:40<1:32:39,  3.62s/it, lr: 1.0e-04 loss: 1.362e-01]mindexpander_qwen_v1:  49%|####8     | 1464/3000 [1:38:40<1:32:39,  3.62s/it, lr: 1.0e-04 loss: 1.362e-01]mindexpander_qwen_v1:  49%|####8     | 1464/3000 [1:38:44<1:32:39,  3.62s/it, lr: 1.0e-04 loss: 9.334e-02]mindexpander_qwen_v1:  49%|####8     | 1464/3000 [1:38:44<1:32:39,  3.62s/it, lr: 1.0e-04 loss: 9.334e-02]mindexpander_qwen_v1:  49%|####8     | 1465/3000 [1:38:44<1:33:29,  3.65s/it, lr: 1.0e-04 loss: 9.334e-02]mindexpander_qwen_v1:  49%|####8     | 1465/3000 [1:38:44<1:33:29,  3.65s/it, lr: 1.0e-04 loss: 9.334e-02]mindexpander_qwen_v1:  49%|####8     | 1465/3000 [1:38:47<1:33:29,  3.65s/it, lr: 1.0e-04 loss: 3.026e-02]mindexpander_qwen_v1:  49%|####8     | 1465/3000 [1:38:47<1:33:29,  3.65s/it, lr: 1.0e-04 loss: 3.026e-02]mindexpander_qwen_v1:  49%|####8     | 1466/3000 [1:38:47<1:34:04,  3.68s/it, lr: 1.0e-04 loss: 3.026e-02]mindexpander_qwen_v1:  49%|####8     | 1466/3000 [1:38:47<1:34:04,  3.68s/it, lr: 1.0e-04 loss: 3.026e-02]mindexpander_qwen_v1:  49%|####8     | 1466/3000 [1:38:51<1:34:04,  3.68s/it, lr: 1.0e-04 loss: 1.980e-01]mindexpander_qwen_v1:  49%|####8     | 1466/3000 [1:38:51<1:34:04,  3.68s/it, lr: 1.0e-04 loss: 1.980e-01]mindexpander_qwen_v1:  49%|####8     | 1467/3000 [1:38:51<1:34:26,  3.70s/it, lr: 1.0e-04 loss: 1.980e-01]mindexpander_qwen_v1:  49%|####8     | 1467/3000 [1:38:51<1:34:26,  3.70s/it, lr: 1.0e-04 loss: 1.980e-01]mindexpander_qwen_v1:  49%|####8     | 1467/3000 [1:38:54<1:34:26,  3.70s/it, lr: 1.0e-04 loss: 2.501e-02]mindexpander_qwen_v1:  49%|####8     | 1467/3000 [1:38:54<1:34:26,  3.70s/it, lr: 1.0e-04 loss: 2.501e-02]mindexpander_qwen_v1:  49%|####8     | 1468/3000 [1:38:54<1:26:43,  3.40s/it, lr: 1.0e-04 loss: 2.501e-02]mindexpander_qwen_v1:  49%|####8     | 1468/3000 [1:38:54<1:26:43,  3.40s/it, lr: 1.0e-04 loss: 2.501e-02]mindexpander_qwen_v1:  49%|####8     | 1468/3000 [1:38:57<1:26:43,  3.40s/it, lr: 1.0e-04 loss: 1.793e-01]mindexpander_qwen_v1:  49%|####8     | 1468/3000 [1:38:57<1:26:43,  3.40s/it, lr: 1.0e-04 loss: 1.793e-01]mindexpander_qwen_v1:  49%|####8     | 1469/3000 [1:38:57<1:29:16,  3.50s/it, lr: 1.0e-04 loss: 1.793e-01]mindexpander_qwen_v1:  49%|####8     | 1469/3000 [1:38:57<1:29:16,  3.50s/it, lr: 1.0e-04 loss: 1.793e-01]mindexpander_qwen_v1:  49%|####8     | 1469/3000 [1:39:04<1:29:16,  3.50s/it, lr: 1.0e-04 loss: 8.083e-02]mindexpander_qwen_v1:  49%|####8     | 1469/3000 [1:39:04<1:29:16,  3.50s/it, lr: 1.0e-04 loss: 8.083e-02]mindexpander_qwen_v1:  49%|####9     | 1470/3000 [1:39:07<1:29:12,  3.50s/it, lr: 1.0e-04 loss: 4.508e-02]mindexpander_qwen_v1:  49%|####9     | 1470/3000 [1:39:07<1:29:12,  3.50s/it, lr: 1.0e-04 loss: 4.508e-02]mindexpander_qwen_v1:  49%|####9     | 1471/3000 [1:39:07<1:10:16,  2.76s/it, lr: 1.0e-04 loss: 4.508e-02]mindexpander_qwen_v1:  49%|####9     | 1471/3000 [1:39:07<1:10:16,  2.76s/it, lr: 1.0e-04 loss: 4.508e-02]mindexpander_qwen_v1:  49%|####9     | 1471/3000 [1:39:10<1:10:16,  2.76s/it, lr: 1.0e-04 loss: 1.818e-01]mindexpander_qwen_v1:  49%|####9     | 1471/3000 [1:39:10<1:10:16,  2.76s/it, lr: 1.0e-04 loss: 1.818e-01]mindexpander_qwen_v1:  49%|####9     | 1472/3000 [1:39:10<1:10:05,  2.75s/it, lr: 1.0e-04 loss: 1.818e-01]mindexpander_qwen_v1:  49%|####9     | 1472/3000 [1:39:10<1:10:05,  2.75s/it, lr: 1.0e-04 loss: 1.818e-01]mindexpander_qwen_v1:  49%|####9     | 1472/3000 [1:39:16<1:10:05,  2.75s/it, lr: 1.0e-04 loss: 9.208e-03]mindexpander_qwen_v1:  49%|####9     | 1472/3000 [1:39:16<1:10:05,  2.75s/it, lr: 1.0e-04 loss: 9.208e-03]mindexpander_qwen_v1:  49%|####9     | 1473/3000 [1:39:16<1:29:58,  3.54s/it, lr: 1.0e-04 loss: 9.208e-03]mindexpander_qwen_v1:  49%|####9     | 1473/3000 [1:39:16<1:29:58,  3.54s/it, lr: 1.0e-04 loss: 9.208e-03]mindexpander_qwen_v1:  49%|####9     | 1473/3000 [1:39:22<1:29:58,  3.54s/it, lr: 1.0e-04 loss: 6.747e-03]mindexpander_qwen_v1:  49%|####9     | 1473/3000 [1:39:22<1:29:58,  3.54s/it, lr: 1.0e-04 loss: 6.747e-03]mindexpander_qwen_v1:  49%|####9     | 1474/3000 [1:39:22<1:45:16,  4.14s/it, lr: 1.0e-04 loss: 6.747e-03]mindexpander_qwen_v1:  49%|####9     | 1474/3000 [1:39:22<1:45:16,  4.14s/it, lr: 1.0e-04 loss: 6.747e-03]mindexpander_qwen_v1:  49%|####9     | 1474/3000 [1:39:25<1:45:16,  4.14s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  49%|####9     | 1474/3000 [1:39:25<1:45:16,  4.14s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  49%|####9     | 1475/3000 [1:39:25<1:42:23,  4.03s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  49%|####9     | 1475/3000 [1:39:25<1:42:23,  4.03s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  49%|####9     | 1475/3000 [1:39:31<1:42:23,  4.03s/it, lr: 1.0e-04 loss: 1.634e-01]mindexpander_qwen_v1:  49%|####9     | 1475/3000 [1:39:31<1:42:23,  4.03s/it, lr: 1.0e-04 loss: 1.634e-01]mindexpander_qwen_v1:  49%|####9     | 1476/3000 [1:39:31<1:55:51,  4.56s/it, lr: 1.0e-04 loss: 1.634e-01]mindexpander_qwen_v1:  49%|####9     | 1476/3000 [1:39:31<1:55:51,  4.56s/it, lr: 1.0e-04 loss: 1.634e-01]mindexpander_qwen_v1:  49%|####9     | 1476/3000 [1:39:34<1:55:51,  4.56s/it, lr: 1.0e-04 loss: 2.678e-03]mindexpander_qwen_v1:  49%|####9     | 1476/3000 [1:39:34<1:55:51,  4.56s/it, lr: 1.0e-04 loss: 2.678e-03]mindexpander_qwen_v1:  49%|####9     | 1477/3000 [1:39:34<1:40:17,  3.95s/it, lr: 1.0e-04 loss: 2.678e-03]mindexpander_qwen_v1:  49%|####9     | 1477/3000 [1:39:34<1:40:17,  3.95s/it, lr: 1.0e-04 loss: 2.678e-03]mindexpander_qwen_v1:  49%|####9     | 1477/3000 [1:39:39<1:40:17,  3.95s/it, lr: 1.0e-04 loss: 3.377e-02]mindexpander_qwen_v1:  49%|####9     | 1477/3000 [1:39:39<1:40:17,  3.95s/it, lr: 1.0e-04 loss: 3.377e-02]mindexpander_qwen_v1:  49%|####9     | 1478/3000 [1:39:39<1:53:37,  4.48s/it, lr: 1.0e-04 loss: 3.377e-02]mindexpander_qwen_v1:  49%|####9     | 1478/3000 [1:39:39<1:53:37,  4.48s/it, lr: 1.0e-04 loss: 3.377e-02]mindexpander_qwen_v1:  49%|####9     | 1478/3000 [1:39:43<1:53:37,  4.48s/it, lr: 1.0e-04 loss: 3.939e-02]mindexpander_qwen_v1:  49%|####9     | 1478/3000 [1:39:43<1:53:37,  4.48s/it, lr: 1.0e-04 loss: 3.939e-02]mindexpander_qwen_v1:  49%|####9     | 1479/3000 [1:39:43<1:48:01,  4.26s/it, lr: 1.0e-04 loss: 3.939e-02]mindexpander_qwen_v1:  49%|####9     | 1479/3000 [1:39:43<1:48:01,  4.26s/it, lr: 1.0e-04 loss: 3.939e-02]mindexpander_qwen_v1:  49%|####9     | 1479/3000 [1:39:46<1:48:01,  4.26s/it, lr: 1.0e-04 loss: 1.994e-01]mindexpander_qwen_v1:  49%|####9     | 1479/3000 [1:39:46<1:48:01,  4.26s/it, lr: 1.0e-04 loss: 1.994e-01]mindexpander_qwen_v1:  49%|####9     | 1480/3000 [1:39:48<1:47:56,  4.26s/it, lr: 1.0e-04 loss: 1.403e-01]mindexpander_qwen_v1:  49%|####9     | 1480/3000 [1:39:48<1:47:56,  4.26s/it, lr: 1.0e-04 loss: 1.403e-01]mindexpander_qwen_v1:  49%|####9     | 1481/3000 [1:39:48<1:12:41,  2.87s/it, lr: 1.0e-04 loss: 1.403e-01]mindexpander_qwen_v1:  49%|####9     | 1481/3000 [1:39:48<1:12:41,  2.87s/it, lr: 1.0e-04 loss: 1.403e-01]mindexpander_qwen_v1:  49%|####9     | 1481/3000 [1:39:51<1:12:41,  2.87s/it, lr: 1.0e-04 loss: 1.659e-01]mindexpander_qwen_v1:  49%|####9     | 1481/3000 [1:39:51<1:12:41,  2.87s/it, lr: 1.0e-04 loss: 1.659e-01]mindexpander_qwen_v1:  49%|####9     | 1482/3000 [1:39:51<1:09:59,  2.77s/it, lr: 1.0e-04 loss: 1.659e-01]mindexpander_qwen_v1:  49%|####9     | 1482/3000 [1:39:51<1:09:59,  2.77s/it, lr: 1.0e-04 loss: 1.659e-01]mindexpander_qwen_v1:  49%|####9     | 1482/3000 [1:39:54<1:09:59,  2.77s/it, lr: 1.0e-04 loss: 2.087e-02]mindexpander_qwen_v1:  49%|####9     | 1482/3000 [1:39:54<1:09:59,  2.77s/it, lr: 1.0e-04 loss: 2.087e-02]mindexpander_qwen_v1:  49%|####9     | 1483/3000 [1:39:54<1:16:19,  3.02s/it, lr: 1.0e-04 loss: 2.087e-02]mindexpander_qwen_v1:  49%|####9     | 1483/3000 [1:39:54<1:16:19,  3.02s/it, lr: 1.0e-04 loss: 2.087e-02]mindexpander_qwen_v1:  49%|####9     | 1483/3000 [1:39:58<1:16:19,  3.02s/it, lr: 1.0e-04 loss: 1.039e-01]mindexpander_qwen_v1:  49%|####9     | 1483/3000 [1:39:58<1:16:19,  3.02s/it, lr: 1.0e-04 loss: 1.039e-01]mindexpander_qwen_v1:  49%|####9     | 1484/3000 [1:39:58<1:22:19,  3.26s/it, lr: 1.0e-04 loss: 1.039e-01]mindexpander_qwen_v1:  49%|####9     | 1484/3000 [1:39:58<1:22:19,  3.26s/it, lr: 1.0e-04 loss: 1.039e-01]mindexpander_qwen_v1:  49%|####9     | 1484/3000 [1:40:04<1:22:19,  3.26s/it, lr: 1.0e-04 loss: 1.723e-01]mindexpander_qwen_v1:  49%|####9     | 1484/3000 [1:40:04<1:22:19,  3.26s/it, lr: 1.0e-04 loss: 1.723e-01]mindexpander_qwen_v1:  50%|####9     | 1485/3000 [1:40:04<1:39:51,  3.95s/it, lr: 1.0e-04 loss: 1.723e-01]mindexpander_qwen_v1:  50%|####9     | 1485/3000 [1:40:04<1:39:51,  3.95s/it, lr: 1.0e-04 loss: 1.723e-01]mindexpander_qwen_v1:  50%|####9     | 1485/3000 [1:40:07<1:39:51,  3.95s/it, lr: 1.0e-04 loss: 3.489e-02]mindexpander_qwen_v1:  50%|####9     | 1485/3000 [1:40:07<1:39:51,  3.95s/it, lr: 1.0e-04 loss: 3.489e-02]mindexpander_qwen_v1:  50%|####9     | 1486/3000 [1:40:07<1:28:54,  3.52s/it, lr: 1.0e-04 loss: 3.489e-02]mindexpander_qwen_v1:  50%|####9     | 1486/3000 [1:40:07<1:28:54,  3.52s/it, lr: 1.0e-04 loss: 3.489e-02]mindexpander_qwen_v1:  50%|####9     | 1486/3000 [1:40:12<1:28:54,  3.52s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  50%|####9     | 1486/3000 [1:40:12<1:28:54,  3.52s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  50%|####9     | 1487/3000 [1:40:12<1:45:05,  4.17s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  50%|####9     | 1487/3000 [1:40:12<1:45:05,  4.17s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  50%|####9     | 1487/3000 [1:40:16<1:45:05,  4.17s/it, lr: 1.0e-04 loss: 1.180e-02]mindexpander_qwen_v1:  50%|####9     | 1487/3000 [1:40:16<1:45:05,  4.17s/it, lr: 1.0e-04 loss: 1.180e-02]mindexpander_qwen_v1:  50%|####9     | 1488/3000 [1:40:16<1:42:59,  4.09s/it, lr: 1.0e-04 loss: 1.180e-02]mindexpander_qwen_v1:  50%|####9     | 1488/3000 [1:40:16<1:42:59,  4.09s/it, lr: 1.0e-04 loss: 1.180e-02]mindexpander_qwen_v1:  50%|####9     | 1488/3000 [1:40:19<1:42:59,  4.09s/it, lr: 1.0e-04 loss: 1.715e-01]mindexpander_qwen_v1:  50%|####9     | 1488/3000 [1:40:19<1:42:59,  4.09s/it, lr: 1.0e-04 loss: 1.715e-01]mindexpander_qwen_v1:  50%|####9     | 1489/3000 [1:40:19<1:30:43,  3.60s/it, lr: 1.0e-04 loss: 1.715e-01]mindexpander_qwen_v1:  50%|####9     | 1489/3000 [1:40:19<1:30:43,  3.60s/it, lr: 1.0e-04 loss: 1.715e-01]mindexpander_qwen_v1:  50%|####9     | 1489/3000 [1:40:22<1:30:43,  3.60s/it, lr: 1.0e-04 loss: 3.276e-02]mindexpander_qwen_v1:  50%|####9     | 1489/3000 [1:40:22<1:30:43,  3.60s/it, lr: 1.0e-04 loss: 3.276e-02]mindexpander_qwen_v1:  50%|####9     | 1490/3000 [1:40:25<1:30:40,  3.60s/it, lr: 1.0e-04 loss: 1.105e-01]mindexpander_qwen_v1:  50%|####9     | 1490/3000 [1:40:25<1:30:40,  3.60s/it, lr: 1.0e-04 loss: 1.105e-01]mindexpander_qwen_v1:  50%|####9     | 1491/3000 [1:40:25<1:03:14,  2.51s/it, lr: 1.0e-04 loss: 1.105e-01]mindexpander_qwen_v1:  50%|####9     | 1491/3000 [1:40:25<1:03:14,  2.51s/it, lr: 1.0e-04 loss: 1.105e-01]mindexpander_qwen_v1:  50%|####9     | 1491/3000 [1:40:27<1:03:14,  2.51s/it, lr: 1.0e-04 loss: 1.417e-01]mindexpander_qwen_v1:  50%|####9     | 1491/3000 [1:40:27<1:03:14,  2.51s/it, lr: 1.0e-04 loss: 1.417e-01]mindexpander_qwen_v1:  50%|####9     | 1492/3000 [1:40:27<1:03:55,  2.54s/it, lr: 1.0e-04 loss: 1.417e-01]mindexpander_qwen_v1:  50%|####9     | 1492/3000 [1:40:27<1:03:55,  2.54s/it, lr: 1.0e-04 loss: 1.417e-01]mindexpander_qwen_v1:  50%|####9     | 1492/3000 [1:40:31<1:03:55,  2.54s/it, lr: 1.0e-04 loss: 1.216e-01]mindexpander_qwen_v1:  50%|####9     | 1492/3000 [1:40:31<1:03:55,  2.54s/it, lr: 1.0e-04 loss: 1.216e-01]mindexpander_qwen_v1:  50%|####9     | 1493/3000 [1:40:31<1:11:39,  2.85s/it, lr: 1.0e-04 loss: 1.216e-01]mindexpander_qwen_v1:  50%|####9     | 1493/3000 [1:40:31<1:11:39,  2.85s/it, lr: 1.0e-04 loss: 1.216e-01]mindexpander_qwen_v1:  50%|####9     | 1493/3000 [1:40:37<1:11:39,  2.85s/it, lr: 1.0e-04 loss: 4.267e-02]mindexpander_qwen_v1:  50%|####9     | 1493/3000 [1:40:37<1:11:39,  2.85s/it, lr: 1.0e-04 loss: 4.267e-02]mindexpander_qwen_v1:  50%|####9     | 1494/3000 [1:40:37<1:31:14,  3.63s/it, lr: 1.0e-04 loss: 4.267e-02]mindexpander_qwen_v1:  50%|####9     | 1494/3000 [1:40:37<1:31:14,  3.63s/it, lr: 1.0e-04 loss: 4.267e-02]mindexpander_qwen_v1:  50%|####9     | 1494/3000 [1:40:43<1:31:14,  3.63s/it, lr: 1.0e-04 loss: 1.127e-02]mindexpander_qwen_v1:  50%|####9     | 1494/3000 [1:40:43<1:31:14,  3.63s/it, lr: 1.0e-04 loss: 1.127e-02]mindexpander_qwen_v1:  50%|####9     | 1495/3000 [1:40:43<1:45:57,  4.22s/it, lr: 1.0e-04 loss: 1.127e-02]mindexpander_qwen_v1:  50%|####9     | 1495/3000 [1:40:43<1:45:57,  4.22s/it, lr: 1.0e-04 loss: 1.127e-02]mindexpander_qwen_v1:  50%|####9     | 1495/3000 [1:40:48<1:45:57,  4.22s/it, lr: 1.0e-04 loss: 4.346e-02]mindexpander_qwen_v1:  50%|####9     | 1495/3000 [1:40:48<1:45:57,  4.22s/it, lr: 1.0e-04 loss: 4.346e-02]mindexpander_qwen_v1:  50%|####9     | 1496/3000 [1:40:48<1:57:37,  4.69s/it, lr: 1.0e-04 loss: 4.346e-02]mindexpander_qwen_v1:  50%|####9     | 1496/3000 [1:40:48<1:57:37,  4.69s/it, lr: 1.0e-04 loss: 4.346e-02]mindexpander_qwen_v1:  50%|####9     | 1496/3000 [1:40:51<1:57:37,  4.69s/it, lr: 1.0e-04 loss: 1.015e-01]mindexpander_qwen_v1:  50%|####9     | 1496/3000 [1:40:51<1:57:37,  4.69s/it, lr: 1.0e-04 loss: 1.015e-01]mindexpander_qwen_v1:  50%|####9     | 1497/3000 [1:40:51<1:41:14,  4.04s/it, lr: 1.0e-04 loss: 1.015e-01]mindexpander_qwen_v1:  50%|####9     | 1497/3000 [1:40:51<1:41:14,  4.04s/it, lr: 1.0e-04 loss: 1.015e-01]mindexpander_qwen_v1:  50%|####9     | 1497/3000 [1:40:55<1:41:14,  4.04s/it, lr: 1.0e-04 loss: 7.588e-02]mindexpander_qwen_v1:  50%|####9     | 1497/3000 [1:40:55<1:41:14,  4.04s/it, lr: 1.0e-04 loss: 7.588e-02]mindexpander_qwen_v1:  50%|####9     | 1498/3000 [1:40:55<1:38:57,  3.95s/it, lr: 1.0e-04 loss: 7.588e-02]mindexpander_qwen_v1:  50%|####9     | 1498/3000 [1:40:55<1:38:57,  3.95s/it, lr: 1.0e-04 loss: 7.588e-02]mindexpander_qwen_v1:  50%|####9     | 1498/3000 [1:40:58<1:38:57,  3.95s/it, lr: 1.0e-04 loss: 1.703e-01]mindexpander_qwen_v1:  50%|####9     | 1498/3000 [1:40:58<1:38:57,  3.95s/it, lr: 1.0e-04 loss: 1.703e-01]mindexpander_qwen_v1:  50%|####9     | 1499/3000 [1:40:58<1:37:15,  3.89s/it, lr: 1.0e-04 loss: 1.703e-01]mindexpander_qwen_v1:  50%|####9     | 1499/3000 [1:40:58<1:37:15,  3.89s/it, lr: 1.0e-04 loss: 1.703e-01]mindexpander_qwen_v1:  50%|####9     | 1499/3000 [1:41:03<1:37:15,  3.89s/it, lr: 1.0e-04 loss: 3.033e-02]mindexpander_qwen_v1:  50%|####9     | 1499/3000 [1:41:03<1:37:15,  3.89s/it, lr: 1.0e-04 loss: 3.033e-02]
+Saving at step 1500
+Saved checkpoint to /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000001500.safetensors
+Saved optimizer to /app/ai-toolkit/output/mindexpander_qwen_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000000500.safetensors
+
+
+Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:   0%|          | 0/2 [00:00<?, ?it/s][A[A
+
+Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.46s/it]Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.46s/it][A[A
+
+Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.67s/it]Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.67s/it][A[A
+
+                                                                                                                                [A[Amindexpander_qwen_v1:  50%|#####     | 1500/3000 [1:41:09<1:37:12,  3.89s/it, lr: 1.0e-04 loss: 4.534e-02]mindexpander_qwen_v1:  50%|#####     | 1500/3000 [1:41:09<1:37:12,  3.89s/it, lr: 1.0e-04 loss: 4.534e-02]mindexpander_qwen_v1:  50%|#####     | 1501/3000 [1:41:09<1:26:36,  3.47s/it, lr: 1.0e-04 loss: 4.534e-02]mindexpander_qwen_v1:  50%|#####     | 1501/3000 [1:41:09<1:26:36,  3.47s/it, lr: 1.0e-04 loss: 4.534e-02]mindexpander_qwen_v1:  50%|#####     | 1501/3000 [1:41:11<1:26:36,  3.47s/it, lr: 1.0e-04 loss: 8.788e-02]mindexpander_qwen_v1:  50%|#####     | 1501/3000 [1:41:11<1:26:36,  3.47s/it, lr: 1.0e-04 loss: 8.788e-02]mindexpander_qwen_v1:  50%|#####     | 1502/3000 [1:41:11<1:20:18,  3.22s/it, lr: 1.0e-04 loss: 8.788e-02]mindexpander_qwen_v1:  50%|#####     | 1502/3000 [1:41:11<1:20:18,  3.22s/it, lr: 1.0e-04 loss: 8.788e-02]mindexpander_qwen_v1:  50%|#####     | 1502/3000 [1:41:15<1:20:18,  3.22s/it, lr: 1.0e-04 loss: 5.074e-02]mindexpander_qwen_v1:  50%|#####     | 1502/3000 [1:41:15<1:20:18,  3.22s/it, lr: 1.0e-04 loss: 5.074e-02]mindexpander_qwen_v1:  50%|#####     | 1503/3000 [1:41:15<1:23:37,  3.35s/it, lr: 1.0e-04 loss: 5.074e-02]mindexpander_qwen_v1:  50%|#####     | 1503/3000 [1:41:15<1:23:37,  3.35s/it, lr: 1.0e-04 loss: 5.074e-02]mindexpander_qwen_v1:  50%|#####     | 1503/3000 [1:41:17<1:23:37,  3.35s/it, lr: 1.0e-04 loss: 3.528e-02]mindexpander_qwen_v1:  50%|#####     | 1503/3000 [1:41:17<1:23:37,  3.35s/it, lr: 1.0e-04 loss: 3.528e-02]mindexpander_qwen_v1:  50%|#####     | 1504/3000 [1:41:17<1:18:45,  3.16s/it, lr: 1.0e-04 loss: 3.528e-02]mindexpander_qwen_v1:  50%|#####     | 1504/3000 [1:41:17<1:18:45,  3.16s/it, lr: 1.0e-04 loss: 3.528e-02]mindexpander_qwen_v1:  50%|#####     | 1504/3000 [1:41:21<1:18:45,  3.16s/it, lr: 1.0e-04 loss: 1.050e-01]mindexpander_qwen_v1:  50%|#####     | 1504/3000 [1:41:21<1:18:45,  3.16s/it, lr: 1.0e-04 loss: 1.050e-01]mindexpander_qwen_v1:  50%|#####     | 1505/3000 [1:41:21<1:22:42,  3.32s/it, lr: 1.0e-04 loss: 1.050e-01]mindexpander_qwen_v1:  50%|#####     | 1505/3000 [1:41:21<1:22:42,  3.32s/it, lr: 1.0e-04 loss: 1.050e-01]mindexpander_qwen_v1:  50%|#####     | 1505/3000 [1:41:24<1:22:42,  3.32s/it, lr: 1.0e-04 loss: 4.980e-02]mindexpander_qwen_v1:  50%|#####     | 1505/3000 [1:41:24<1:22:42,  3.32s/it, lr: 1.0e-04 loss: 4.980e-02]mindexpander_qwen_v1:  50%|#####     | 1506/3000 [1:41:24<1:16:28,  3.07s/it, lr: 1.0e-04 loss: 4.980e-02]mindexpander_qwen_v1:  50%|#####     | 1506/3000 [1:41:24<1:16:28,  3.07s/it, lr: 1.0e-04 loss: 4.980e-02]mindexpander_qwen_v1:  50%|#####     | 1506/3000 [1:41:29<1:16:28,  3.07s/it, lr: 1.0e-04 loss: 1.204e-02]mindexpander_qwen_v1:  50%|#####     | 1506/3000 [1:41:29<1:16:28,  3.07s/it, lr: 1.0e-04 loss: 1.204e-02]mindexpander_qwen_v1:  50%|#####     | 1507/3000 [1:41:29<1:35:41,  3.85s/it, lr: 1.0e-04 loss: 1.204e-02]mindexpander_qwen_v1:  50%|#####     | 1507/3000 [1:41:29<1:35:41,  3.85s/it, lr: 1.0e-04 loss: 1.204e-02]mindexpander_qwen_v1:  50%|#####     | 1507/3000 [1:41:35<1:35:41,  3.85s/it, lr: 1.0e-04 loss: 1.073e-01]mindexpander_qwen_v1:  50%|#####     | 1507/3000 [1:41:35<1:35:41,  3.85s/it, lr: 1.0e-04 loss: 1.073e-01]mindexpander_qwen_v1:  50%|#####     | 1508/3000 [1:41:35<1:50:22,  4.44s/it, lr: 1.0e-04 loss: 1.073e-01]mindexpander_qwen_v1:  50%|#####     | 1508/3000 [1:41:35<1:50:22,  4.44s/it, lr: 1.0e-04 loss: 1.073e-01]mindexpander_qwen_v1:  50%|#####     | 1508/3000 [1:41:39<1:50:22,  4.44s/it, lr: 1.0e-04 loss: 7.592e-02]mindexpander_qwen_v1:  50%|#####     | 1508/3000 [1:41:39<1:50:22,  4.44s/it, lr: 1.0e-04 loss: 7.592e-02]mindexpander_qwen_v1:  50%|#####     | 1509/3000 [1:41:39<1:45:11,  4.23s/it, lr: 1.0e-04 loss: 7.592e-02]mindexpander_qwen_v1:  50%|#####     | 1509/3000 [1:41:39<1:45:11,  4.23s/it, lr: 1.0e-04 loss: 7.592e-02]mindexpander_qwen_v1:  50%|#####     | 1509/3000 [1:41:45<1:45:11,  4.23s/it, lr: 1.0e-04 loss: 5.061e-02]mindexpander_qwen_v1:  50%|#####     | 1509/3000 [1:41:45<1:45:11,  4.23s/it, lr: 1.0e-04 loss: 5.061e-02]mindexpander_qwen_v1:  50%|#####     | 1510/3000 [1:41:48<1:45:06,  4.23s/it, lr: 1.0e-04 loss: 1.303e-01]mindexpander_qwen_v1:  50%|#####     | 1510/3000 [1:41:48<1:45:06,  4.23s/it, lr: 1.0e-04 loss: 1.303e-01]mindexpander_qwen_v1:  50%|#####     | 1511/3000 [1:41:48<1:18:14,  3.15s/it, lr: 1.0e-04 loss: 1.303e-01]mindexpander_qwen_v1:  50%|#####     | 1511/3000 [1:41:48<1:18:14,  3.15s/it, lr: 1.0e-04 loss: 1.303e-01]mindexpander_qwen_v1:  50%|#####     | 1511/3000 [1:41:51<1:18:14,  3.15s/it, lr: 1.0e-04 loss: 7.181e-02]mindexpander_qwen_v1:  50%|#####     | 1511/3000 [1:41:51<1:18:14,  3.15s/it, lr: 1.0e-04 loss: 7.181e-02]mindexpander_qwen_v1:  50%|#####     | 1512/3000 [1:41:51<1:15:04,  3.03s/it, lr: 1.0e-04 loss: 7.181e-02]mindexpander_qwen_v1:  50%|#####     | 1512/3000 [1:41:51<1:15:04,  3.03s/it, lr: 1.0e-04 loss: 7.181e-02]mindexpander_qwen_v1:  50%|#####     | 1512/3000 [1:41:55<1:15:04,  3.03s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  50%|#####     | 1512/3000 [1:41:55<1:15:04,  3.03s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  50%|#####     | 1513/3000 [1:41:55<1:19:38,  3.21s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  50%|#####     | 1513/3000 [1:41:55<1:19:38,  3.21s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  50%|#####     | 1513/3000 [1:41:57<1:19:38,  3.21s/it, lr: 1.0e-04 loss: 4.614e-02]mindexpander_qwen_v1:  50%|#####     | 1513/3000 [1:41:57<1:19:38,  3.21s/it, lr: 1.0e-04 loss: 4.614e-02]mindexpander_qwen_v1:  50%|#####     | 1514/3000 [1:41:57<1:14:27,  3.01s/it, lr: 1.0e-04 loss: 4.614e-02]mindexpander_qwen_v1:  50%|#####     | 1514/3000 [1:41:57<1:14:27,  3.01s/it, lr: 1.0e-04 loss: 4.614e-02]mindexpander_qwen_v1:  50%|#####     | 1514/3000 [1:42:03<1:14:27,  3.01s/it, lr: 1.0e-04 loss: 8.102e-02]mindexpander_qwen_v1:  50%|#####     | 1514/3000 [1:42:03<1:14:27,  3.01s/it, lr: 1.0e-04 loss: 8.102e-02]mindexpander_qwen_v1:  50%|#####     | 1515/3000 [1:42:03<1:33:22,  3.77s/it, lr: 1.0e-04 loss: 8.102e-02]mindexpander_qwen_v1:  50%|#####     | 1515/3000 [1:42:03<1:33:22,  3.77s/it, lr: 1.0e-04 loss: 8.102e-02]mindexpander_qwen_v1:  50%|#####     | 1515/3000 [1:42:09<1:33:22,  3.77s/it, lr: 1.0e-04 loss: 4.570e-02]mindexpander_qwen_v1:  50%|#####     | 1515/3000 [1:42:09<1:33:22,  3.77s/it, lr: 1.0e-04 loss: 4.570e-02]mindexpander_qwen_v1:  51%|#####     | 1516/3000 [1:42:09<1:48:07,  4.37s/it, lr: 1.0e-04 loss: 4.570e-02]mindexpander_qwen_v1:  51%|#####     | 1516/3000 [1:42:09<1:48:07,  4.37s/it, lr: 1.0e-04 loss: 4.570e-02]mindexpander_qwen_v1:  51%|#####     | 1516/3000 [1:42:15<1:48:07,  4.37s/it, lr: 1.0e-04 loss: 1.859e-01]mindexpander_qwen_v1:  51%|#####     | 1516/3000 [1:42:15<1:48:07,  4.37s/it, lr: 1.0e-04 loss: 1.859e-01]mindexpander_qwen_v1:  51%|#####     | 1517/3000 [1:42:15<1:57:56,  4.77s/it, lr: 1.0e-04 loss: 1.859e-01]mindexpander_qwen_v1:  51%|#####     | 1517/3000 [1:42:15<1:57:56,  4.77s/it, lr: 1.0e-04 loss: 1.859e-01]mindexpander_qwen_v1:  51%|#####     | 1517/3000 [1:42:20<1:57:56,  4.77s/it, lr: 1.0e-04 loss: 9.298e-02]mindexpander_qwen_v1:  51%|#####     | 1517/3000 [1:42:20<1:57:56,  4.77s/it, lr: 1.0e-04 loss: 9.298e-02]mindexpander_qwen_v1:  51%|#####     | 1518/3000 [1:42:20<2:04:59,  5.06s/it, lr: 1.0e-04 loss: 9.298e-02]mindexpander_qwen_v1:  51%|#####     | 1518/3000 [1:42:20<2:04:59,  5.06s/it, lr: 1.0e-04 loss: 9.298e-02]mindexpander_qwen_v1:  51%|#####     | 1518/3000 [1:42:23<2:04:59,  5.06s/it, lr: 1.0e-04 loss: 3.484e-02]mindexpander_qwen_v1:  51%|#####     | 1518/3000 [1:42:23<2:04:59,  5.06s/it, lr: 1.0e-04 loss: 3.484e-02]mindexpander_qwen_v1:  51%|#####     | 1519/3000 [1:42:23<1:45:54,  4.29s/it, lr: 1.0e-04 loss: 3.484e-02]mindexpander_qwen_v1:  51%|#####     | 1519/3000 [1:42:23<1:45:54,  4.29s/it, lr: 1.0e-04 loss: 3.484e-02]mindexpander_qwen_v1:  51%|#####     | 1519/3000 [1:42:27<1:45:54,  4.29s/it, lr: 1.0e-04 loss: 7.977e-02]mindexpander_qwen_v1:  51%|#####     | 1519/3000 [1:42:27<1:45:54,  4.29s/it, lr: 1.0e-04 loss: 7.977e-02]mindexpander_qwen_v1:  51%|#####     | 1520/3000 [1:42:31<1:45:50,  4.29s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  51%|#####     | 1520/3000 [1:42:31<1:45:50,  4.29s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  51%|#####     | 1521/3000 [1:42:31<1:18:16,  3.18s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  51%|#####     | 1521/3000 [1:42:31<1:18:16,  3.18s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  51%|#####     | 1521/3000 [1:42:34<1:18:16,  3.18s/it, lr: 1.0e-04 loss: 1.464e-01]mindexpander_qwen_v1:  51%|#####     | 1521/3000 [1:42:34<1:18:16,  3.18s/it, lr: 1.0e-04 loss: 1.464e-01]mindexpander_qwen_v1:  51%|#####     | 1522/3000 [1:42:34<1:21:38,  3.31s/it, lr: 1.0e-04 loss: 1.464e-01]mindexpander_qwen_v1:  51%|#####     | 1522/3000 [1:42:34<1:21:38,  3.31s/it, lr: 1.0e-04 loss: 1.464e-01]mindexpander_qwen_v1:  51%|#####     | 1522/3000 [1:42:40<1:21:38,  3.31s/it, lr: 1.0e-04 loss: 7.493e-02]mindexpander_qwen_v1:  51%|#####     | 1522/3000 [1:42:40<1:21:38,  3.31s/it, lr: 1.0e-04 loss: 7.493e-02]mindexpander_qwen_v1:  51%|#####     | 1523/3000 [1:42:40<1:37:14,  3.95s/it, lr: 1.0e-04 loss: 7.493e-02]mindexpander_qwen_v1:  51%|#####     | 1523/3000 [1:42:40<1:37:14,  3.95s/it, lr: 1.0e-04 loss: 7.493e-02]mindexpander_qwen_v1:  51%|#####     | 1523/3000 [1:42:43<1:37:14,  3.95s/it, lr: 1.0e-04 loss: 1.643e-02]mindexpander_qwen_v1:  51%|#####     | 1523/3000 [1:42:43<1:37:14,  3.95s/it, lr: 1.0e-04 loss: 1.643e-02]mindexpander_qwen_v1:  51%|#####     | 1524/3000 [1:42:43<1:28:23,  3.59s/it, lr: 1.0e-04 loss: 1.643e-02]mindexpander_qwen_v1:  51%|#####     | 1524/3000 [1:42:43<1:28:23,  3.59s/it, lr: 1.0e-04 loss: 1.643e-02]mindexpander_qwen_v1:  51%|#####     | 1524/3000 [1:42:45<1:28:23,  3.59s/it, lr: 1.0e-04 loss: 1.257e-01]mindexpander_qwen_v1:  51%|#####     | 1524/3000 [1:42:45<1:28:23,  3.59s/it, lr: 1.0e-04 loss: 1.257e-01]mindexpander_qwen_v1:  51%|#####     | 1525/3000 [1:42:45<1:20:26,  3.27s/it, lr: 1.0e-04 loss: 1.257e-01]mindexpander_qwen_v1:  51%|#####     | 1525/3000 [1:42:45<1:20:26,  3.27s/it, lr: 1.0e-04 loss: 1.257e-01]mindexpander_qwen_v1:  51%|#####     | 1525/3000 [1:42:51<1:20:26,  3.27s/it, lr: 1.0e-04 loss: 5.593e-02]mindexpander_qwen_v1:  51%|#####     | 1525/3000 [1:42:51<1:20:26,  3.27s/it, lr: 1.0e-04 loss: 5.593e-02]mindexpander_qwen_v1:  51%|#####     | 1526/3000 [1:42:51<1:37:44,  3.98s/it, lr: 1.0e-04 loss: 5.593e-02]mindexpander_qwen_v1:  51%|#####     | 1526/3000 [1:42:51<1:37:44,  3.98s/it, lr: 1.0e-04 loss: 5.593e-02]mindexpander_qwen_v1:  51%|#####     | 1526/3000 [1:42:53<1:37:44,  3.98s/it, lr: 1.0e-04 loss: 2.842e-02]mindexpander_qwen_v1:  51%|#####     | 1526/3000 [1:42:53<1:37:44,  3.98s/it, lr: 1.0e-04 loss: 2.842e-02]mindexpander_qwen_v1:  51%|#####     | 1527/3000 [1:42:53<1:26:48,  3.54s/it, lr: 1.0e-04 loss: 2.842e-02]mindexpander_qwen_v1:  51%|#####     | 1527/3000 [1:42:53<1:26:48,  3.54s/it, lr: 1.0e-04 loss: 2.842e-02]mindexpander_qwen_v1:  51%|#####     | 1527/3000 [1:42:57<1:26:48,  3.54s/it, lr: 1.0e-04 loss: 7.239e-02]mindexpander_qwen_v1:  51%|#####     | 1527/3000 [1:42:57<1:26:48,  3.54s/it, lr: 1.0e-04 loss: 7.239e-02]mindexpander_qwen_v1:  51%|#####     | 1528/3000 [1:42:57<1:29:24,  3.64s/it, lr: 1.0e-04 loss: 7.239e-02]mindexpander_qwen_v1:  51%|#####     | 1528/3000 [1:42:57<1:29:24,  3.64s/it, lr: 1.0e-04 loss: 7.239e-02]mindexpander_qwen_v1:  51%|#####     | 1528/3000 [1:43:00<1:29:24,  3.64s/it, lr: 1.0e-04 loss: 5.872e-02]mindexpander_qwen_v1:  51%|#####     | 1528/3000 [1:43:00<1:29:24,  3.64s/it, lr: 1.0e-04 loss: 5.872e-02]mindexpander_qwen_v1:  51%|#####     | 1529/3000 [1:43:00<1:20:44,  3.29s/it, lr: 1.0e-04 loss: 5.872e-02]mindexpander_qwen_v1:  51%|#####     | 1529/3000 [1:43:00<1:20:44,  3.29s/it, lr: 1.0e-04 loss: 5.872e-02]mindexpander_qwen_v1:  51%|#####     | 1529/3000 [1:43:06<1:20:44,  3.29s/it, lr: 1.0e-04 loss: 1.487e-02]mindexpander_qwen_v1:  51%|#####     | 1529/3000 [1:43:06<1:20:44,  3.29s/it, lr: 1.0e-04 loss: 1.487e-02]mindexpander_qwen_v1:  51%|#####1    | 1530/3000 [1:43:10<1:20:41,  3.29s/it, lr: 1.0e-04 loss: 1.788e-01]mindexpander_qwen_v1:  51%|#####1    | 1530/3000 [1:43:10<1:20:41,  3.29s/it, lr: 1.0e-04 loss: 1.788e-01]mindexpander_qwen_v1:  51%|#####1    | 1531/3000 [1:43:10<1:04:46,  2.65s/it, lr: 1.0e-04 loss: 1.788e-01]mindexpander_qwen_v1:  51%|#####1    | 1531/3000 [1:43:10<1:04:46,  2.65s/it, lr: 1.0e-04 loss: 1.788e-01]mindexpander_qwen_v1:  51%|#####1    | 1531/3000 [1:43:16<1:04:46,  2.65s/it, lr: 1.0e-04 loss: 9.499e-02]mindexpander_qwen_v1:  51%|#####1    | 1531/3000 [1:43:16<1:04:46,  2.65s/it, lr: 1.0e-04 loss: 9.499e-02]mindexpander_qwen_v1:  51%|#####1    | 1532/3000 [1:43:16<1:24:42,  3.46s/it, lr: 1.0e-04 loss: 9.499e-02]mindexpander_qwen_v1:  51%|#####1    | 1532/3000 [1:43:16<1:24:42,  3.46s/it, lr: 1.0e-04 loss: 9.499e-02]mindexpander_qwen_v1:  51%|#####1    | 1532/3000 [1:43:21<1:24:42,  3.46s/it, lr: 1.0e-04 loss: 5.777e-02]mindexpander_qwen_v1:  51%|#####1    | 1532/3000 [1:43:21<1:24:42,  3.46s/it, lr: 1.0e-04 loss: 5.777e-02]mindexpander_qwen_v1:  51%|#####1    | 1533/3000 [1:43:21<1:39:14,  4.06s/it, lr: 1.0e-04 loss: 5.777e-02]mindexpander_qwen_v1:  51%|#####1    | 1533/3000 [1:43:21<1:39:14,  4.06s/it, lr: 1.0e-04 loss: 5.777e-02]mindexpander_qwen_v1:  51%|#####1    | 1533/3000 [1:43:24<1:39:14,  4.06s/it, lr: 1.0e-04 loss: 1.508e-01]mindexpander_qwen_v1:  51%|#####1    | 1533/3000 [1:43:24<1:39:14,  4.06s/it, lr: 1.0e-04 loss: 1.508e-01]mindexpander_qwen_v1:  51%|#####1    | 1534/3000 [1:43:24<1:28:39,  3.63s/it, lr: 1.0e-04 loss: 1.508e-01]mindexpander_qwen_v1:  51%|#####1    | 1534/3000 [1:43:24<1:28:39,  3.63s/it, lr: 1.0e-04 loss: 1.508e-01]mindexpander_qwen_v1:  51%|#####1    | 1534/3000 [1:43:27<1:28:39,  3.63s/it, lr: 1.0e-04 loss: 3.035e-02]mindexpander_qwen_v1:  51%|#####1    | 1534/3000 [1:43:27<1:28:39,  3.63s/it, lr: 1.0e-04 loss: 3.035e-02]mindexpander_qwen_v1:  51%|#####1    | 1535/3000 [1:43:27<1:29:23,  3.66s/it, lr: 1.0e-04 loss: 3.035e-02]mindexpander_qwen_v1:  51%|#####1    | 1535/3000 [1:43:27<1:29:23,  3.66s/it, lr: 1.0e-04 loss: 3.035e-02]mindexpander_qwen_v1:  51%|#####1    | 1535/3000 [1:43:31<1:29:23,  3.66s/it, lr: 1.0e-04 loss: 3.787e-02]mindexpander_qwen_v1:  51%|#####1    | 1535/3000 [1:43:31<1:29:23,  3.66s/it, lr: 1.0e-04 loss: 3.787e-02]mindexpander_qwen_v1:  51%|#####1    | 1536/3000 [1:43:31<1:30:57,  3.73s/it, lr: 1.0e-04 loss: 3.787e-02]mindexpander_qwen_v1:  51%|#####1    | 1536/3000 [1:43:31<1:30:57,  3.73s/it, lr: 1.0e-04 loss: 3.787e-02]mindexpander_qwen_v1:  51%|#####1    | 1536/3000 [1:43:34<1:30:57,  3.73s/it, lr: 1.0e-04 loss: 8.843e-02]mindexpander_qwen_v1:  51%|#####1    | 1536/3000 [1:43:34<1:30:57,  3.73s/it, lr: 1.0e-04 loss: 8.843e-02]mindexpander_qwen_v1:  51%|#####1    | 1537/3000 [1:43:34<1:21:54,  3.36s/it, lr: 1.0e-04 loss: 8.843e-02]mindexpander_qwen_v1:  51%|#####1    | 1537/3000 [1:43:34<1:21:54,  3.36s/it, lr: 1.0e-04 loss: 8.843e-02]mindexpander_qwen_v1:  51%|#####1    | 1537/3000 [1:43:38<1:21:54,  3.36s/it, lr: 1.0e-04 loss: 8.201e-02]mindexpander_qwen_v1:  51%|#####1    | 1537/3000 [1:43:38<1:21:54,  3.36s/it, lr: 1.0e-04 loss: 8.201e-02]mindexpander_qwen_v1:  51%|#####1    | 1538/3000 [1:43:38<1:24:33,  3.47s/it, lr: 1.0e-04 loss: 8.201e-02]mindexpander_qwen_v1:  51%|#####1    | 1538/3000 [1:43:38<1:24:33,  3.47s/it, lr: 1.0e-04 loss: 8.201e-02]mindexpander_qwen_v1:  51%|#####1    | 1538/3000 [1:43:41<1:24:33,  3.47s/it, lr: 1.0e-04 loss: 8.377e-02]mindexpander_qwen_v1:  51%|#####1    | 1538/3000 [1:43:41<1:24:33,  3.47s/it, lr: 1.0e-04 loss: 8.377e-02]mindexpander_qwen_v1:  51%|#####1    | 1539/3000 [1:43:41<1:26:25,  3.55s/it, lr: 1.0e-04 loss: 8.377e-02]mindexpander_qwen_v1:  51%|#####1    | 1539/3000 [1:43:41<1:26:25,  3.55s/it, lr: 1.0e-04 loss: 8.377e-02]mindexpander_qwen_v1:  51%|#####1    | 1539/3000 [1:43:47<1:26:25,  3.55s/it, lr: 1.0e-04 loss: 5.934e-02]mindexpander_qwen_v1:  51%|#####1    | 1539/3000 [1:43:47<1:26:25,  3.55s/it, lr: 1.0e-04 loss: 5.934e-02]mindexpander_qwen_v1:  51%|#####1    | 1540/3000 [1:43:53<1:26:22,  3.55s/it, lr: 1.0e-04 loss: 4.556e-02]mindexpander_qwen_v1:  51%|#####1    | 1540/3000 [1:43:53<1:26:22,  3.55s/it, lr: 1.0e-04 loss: 4.556e-02]mindexpander_qwen_v1:  51%|#####1    | 1541/3000 [1:43:53<1:18:50,  3.24s/it, lr: 1.0e-04 loss: 4.556e-02]mindexpander_qwen_v1:  51%|#####1    | 1541/3000 [1:43:53<1:18:50,  3.24s/it, lr: 1.0e-04 loss: 4.556e-02]mindexpander_qwen_v1:  51%|#####1    | 1541/3000 [1:43:55<1:18:50,  3.24s/it, lr: 1.0e-04 loss: 8.257e-02]mindexpander_qwen_v1:  51%|#####1    | 1541/3000 [1:43:55<1:18:50,  3.24s/it, lr: 1.0e-04 loss: 8.257e-02]mindexpander_qwen_v1:  51%|#####1    | 1542/3000 [1:43:55<1:14:01,  3.05s/it, lr: 1.0e-04 loss: 8.257e-02]mindexpander_qwen_v1:  51%|#####1    | 1542/3000 [1:43:55<1:14:01,  3.05s/it, lr: 1.0e-04 loss: 8.257e-02]mindexpander_qwen_v1:  51%|#####1    | 1542/3000 [1:44:01<1:14:01,  3.05s/it, lr: 1.0e-04 loss: 1.275e-01]mindexpander_qwen_v1:  51%|#####1    | 1542/3000 [1:44:01<1:14:01,  3.05s/it, lr: 1.0e-04 loss: 1.275e-01]mindexpander_qwen_v1:  51%|#####1    | 1543/3000 [1:44:01<1:31:05,  3.75s/it, lr: 1.0e-04 loss: 1.275e-01]mindexpander_qwen_v1:  51%|#####1    | 1543/3000 [1:44:01<1:31:05,  3.75s/it, lr: 1.0e-04 loss: 1.275e-01]mindexpander_qwen_v1:  51%|#####1    | 1543/3000 [1:44:05<1:31:05,  3.75s/it, lr: 1.0e-04 loss: 1.757e-01]mindexpander_qwen_v1:  51%|#####1    | 1543/3000 [1:44:05<1:31:05,  3.75s/it, lr: 1.0e-04 loss: 1.757e-01]mindexpander_qwen_v1:  51%|#####1    | 1544/3000 [1:44:05<1:31:59,  3.79s/it, lr: 1.0e-04 loss: 1.757e-01]mindexpander_qwen_v1:  51%|#####1    | 1544/3000 [1:44:05<1:31:59,  3.79s/it, lr: 1.0e-04 loss: 1.757e-01]mindexpander_qwen_v1:  51%|#####1    | 1544/3000 [1:44:07<1:31:59,  3.79s/it, lr: 1.0e-04 loss: 2.267e-02]mindexpander_qwen_v1:  51%|#####1    | 1544/3000 [1:44:07<1:31:59,  3.79s/it, lr: 1.0e-04 loss: 2.267e-02]mindexpander_qwen_v1:  52%|#####1    | 1545/3000 [1:44:07<1:22:50,  3.42s/it, lr: 1.0e-04 loss: 2.267e-02]mindexpander_qwen_v1:  52%|#####1    | 1545/3000 [1:44:07<1:22:50,  3.42s/it, lr: 1.0e-04 loss: 2.267e-02]mindexpander_qwen_v1:  52%|#####1    | 1545/3000 [1:44:13<1:22:50,  3.42s/it, lr: 1.0e-04 loss: 1.931e-02]mindexpander_qwen_v1:  52%|#####1    | 1545/3000 [1:44:13<1:22:50,  3.42s/it, lr: 1.0e-04 loss: 1.931e-02]mindexpander_qwen_v1:  52%|#####1    | 1546/3000 [1:44:13<1:38:56,  4.08s/it, lr: 1.0e-04 loss: 1.931e-02]mindexpander_qwen_v1:  52%|#####1    | 1546/3000 [1:44:13<1:38:56,  4.08s/it, lr: 1.0e-04 loss: 1.931e-02]mindexpander_qwen_v1:  52%|#####1    | 1546/3000 [1:44:16<1:38:56,  4.08s/it, lr: 1.0e-04 loss: 1.708e-01]mindexpander_qwen_v1:  52%|#####1    | 1546/3000 [1:44:16<1:38:56,  4.08s/it, lr: 1.0e-04 loss: 1.708e-01]mindexpander_qwen_v1:  52%|#####1    | 1547/3000 [1:44:16<1:27:24,  3.61s/it, lr: 1.0e-04 loss: 1.708e-01]mindexpander_qwen_v1:  52%|#####1    | 1547/3000 [1:44:16<1:27:24,  3.61s/it, lr: 1.0e-04 loss: 1.708e-01]mindexpander_qwen_v1:  52%|#####1    | 1547/3000 [1:44:22<1:27:24,  3.61s/it, lr: 1.0e-04 loss: 3.168e-02]mindexpander_qwen_v1:  52%|#####1    | 1547/3000 [1:44:22<1:27:24,  3.61s/it, lr: 1.0e-04 loss: 3.168e-02]mindexpander_qwen_v1:  52%|#####1    | 1548/3000 [1:44:22<1:43:53,  4.29s/it, lr: 1.0e-04 loss: 3.168e-02]mindexpander_qwen_v1:  52%|#####1    | 1548/3000 [1:44:22<1:43:53,  4.29s/it, lr: 1.0e-04 loss: 3.168e-02]mindexpander_qwen_v1:  52%|#####1    | 1548/3000 [1:44:24<1:43:53,  4.29s/it, lr: 1.0e-04 loss: 9.555e-02]mindexpander_qwen_v1:  52%|#####1    | 1548/3000 [1:44:24<1:43:53,  4.29s/it, lr: 1.0e-04 loss: 9.555e-02]mindexpander_qwen_v1:  52%|#####1    | 1549/3000 [1:44:24<1:30:35,  3.75s/it, lr: 1.0e-04 loss: 9.555e-02]mindexpander_qwen_v1:  52%|#####1    | 1549/3000 [1:44:24<1:30:35,  3.75s/it, lr: 1.0e-04 loss: 9.555e-02]mindexpander_qwen_v1:  52%|#####1    | 1549/3000 [1:44:28<1:30:35,  3.75s/it, lr: 1.0e-04 loss: 1.583e-01]mindexpander_qwen_v1:  52%|#####1    | 1549/3000 [1:44:28<1:30:35,  3.75s/it, lr: 1.0e-04 loss: 1.583e-01]mindexpander_qwen_v1:  52%|#####1    | 1550/3000 [1:44:30<1:30:31,  3.75s/it, lr: 1.0e-04 loss: 2.548e-02]mindexpander_qwen_v1:  52%|#####1    | 1550/3000 [1:44:30<1:30:31,  3.75s/it, lr: 1.0e-04 loss: 2.548e-02]mindexpander_qwen_v1:  52%|#####1    | 1551/3000 [1:44:30<1:03:42,  2.64s/it, lr: 1.0e-04 loss: 2.548e-02]mindexpander_qwen_v1:  52%|#####1    | 1551/3000 [1:44:30<1:03:42,  2.64s/it, lr: 1.0e-04 loss: 2.548e-02]mindexpander_qwen_v1:  52%|#####1    | 1551/3000 [1:44:33<1:03:42,  2.64s/it, lr: 1.0e-04 loss: 1.479e-01]mindexpander_qwen_v1:  52%|#####1    | 1551/3000 [1:44:33<1:03:42,  2.64s/it, lr: 1.0e-04 loss: 1.479e-01]mindexpander_qwen_v1:  52%|#####1    | 1552/3000 [1:44:33<1:02:33,  2.59s/it, lr: 1.0e-04 loss: 1.479e-01]mindexpander_qwen_v1:  52%|#####1    | 1552/3000 [1:44:33<1:02:33,  2.59s/it, lr: 1.0e-04 loss: 1.479e-01]mindexpander_qwen_v1:  52%|#####1    | 1552/3000 [1:44:37<1:02:33,  2.59s/it, lr: 1.0e-04 loss: 1.382e-02]mindexpander_qwen_v1:  52%|#####1    | 1552/3000 [1:44:37<1:02:33,  2.59s/it, lr: 1.0e-04 loss: 1.382e-02]mindexpander_qwen_v1:  52%|#####1    | 1553/3000 [1:44:37<1:09:42,  2.89s/it, lr: 1.0e-04 loss: 1.382e-02]mindexpander_qwen_v1:  52%|#####1    | 1553/3000 [1:44:37<1:09:42,  2.89s/it, lr: 1.0e-04 loss: 1.382e-02]mindexpander_qwen_v1:  52%|#####1    | 1553/3000 [1:44:42<1:09:42,  2.89s/it, lr: 1.0e-04 loss: 1.627e-01]mindexpander_qwen_v1:  52%|#####1    | 1553/3000 [1:44:42<1:09:42,  2.89s/it, lr: 1.0e-04 loss: 1.627e-01]mindexpander_qwen_v1:  52%|#####1    | 1554/3000 [1:44:42<1:28:22,  3.67s/it, lr: 1.0e-04 loss: 1.627e-01]mindexpander_qwen_v1:  52%|#####1    | 1554/3000 [1:44:42<1:28:22,  3.67s/it, lr: 1.0e-04 loss: 1.627e-01]mindexpander_qwen_v1:  52%|#####1    | 1554/3000 [1:44:48<1:28:22,  3.67s/it, lr: 1.0e-04 loss: 1.656e-01]mindexpander_qwen_v1:  52%|#####1    | 1554/3000 [1:44:48<1:28:22,  3.67s/it, lr: 1.0e-04 loss: 1.656e-01]mindexpander_qwen_v1:  52%|#####1    | 1555/3000 [1:44:48<1:43:14,  4.29s/it, lr: 1.0e-04 loss: 1.656e-01]mindexpander_qwen_v1:  52%|#####1    | 1555/3000 [1:44:48<1:43:14,  4.29s/it, lr: 1.0e-04 loss: 1.656e-01]mindexpander_qwen_v1:  52%|#####1    | 1555/3000 [1:44:52<1:43:14,  4.29s/it, lr: 1.0e-04 loss: 3.186e-02]mindexpander_qwen_v1:  52%|#####1    | 1555/3000 [1:44:52<1:43:14,  4.29s/it, lr: 1.0e-04 loss: 3.186e-02]mindexpander_qwen_v1:  52%|#####1    | 1556/3000 [1:44:52<1:39:25,  4.13s/it, lr: 1.0e-04 loss: 3.186e-02]mindexpander_qwen_v1:  52%|#####1    | 1556/3000 [1:44:52<1:39:25,  4.13s/it, lr: 1.0e-04 loss: 3.186e-02]mindexpander_qwen_v1:  52%|#####1    | 1556/3000 [1:44:54<1:39:25,  4.13s/it, lr: 1.0e-04 loss: 2.795e-02]mindexpander_qwen_v1:  52%|#####1    | 1556/3000 [1:44:54<1:39:25,  4.13s/it, lr: 1.0e-04 loss: 2.795e-02]mindexpander_qwen_v1:  52%|#####1    | 1557/3000 [1:44:54<1:27:38,  3.64s/it, lr: 1.0e-04 loss: 2.795e-02]mindexpander_qwen_v1:  52%|#####1    | 1557/3000 [1:44:54<1:27:38,  3.64s/it, lr: 1.0e-04 loss: 2.795e-02]mindexpander_qwen_v1:  52%|#####1    | 1557/3000 [1:44:58<1:27:38,  3.64s/it, lr: 1.0e-04 loss: 3.047e-02]mindexpander_qwen_v1:  52%|#####1    | 1557/3000 [1:44:58<1:27:38,  3.64s/it, lr: 1.0e-04 loss: 3.047e-02]mindexpander_qwen_v1:  52%|#####1    | 1558/3000 [1:44:58<1:28:14,  3.67s/it, lr: 1.0e-04 loss: 3.047e-02]mindexpander_qwen_v1:  52%|#####1    | 1558/3000 [1:44:58<1:28:14,  3.67s/it, lr: 1.0e-04 loss: 3.047e-02]mindexpander_qwen_v1:  52%|#####1    | 1558/3000 [1:45:01<1:28:14,  3.67s/it, lr: 1.0e-04 loss: 1.449e-01]mindexpander_qwen_v1:  52%|#####1    | 1558/3000 [1:45:01<1:28:14,  3.67s/it, lr: 1.0e-04 loss: 1.449e-01]mindexpander_qwen_v1:  52%|#####1    | 1559/3000 [1:45:01<1:20:53,  3.37s/it, lr: 1.0e-04 loss: 1.449e-01]mindexpander_qwen_v1:  52%|#####1    | 1559/3000 [1:45:01<1:20:53,  3.37s/it, lr: 1.0e-04 loss: 1.449e-01]mindexpander_qwen_v1:  52%|#####1    | 1559/3000 [1:45:07<1:20:53,  3.37s/it, lr: 1.0e-04 loss: 1.564e-02]mindexpander_qwen_v1:  52%|#####1    | 1559/3000 [1:45:07<1:20:53,  3.37s/it, lr: 1.0e-04 loss: 1.564e-02]mindexpander_qwen_v1:  52%|#####2    | 1560/3000 [1:45:11<1:20:50,  3.37s/it, lr: 1.0e-04 loss: 2.864e-02]mindexpander_qwen_v1:  52%|#####2    | 1560/3000 [1:45:11<1:20:50,  3.37s/it, lr: 1.0e-04 loss: 2.864e-02]mindexpander_qwen_v1:  52%|#####2    | 1561/3000 [1:45:11<1:04:21,  2.68s/it, lr: 1.0e-04 loss: 2.864e-02]mindexpander_qwen_v1:  52%|#####2    | 1561/3000 [1:45:11<1:04:21,  2.68s/it, lr: 1.0e-04 loss: 2.864e-02]mindexpander_qwen_v1:  52%|#####2    | 1561/3000 [1:45:13<1:04:21,  2.68s/it, lr: 1.0e-04 loss: 7.504e-02]mindexpander_qwen_v1:  52%|#####2    | 1561/3000 [1:45:13<1:04:21,  2.68s/it, lr: 1.0e-04 loss: 7.504e-02]mindexpander_qwen_v1:  52%|#####2    | 1562/3000 [1:45:13<1:03:06,  2.63s/it, lr: 1.0e-04 loss: 7.504e-02]mindexpander_qwen_v1:  52%|#####2    | 1562/3000 [1:45:13<1:03:06,  2.63s/it, lr: 1.0e-04 loss: 7.504e-02]mindexpander_qwen_v1:  52%|#####2    | 1562/3000 [1:45:17<1:03:06,  2.63s/it, lr: 1.0e-04 loss: 1.523e-01]mindexpander_qwen_v1:  52%|#####2    | 1562/3000 [1:45:17<1:03:06,  2.63s/it, lr: 1.0e-04 loss: 1.523e-01]mindexpander_qwen_v1:  52%|#####2    | 1563/3000 [1:45:17<1:11:25,  2.98s/it, lr: 1.0e-04 loss: 1.523e-01]mindexpander_qwen_v1:  52%|#####2    | 1563/3000 [1:45:17<1:11:25,  2.98s/it, lr: 1.0e-04 loss: 1.523e-01]mindexpander_qwen_v1:  52%|#####2    | 1563/3000 [1:45:23<1:11:25,  2.98s/it, lr: 1.0e-04 loss: 6.648e-02]mindexpander_qwen_v1:  52%|#####2    | 1563/3000 [1:45:23<1:11:25,  2.98s/it, lr: 1.0e-04 loss: 6.648e-02]mindexpander_qwen_v1:  52%|#####2    | 1564/3000 [1:45:23<1:29:21,  3.73s/it, lr: 1.0e-04 loss: 6.648e-02]mindexpander_qwen_v1:  52%|#####2    | 1564/3000 [1:45:23<1:29:21,  3.73s/it, lr: 1.0e-04 loss: 6.648e-02]mindexpander_qwen_v1:  52%|#####2    | 1564/3000 [1:45:29<1:29:21,  3.73s/it, lr: 1.0e-04 loss: 1.080e-01]mindexpander_qwen_v1:  52%|#####2    | 1564/3000 [1:45:29<1:29:21,  3.73s/it, lr: 1.0e-04 loss: 1.080e-01]mindexpander_qwen_v1:  52%|#####2    | 1565/3000 [1:45:29<1:42:46,  4.30s/it, lr: 1.0e-04 loss: 1.080e-01]mindexpander_qwen_v1:  52%|#####2    | 1565/3000 [1:45:29<1:42:46,  4.30s/it, lr: 1.0e-04 loss: 1.080e-01]mindexpander_qwen_v1:  52%|#####2    | 1565/3000 [1:45:32<1:42:46,  4.30s/it, lr: 1.0e-04 loss: 1.092e-01]mindexpander_qwen_v1:  52%|#####2    | 1565/3000 [1:45:32<1:42:46,  4.30s/it, lr: 1.0e-04 loss: 1.092e-01]mindexpander_qwen_v1:  52%|#####2    | 1566/3000 [1:45:32<1:38:53,  4.14s/it, lr: 1.0e-04 loss: 1.092e-01]mindexpander_qwen_v1:  52%|#####2    | 1566/3000 [1:45:32<1:38:53,  4.14s/it, lr: 1.0e-04 loss: 1.092e-01]mindexpander_qwen_v1:  52%|#####2    | 1566/3000 [1:45:35<1:38:53,  4.14s/it, lr: 1.0e-04 loss: 6.244e-02]mindexpander_qwen_v1:  52%|#####2    | 1566/3000 [1:45:35<1:38:53,  4.14s/it, lr: 1.0e-04 loss: 6.244e-02]mindexpander_qwen_v1:  52%|#####2    | 1567/3000 [1:45:35<1:28:30,  3.71s/it, lr: 1.0e-04 loss: 6.244e-02]mindexpander_qwen_v1:  52%|#####2    | 1567/3000 [1:45:35<1:28:30,  3.71s/it, lr: 1.0e-04 loss: 6.244e-02]mindexpander_qwen_v1:  52%|#####2    | 1567/3000 [1:45:37<1:28:30,  3.71s/it, lr: 1.0e-04 loss: 7.649e-03]mindexpander_qwen_v1:  52%|#####2    | 1567/3000 [1:45:37<1:28:30,  3.71s/it, lr: 1.0e-04 loss: 7.649e-03]mindexpander_qwen_v1:  52%|#####2    | 1568/3000 [1:45:37<1:19:39,  3.34s/it, lr: 1.0e-04 loss: 7.649e-03]mindexpander_qwen_v1:  52%|#####2    | 1568/3000 [1:45:37<1:19:39,  3.34s/it, lr: 1.0e-04 loss: 7.649e-03]mindexpander_qwen_v1:  52%|#####2    | 1568/3000 [1:45:40<1:19:39,  3.34s/it, lr: 1.0e-04 loss: 1.318e-01]mindexpander_qwen_v1:  52%|#####2    | 1568/3000 [1:45:40<1:19:39,  3.34s/it, lr: 1.0e-04 loss: 1.318e-01]mindexpander_qwen_v1:  52%|#####2    | 1569/3000 [1:45:40<1:13:18,  3.07s/it, lr: 1.0e-04 loss: 1.318e-01]mindexpander_qwen_v1:  52%|#####2    | 1569/3000 [1:45:40<1:13:18,  3.07s/it, lr: 1.0e-04 loss: 1.318e-01]mindexpander_qwen_v1:  52%|#####2    | 1569/3000 [1:45:46<1:13:18,  3.07s/it, lr: 1.0e-04 loss: 1.789e-01]mindexpander_qwen_v1:  52%|#####2    | 1569/3000 [1:45:46<1:13:18,  3.07s/it, lr: 1.0e-04 loss: 1.789e-01]mindexpander_qwen_v1:  52%|#####2    | 1570/3000 [1:45:49<1:13:15,  3.07s/it, lr: 1.0e-04 loss: 1.596e-01]mindexpander_qwen_v1:  52%|#####2    | 1570/3000 [1:45:49<1:13:15,  3.07s/it, lr: 1.0e-04 loss: 1.596e-01]mindexpander_qwen_v1:  52%|#####2    | 1571/3000 [1:45:49<1:00:57,  2.56s/it, lr: 1.0e-04 loss: 1.596e-01]mindexpander_qwen_v1:  52%|#####2    | 1571/3000 [1:45:49<1:00:57,  2.56s/it, lr: 1.0e-04 loss: 1.596e-01]mindexpander_qwen_v1:  52%|#####2    | 1571/3000 [1:45:52<1:00:57,  2.56s/it, lr: 1.0e-04 loss: 2.027e-02]mindexpander_qwen_v1:  52%|#####2    | 1571/3000 [1:45:52<1:00:57,  2.56s/it, lr: 1.0e-04 loss: 2.027e-02]mindexpander_qwen_v1:  52%|#####2    | 1572/3000 [1:45:52<1:00:15,  2.53s/it, lr: 1.0e-04 loss: 2.027e-02]mindexpander_qwen_v1:  52%|#####2    | 1572/3000 [1:45:52<1:00:15,  2.53s/it, lr: 1.0e-04 loss: 2.027e-02]mindexpander_qwen_v1:  52%|#####2    | 1572/3000 [1:45:56<1:00:15,  2.53s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  52%|#####2    | 1572/3000 [1:45:56<1:00:15,  2.53s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  52%|#####2    | 1573/3000 [1:45:56<1:07:43,  2.85s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  52%|#####2    | 1573/3000 [1:45:56<1:07:43,  2.85s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  52%|#####2    | 1573/3000 [1:45:58<1:07:43,  2.85s/it, lr: 1.0e-04 loss: 1.676e-02]mindexpander_qwen_v1:  52%|#####2    | 1573/3000 [1:45:58<1:07:43,  2.85s/it, lr: 1.0e-04 loss: 1.676e-02]mindexpander_qwen_v1:  52%|#####2    | 1574/3000 [1:45:58<1:05:05,  2.74s/it, lr: 1.0e-04 loss: 1.676e-02]mindexpander_qwen_v1:  52%|#####2    | 1574/3000 [1:45:58<1:05:05,  2.74s/it, lr: 1.0e-04 loss: 1.676e-02]mindexpander_qwen_v1:  52%|#####2    | 1574/3000 [1:46:04<1:05:05,  2.74s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  52%|#####2    | 1574/3000 [1:46:04<1:05:05,  2.74s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  52%|#####2    | 1575/3000 [1:46:04<1:25:50,  3.61s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  52%|#####2    | 1575/3000 [1:46:04<1:25:50,  3.61s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  52%|#####2    | 1575/3000 [1:46:10<1:25:50,  3.61s/it, lr: 1.0e-04 loss: 1.439e-02]mindexpander_qwen_v1:  52%|#####2    | 1575/3000 [1:46:10<1:25:50,  3.61s/it, lr: 1.0e-04 loss: 1.439e-02]mindexpander_qwen_v1:  53%|#####2    | 1576/3000 [1:46:10<1:40:16,  4.23s/it, lr: 1.0e-04 loss: 1.439e-02]mindexpander_qwen_v1:  53%|#####2    | 1576/3000 [1:46:10<1:40:16,  4.23s/it, lr: 1.0e-04 loss: 1.439e-02]mindexpander_qwen_v1:  53%|#####2    | 1576/3000 [1:46:12<1:40:16,  4.23s/it, lr: 1.0e-04 loss: 1.071e-01]mindexpander_qwen_v1:  53%|#####2    | 1576/3000 [1:46:12<1:40:16,  4.23s/it, lr: 1.0e-04 loss: 1.071e-01]mindexpander_qwen_v1:  53%|#####2    | 1577/3000 [1:46:12<1:27:58,  3.71s/it, lr: 1.0e-04 loss: 1.071e-01]mindexpander_qwen_v1:  53%|#####2    | 1577/3000 [1:46:12<1:27:58,  3.71s/it, lr: 1.0e-04 loss: 1.071e-01]mindexpander_qwen_v1:  53%|#####2    | 1577/3000 [1:46:15<1:27:58,  3.71s/it, lr: 1.0e-04 loss: 8.545e-02]mindexpander_qwen_v1:  53%|#####2    | 1577/3000 [1:46:15<1:27:58,  3.71s/it, lr: 1.0e-04 loss: 8.545e-02]mindexpander_qwen_v1:  53%|#####2    | 1578/3000 [1:46:15<1:19:11,  3.34s/it, lr: 1.0e-04 loss: 8.545e-02]mindexpander_qwen_v1:  53%|#####2    | 1578/3000 [1:46:15<1:19:11,  3.34s/it, lr: 1.0e-04 loss: 8.545e-02]mindexpander_qwen_v1:  53%|#####2    | 1578/3000 [1:46:19<1:19:11,  3.34s/it, lr: 1.0e-04 loss: 1.290e-01]mindexpander_qwen_v1:  53%|#####2    | 1578/3000 [1:46:19<1:19:11,  3.34s/it, lr: 1.0e-04 loss: 1.290e-01]mindexpander_qwen_v1:  53%|#####2    | 1579/3000 [1:46:19<1:23:04,  3.51s/it, lr: 1.0e-04 loss: 1.290e-01]mindexpander_qwen_v1:  53%|#####2    | 1579/3000 [1:46:19<1:23:04,  3.51s/it, lr: 1.0e-04 loss: 1.290e-01]mindexpander_qwen_v1:  53%|#####2    | 1579/3000 [1:46:22<1:23:04,  3.51s/it, lr: 1.0e-04 loss: 1.322e-01]mindexpander_qwen_v1:  53%|#####2    | 1579/3000 [1:46:22<1:23:04,  3.51s/it, lr: 1.0e-04 loss: 1.322e-01]mindexpander_qwen_v1:  53%|#####2    | 1580/3000 [1:46:28<1:23:00,  3.51s/it, lr: 1.0e-04 loss: 2.760e-02]mindexpander_qwen_v1:  53%|#####2    | 1580/3000 [1:46:28<1:23:00,  3.51s/it, lr: 1.0e-04 loss: 2.760e-02]mindexpander_qwen_v1:  53%|#####2    | 1581/3000 [1:46:28<1:16:04,  3.22s/it, lr: 1.0e-04 loss: 2.760e-02]mindexpander_qwen_v1:  53%|#####2    | 1581/3000 [1:46:28<1:16:04,  3.22s/it, lr: 1.0e-04 loss: 2.760e-02]mindexpander_qwen_v1:  53%|#####2    | 1581/3000 [1:46:32<1:16:04,  3.22s/it, lr: 1.0e-04 loss: 2.005e-02]mindexpander_qwen_v1:  53%|#####2    | 1581/3000 [1:46:32<1:16:04,  3.22s/it, lr: 1.0e-04 loss: 2.005e-02]mindexpander_qwen_v1:  53%|#####2    | 1582/3000 [1:46:32<1:19:03,  3.34s/it, lr: 1.0e-04 loss: 2.005e-02]mindexpander_qwen_v1:  53%|#####2    | 1582/3000 [1:46:32<1:19:03,  3.34s/it, lr: 1.0e-04 loss: 2.005e-02]mindexpander_qwen_v1:  53%|#####2    | 1582/3000 [1:46:34<1:19:03,  3.34s/it, lr: 1.0e-04 loss: 3.033e-02]mindexpander_qwen_v1:  53%|#####2    | 1582/3000 [1:46:34<1:19:03,  3.34s/it, lr: 1.0e-04 loss: 3.033e-02]mindexpander_qwen_v1:  53%|#####2    | 1583/3000 [1:46:34<1:14:43,  3.16s/it, lr: 1.0e-04 loss: 3.033e-02]mindexpander_qwen_v1:  53%|#####2    | 1583/3000 [1:46:34<1:14:43,  3.16s/it, lr: 1.0e-04 loss: 3.033e-02]mindexpander_qwen_v1:  53%|#####2    | 1583/3000 [1:46:38<1:14:43,  3.16s/it, lr: 1.0e-04 loss: 5.714e-02]mindexpander_qwen_v1:  53%|#####2    | 1583/3000 [1:46:38<1:14:43,  3.16s/it, lr: 1.0e-04 loss: 5.714e-02]mindexpander_qwen_v1:  53%|#####2    | 1584/3000 [1:46:38<1:18:18,  3.32s/it, lr: 1.0e-04 loss: 5.714e-02]mindexpander_qwen_v1:  53%|#####2    | 1584/3000 [1:46:38<1:18:18,  3.32s/it, lr: 1.0e-04 loss: 5.714e-02]mindexpander_qwen_v1:  53%|#####2    | 1584/3000 [1:46:42<1:18:18,  3.32s/it, lr: 1.0e-04 loss: 8.045e-02]mindexpander_qwen_v1:  53%|#####2    | 1584/3000 [1:46:42<1:18:18,  3.32s/it, lr: 1.0e-04 loss: 8.045e-02]mindexpander_qwen_v1:  53%|#####2    | 1585/3000 [1:46:42<1:20:57,  3.43s/it, lr: 1.0e-04 loss: 8.045e-02]mindexpander_qwen_v1:  53%|#####2    | 1585/3000 [1:46:42<1:20:57,  3.43s/it, lr: 1.0e-04 loss: 8.045e-02]mindexpander_qwen_v1:  53%|#####2    | 1585/3000 [1:46:48<1:20:57,  3.43s/it, lr: 1.0e-04 loss: 7.182e-02]mindexpander_qwen_v1:  53%|#####2    | 1585/3000 [1:46:48<1:20:57,  3.43s/it, lr: 1.0e-04 loss: 7.182e-02]mindexpander_qwen_v1:  53%|#####2    | 1586/3000 [1:46:48<1:36:29,  4.09s/it, lr: 1.0e-04 loss: 7.182e-02]mindexpander_qwen_v1:  53%|#####2    | 1586/3000 [1:46:48<1:36:29,  4.09s/it, lr: 1.0e-04 loss: 7.182e-02]mindexpander_qwen_v1:  53%|#####2    | 1586/3000 [1:46:54<1:36:29,  4.09s/it, lr: 1.0e-04 loss: 1.145e-02]mindexpander_qwen_v1:  53%|#####2    | 1586/3000 [1:46:54<1:36:29,  4.09s/it, lr: 1.0e-04 loss: 1.145e-02]mindexpander_qwen_v1:  53%|#####2    | 1587/3000 [1:46:54<1:48:42,  4.62s/it, lr: 1.0e-04 loss: 1.145e-02]mindexpander_qwen_v1:  53%|#####2    | 1587/3000 [1:46:54<1:48:42,  4.62s/it, lr: 1.0e-04 loss: 1.145e-02]mindexpander_qwen_v1:  53%|#####2    | 1587/3000 [1:46:56<1:48:42,  4.62s/it, lr: 1.0e-04 loss: 9.414e-02]mindexpander_qwen_v1:  53%|#####2    | 1587/3000 [1:46:56<1:48:42,  4.62s/it, lr: 1.0e-04 loss: 9.414e-02]mindexpander_qwen_v1:  53%|#####2    | 1588/3000 [1:46:56<1:33:41,  3.98s/it, lr: 1.0e-04 loss: 9.414e-02]mindexpander_qwen_v1:  53%|#####2    | 1588/3000 [1:46:56<1:33:41,  3.98s/it, lr: 1.0e-04 loss: 9.414e-02]mindexpander_qwen_v1:  53%|#####2    | 1588/3000 [1:47:02<1:33:41,  3.98s/it, lr: 1.0e-04 loss: 9.321e-03]mindexpander_qwen_v1:  53%|#####2    | 1588/3000 [1:47:02<1:33:41,  3.98s/it, lr: 1.0e-04 loss: 9.321e-03]mindexpander_qwen_v1:  53%|#####2    | 1589/3000 [1:47:02<1:45:54,  4.50s/it, lr: 1.0e-04 loss: 9.321e-03]mindexpander_qwen_v1:  53%|#####2    | 1589/3000 [1:47:02<1:45:54,  4.50s/it, lr: 1.0e-04 loss: 9.321e-03]mindexpander_qwen_v1:  53%|#####2    | 1589/3000 [1:47:05<1:45:54,  4.50s/it, lr: 1.0e-04 loss: 3.912e-02]mindexpander_qwen_v1:  53%|#####2    | 1589/3000 [1:47:05<1:45:54,  4.50s/it, lr: 1.0e-04 loss: 3.912e-02]mindexpander_qwen_v1:  53%|#####3    | 1590/3000 [1:47:10<1:45:49,  4.50s/it, lr: 1.0e-04 loss: 9.655e-02]mindexpander_qwen_v1:  53%|#####3    | 1590/3000 [1:47:10<1:45:49,  4.50s/it, lr: 1.0e-04 loss: 9.655e-02]mindexpander_qwen_v1:  53%|#####3    | 1591/3000 [1:47:11<1:29:35,  3.82s/it, lr: 1.0e-04 loss: 9.655e-02]mindexpander_qwen_v1:  53%|#####3    | 1591/3000 [1:47:11<1:29:35,  3.82s/it, lr: 1.0e-04 loss: 9.655e-02]mindexpander_qwen_v1:  53%|#####3    | 1591/3000 [1:47:14<1:29:35,  3.82s/it, lr: 1.0e-04 loss: 1.638e-01]mindexpander_qwen_v1:  53%|#####3    | 1591/3000 [1:47:14<1:29:35,  3.82s/it, lr: 1.0e-04 loss: 1.638e-01]mindexpander_qwen_v1:  53%|#####3    | 1592/3000 [1:47:14<1:29:07,  3.80s/it, lr: 1.0e-04 loss: 1.638e-01]mindexpander_qwen_v1:  53%|#####3    | 1592/3000 [1:47:14<1:29:07,  3.80s/it, lr: 1.0e-04 loss: 1.638e-01]mindexpander_qwen_v1:  53%|#####3    | 1592/3000 [1:47:18<1:29:07,  3.80s/it, lr: 1.0e-04 loss: 1.691e-01]mindexpander_qwen_v1:  53%|#####3    | 1592/3000 [1:47:18<1:29:07,  3.80s/it, lr: 1.0e-04 loss: 1.691e-01]mindexpander_qwen_v1:  53%|#####3    | 1593/3000 [1:47:18<1:28:42,  3.78s/it, lr: 1.0e-04 loss: 1.691e-01]mindexpander_qwen_v1:  53%|#####3    | 1593/3000 [1:47:18<1:28:42,  3.78s/it, lr: 1.0e-04 loss: 1.691e-01]mindexpander_qwen_v1:  53%|#####3    | 1593/3000 [1:47:20<1:28:42,  3.78s/it, lr: 1.0e-04 loss: 1.601e-01]mindexpander_qwen_v1:  53%|#####3    | 1593/3000 [1:47:20<1:28:42,  3.78s/it, lr: 1.0e-04 loss: 1.601e-01]mindexpander_qwen_v1:  53%|#####3    | 1594/3000 [1:47:20<1:20:07,  3.42s/it, lr: 1.0e-04 loss: 1.601e-01]mindexpander_qwen_v1:  53%|#####3    | 1594/3000 [1:47:20<1:20:07,  3.42s/it, lr: 1.0e-04 loss: 1.601e-01]mindexpander_qwen_v1:  53%|#####3    | 1594/3000 [1:47:26<1:20:07,  3.42s/it, lr: 1.0e-04 loss: 7.214e-02]mindexpander_qwen_v1:  53%|#####3    | 1594/3000 [1:47:26<1:20:07,  3.42s/it, lr: 1.0e-04 loss: 7.214e-02]mindexpander_qwen_v1:  53%|#####3    | 1595/3000 [1:47:26<1:36:10,  4.11s/it, lr: 1.0e-04 loss: 7.214e-02]mindexpander_qwen_v1:  53%|#####3    | 1595/3000 [1:47:26<1:36:10,  4.11s/it, lr: 1.0e-04 loss: 7.214e-02]mindexpander_qwen_v1:  53%|#####3    | 1595/3000 [1:47:32<1:36:10,  4.11s/it, lr: 1.0e-04 loss: 1.804e-01]mindexpander_qwen_v1:  53%|#####3    | 1595/3000 [1:47:32<1:36:10,  4.11s/it, lr: 1.0e-04 loss: 1.804e-01]mindexpander_qwen_v1:  53%|#####3    | 1596/3000 [1:47:32<1:46:59,  4.57s/it, lr: 1.0e-04 loss: 1.804e-01]mindexpander_qwen_v1:  53%|#####3    | 1596/3000 [1:47:32<1:46:59,  4.57s/it, lr: 1.0e-04 loss: 1.804e-01]mindexpander_qwen_v1:  53%|#####3    | 1596/3000 [1:47:38<1:46:59,  4.57s/it, lr: 1.0e-04 loss: 1.655e-01]mindexpander_qwen_v1:  53%|#####3    | 1596/3000 [1:47:38<1:46:59,  4.57s/it, lr: 1.0e-04 loss: 1.655e-01]mindexpander_qwen_v1:  53%|#####3    | 1597/3000 [1:47:38<1:54:53,  4.91s/it, lr: 1.0e-04 loss: 1.655e-01]mindexpander_qwen_v1:  53%|#####3    | 1597/3000 [1:47:38<1:54:53,  4.91s/it, lr: 1.0e-04 loss: 1.655e-01]mindexpander_qwen_v1:  53%|#####3    | 1597/3000 [1:47:42<1:54:53,  4.91s/it, lr: 1.0e-04 loss: 5.354e-02]mindexpander_qwen_v1:  53%|#####3    | 1597/3000 [1:47:42<1:54:53,  4.91s/it, lr: 1.0e-04 loss: 5.354e-02]mindexpander_qwen_v1:  53%|#####3    | 1598/3000 [1:47:42<1:46:45,  4.57s/it, lr: 1.0e-04 loss: 5.354e-02]mindexpander_qwen_v1:  53%|#####3    | 1598/3000 [1:47:42<1:46:45,  4.57s/it, lr: 1.0e-04 loss: 5.354e-02]mindexpander_qwen_v1:  53%|#####3    | 1598/3000 [1:47:47<1:46:45,  4.57s/it, lr: 1.0e-04 loss: 7.795e-02]mindexpander_qwen_v1:  53%|#####3    | 1598/3000 [1:47:47<1:46:45,  4.57s/it, lr: 1.0e-04 loss: 7.795e-02]mindexpander_qwen_v1:  53%|#####3    | 1599/3000 [1:47:47<1:55:49,  4.96s/it, lr: 1.0e-04 loss: 7.795e-02]mindexpander_qwen_v1:  53%|#####3    | 1599/3000 [1:47:47<1:55:49,  4.96s/it, lr: 1.0e-04 loss: 7.795e-02]mindexpander_qwen_v1:  53%|#####3    | 1599/3000 [1:47:50<1:55:49,  4.96s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  53%|#####3    | 1599/3000 [1:47:50<1:55:49,  4.96s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  53%|#####3    | 1600/3000 [1:47:52<1:55:44,  4.96s/it, lr: 1.0e-04 loss: 5.199e-02]mindexpander_qwen_v1:  53%|#####3    | 1600/3000 [1:47:52<1:55:44,  4.96s/it, lr: 1.0e-04 loss: 5.199e-02]mindexpander_qwen_v1:  53%|#####3    | 1601/3000 [1:47:52<1:15:50,  3.25s/it, lr: 1.0e-04 loss: 5.199e-02]mindexpander_qwen_v1:  53%|#####3    | 1601/3000 [1:47:52<1:15:50,  3.25s/it, lr: 1.0e-04 loss: 5.199e-02]mindexpander_qwen_v1:  53%|#####3    | 1601/3000 [1:47:55<1:15:50,  3.25s/it, lr: 1.0e-04 loss: 3.134e-02]mindexpander_qwen_v1:  53%|#####3    | 1601/3000 [1:47:55<1:15:50,  3.25s/it, lr: 1.0e-04 loss: 3.134e-02]mindexpander_qwen_v1:  53%|#####3    | 1602/3000 [1:47:55<1:11:11,  3.06s/it, lr: 1.0e-04 loss: 3.134e-02]mindexpander_qwen_v1:  53%|#####3    | 1602/3000 [1:47:55<1:11:11,  3.06s/it, lr: 1.0e-04 loss: 3.134e-02]mindexpander_qwen_v1:  53%|#####3    | 1602/3000 [1:48:01<1:11:11,  3.06s/it, lr: 1.0e-04 loss: 1.143e-02]mindexpander_qwen_v1:  53%|#####3    | 1602/3000 [1:48:01<1:11:11,  3.06s/it, lr: 1.0e-04 loss: 1.143e-02]mindexpander_qwen_v1:  53%|#####3    | 1603/3000 [1:48:01<1:28:28,  3.80s/it, lr: 1.0e-04 loss: 1.143e-02]mindexpander_qwen_v1:  53%|#####3    | 1603/3000 [1:48:01<1:28:28,  3.80s/it, lr: 1.0e-04 loss: 1.143e-02]mindexpander_qwen_v1:  53%|#####3    | 1603/3000 [1:48:06<1:28:28,  3.80s/it, lr: 1.0e-04 loss: 1.864e-01]mindexpander_qwen_v1:  53%|#####3    | 1603/3000 [1:48:06<1:28:28,  3.80s/it, lr: 1.0e-04 loss: 1.864e-01]mindexpander_qwen_v1:  53%|#####3    | 1604/3000 [1:48:06<1:40:46,  4.33s/it, lr: 1.0e-04 loss: 1.864e-01]mindexpander_qwen_v1:  53%|#####3    | 1604/3000 [1:48:06<1:40:46,  4.33s/it, lr: 1.0e-04 loss: 1.864e-01]mindexpander_qwen_v1:  53%|#####3    | 1604/3000 [1:48:09<1:40:46,  4.33s/it, lr: 1.0e-04 loss: 1.879e-01]mindexpander_qwen_v1:  53%|#####3    | 1604/3000 [1:48:09<1:40:46,  4.33s/it, lr: 1.0e-04 loss: 1.879e-01]mindexpander_qwen_v1:  54%|#####3    | 1605/3000 [1:48:09<1:28:35,  3.81s/it, lr: 1.0e-04 loss: 1.879e-01]mindexpander_qwen_v1:  54%|#####3    | 1605/3000 [1:48:09<1:28:35,  3.81s/it, lr: 1.0e-04 loss: 1.879e-01]mindexpander_qwen_v1:  54%|#####3    | 1605/3000 [1:48:13<1:28:35,  3.81s/it, lr: 1.0e-04 loss: 1.888e-02]mindexpander_qwen_v1:  54%|#####3    | 1605/3000 [1:48:13<1:28:35,  3.81s/it, lr: 1.0e-04 loss: 1.888e-02]mindexpander_qwen_v1:  54%|#####3    | 1606/3000 [1:48:13<1:28:06,  3.79s/it, lr: 1.0e-04 loss: 1.888e-02]mindexpander_qwen_v1:  54%|#####3    | 1606/3000 [1:48:13<1:28:06,  3.79s/it, lr: 1.0e-04 loss: 1.888e-02]mindexpander_qwen_v1:  54%|#####3    | 1606/3000 [1:48:15<1:28:06,  3.79s/it, lr: 1.0e-04 loss: 1.393e-01]mindexpander_qwen_v1:  54%|#####3    | 1606/3000 [1:48:15<1:28:06,  3.79s/it, lr: 1.0e-04 loss: 1.393e-01]mindexpander_qwen_v1:  54%|#####3    | 1607/3000 [1:48:15<1:20:24,  3.46s/it, lr: 1.0e-04 loss: 1.393e-01]mindexpander_qwen_v1:  54%|#####3    | 1607/3000 [1:48:15<1:20:24,  3.46s/it, lr: 1.0e-04 loss: 1.393e-01]mindexpander_qwen_v1:  54%|#####3    | 1607/3000 [1:48:19<1:20:24,  3.46s/it, lr: 1.0e-04 loss: 9.091e-02]mindexpander_qwen_v1:  54%|#####3    | 1607/3000 [1:48:19<1:20:24,  3.46s/it, lr: 1.0e-04 loss: 9.091e-02]mindexpander_qwen_v1:  54%|#####3    | 1608/3000 [1:48:19<1:22:09,  3.54s/it, lr: 1.0e-04 loss: 9.091e-02]mindexpander_qwen_v1:  54%|#####3    | 1608/3000 [1:48:19<1:22:09,  3.54s/it, lr: 1.0e-04 loss: 9.091e-02]mindexpander_qwen_v1:  54%|#####3    | 1608/3000 [1:48:23<1:22:09,  3.54s/it, lr: 1.0e-04 loss: 2.865e-02]mindexpander_qwen_v1:  54%|#####3    | 1608/3000 [1:48:23<1:22:09,  3.54s/it, lr: 1.0e-04 loss: 2.865e-02]mindexpander_qwen_v1:  54%|#####3    | 1609/3000 [1:48:23<1:23:25,  3.60s/it, lr: 1.0e-04 loss: 2.865e-02]mindexpander_qwen_v1:  54%|#####3    | 1609/3000 [1:48:23<1:23:25,  3.60s/it, lr: 1.0e-04 loss: 2.865e-02]mindexpander_qwen_v1:  54%|#####3    | 1609/3000 [1:48:27<1:23:25,  3.60s/it, lr: 1.0e-04 loss: 1.340e-01]mindexpander_qwen_v1:  54%|#####3    | 1609/3000 [1:48:27<1:23:25,  3.60s/it, lr: 1.0e-04 loss: 1.340e-01]mindexpander_qwen_v1:  54%|#####3    | 1610/3000 [1:48:30<1:23:22,  3.60s/it, lr: 1.0e-04 loss: 1.158e-01]mindexpander_qwen_v1:  54%|#####3    | 1610/3000 [1:48:30<1:23:22,  3.60s/it, lr: 1.0e-04 loss: 1.158e-01]mindexpander_qwen_v1:  54%|#####3    | 1611/3000 [1:48:30<1:05:57,  2.85s/it, lr: 1.0e-04 loss: 1.158e-01]mindexpander_qwen_v1:  54%|#####3    | 1611/3000 [1:48:30<1:05:57,  2.85s/it, lr: 1.0e-04 loss: 1.158e-01]mindexpander_qwen_v1:  54%|#####3    | 1611/3000 [1:48:36<1:05:57,  2.85s/it, lr: 1.0e-04 loss: 3.835e-02]mindexpander_qwen_v1:  54%|#####3    | 1611/3000 [1:48:36<1:05:57,  2.85s/it, lr: 1.0e-04 loss: 3.835e-02]mindexpander_qwen_v1:  54%|#####3    | 1612/3000 [1:48:36<1:22:25,  3.56s/it, lr: 1.0e-04 loss: 3.835e-02]mindexpander_qwen_v1:  54%|#####3    | 1612/3000 [1:48:36<1:22:25,  3.56s/it, lr: 1.0e-04 loss: 3.835e-02]mindexpander_qwen_v1:  54%|#####3    | 1612/3000 [1:48:40<1:22:25,  3.56s/it, lr: 1.0e-04 loss: 8.435e-03]mindexpander_qwen_v1:  54%|#####3    | 1612/3000 [1:48:40<1:22:25,  3.56s/it, lr: 1.0e-04 loss: 8.435e-03]mindexpander_qwen_v1:  54%|#####3    | 1613/3000 [1:48:40<1:23:24,  3.61s/it, lr: 1.0e-04 loss: 8.435e-03]mindexpander_qwen_v1:  54%|#####3    | 1613/3000 [1:48:40<1:23:24,  3.61s/it, lr: 1.0e-04 loss: 8.435e-03]mindexpander_qwen_v1:  54%|#####3    | 1613/3000 [1:48:46<1:23:24,  3.61s/it, lr: 1.0e-04 loss: 7.805e-02]mindexpander_qwen_v1:  54%|#####3    | 1613/3000 [1:48:46<1:23:24,  3.61s/it, lr: 1.0e-04 loss: 7.805e-02]mindexpander_qwen_v1:  54%|#####3    | 1614/3000 [1:48:46<1:36:46,  4.19s/it, lr: 1.0e-04 loss: 7.805e-02]mindexpander_qwen_v1:  54%|#####3    | 1614/3000 [1:48:46<1:36:46,  4.19s/it, lr: 1.0e-04 loss: 7.805e-02]mindexpander_qwen_v1:  54%|#####3    | 1614/3000 [1:48:48<1:36:46,  4.19s/it, lr: 1.0e-04 loss: 9.354e-02]mindexpander_qwen_v1:  54%|#####3    | 1614/3000 [1:48:48<1:36:46,  4.19s/it, lr: 1.0e-04 loss: 9.354e-02]mindexpander_qwen_v1:  54%|#####3    | 1615/3000 [1:48:48<1:26:46,  3.76s/it, lr: 1.0e-04 loss: 9.354e-02]mindexpander_qwen_v1:  54%|#####3    | 1615/3000 [1:48:48<1:26:46,  3.76s/it, lr: 1.0e-04 loss: 9.354e-02]mindexpander_qwen_v1:  54%|#####3    | 1615/3000 [1:48:51<1:26:46,  3.76s/it, lr: 1.0e-04 loss: 1.128e-01]mindexpander_qwen_v1:  54%|#####3    | 1615/3000 [1:48:51<1:26:46,  3.76s/it, lr: 1.0e-04 loss: 1.128e-01]mindexpander_qwen_v1:  54%|#####3    | 1616/3000 [1:48:51<1:18:01,  3.38s/it, lr: 1.0e-04 loss: 1.128e-01]mindexpander_qwen_v1:  54%|#####3    | 1616/3000 [1:48:51<1:18:01,  3.38s/it, lr: 1.0e-04 loss: 1.128e-01]mindexpander_qwen_v1:  54%|#####3    | 1616/3000 [1:48:53<1:18:01,  3.38s/it, lr: 1.0e-04 loss: 4.442e-02]mindexpander_qwen_v1:  54%|#####3    | 1616/3000 [1:48:53<1:18:01,  3.38s/it, lr: 1.0e-04 loss: 4.442e-02]mindexpander_qwen_v1:  54%|#####3    | 1617/3000 [1:48:53<1:11:41,  3.11s/it, lr: 1.0e-04 loss: 4.442e-02]mindexpander_qwen_v1:  54%|#####3    | 1617/3000 [1:48:53<1:11:41,  3.11s/it, lr: 1.0e-04 loss: 4.442e-02]mindexpander_qwen_v1:  54%|#####3    | 1617/3000 [1:48:59<1:11:41,  3.11s/it, lr: 1.0e-04 loss: 2.173e-02]mindexpander_qwen_v1:  54%|#####3    | 1617/3000 [1:48:59<1:11:41,  3.11s/it, lr: 1.0e-04 loss: 2.173e-02]mindexpander_qwen_v1:  54%|#####3    | 1618/3000 [1:48:59<1:29:24,  3.88s/it, lr: 1.0e-04 loss: 2.173e-02]mindexpander_qwen_v1:  54%|#####3    | 1618/3000 [1:48:59<1:29:24,  3.88s/it, lr: 1.0e-04 loss: 2.173e-02]mindexpander_qwen_v1:  54%|#####3    | 1618/3000 [1:49:03<1:29:24,  3.88s/it, lr: 1.0e-04 loss: 6.356e-02]mindexpander_qwen_v1:  54%|#####3    | 1618/3000 [1:49:03<1:29:24,  3.88s/it, lr: 1.0e-04 loss: 6.356e-02]mindexpander_qwen_v1:  54%|#####3    | 1619/3000 [1:49:03<1:29:37,  3.89s/it, lr: 1.0e-04 loss: 6.356e-02]mindexpander_qwen_v1:  54%|#####3    | 1619/3000 [1:49:03<1:29:37,  3.89s/it, lr: 1.0e-04 loss: 6.356e-02]mindexpander_qwen_v1:  54%|#####3    | 1619/3000 [1:49:06<1:29:37,  3.89s/it, lr: 1.0e-04 loss: 6.933e-02]mindexpander_qwen_v1:  54%|#####3    | 1619/3000 [1:49:06<1:29:37,  3.89s/it, lr: 1.0e-04 loss: 6.933e-02]mindexpander_qwen_v1:  54%|#####4    | 1620/3000 [1:49:09<1:29:33,  3.89s/it, lr: 1.0e-04 loss: 1.063e-01]mindexpander_qwen_v1:  54%|#####4    | 1620/3000 [1:49:09<1:29:33,  3.89s/it, lr: 1.0e-04 loss: 1.063e-01]mindexpander_qwen_v1:  54%|#####4    | 1621/3000 [1:49:09<1:08:18,  2.97s/it, lr: 1.0e-04 loss: 1.063e-01]mindexpander_qwen_v1:  54%|#####4    | 1621/3000 [1:49:09<1:08:18,  2.97s/it, lr: 1.0e-04 loss: 1.063e-01]mindexpander_qwen_v1:  54%|#####4    | 1621/3000 [1:49:15<1:08:18,  2.97s/it, lr: 1.0e-04 loss: 2.150e-02]mindexpander_qwen_v1:  54%|#####4    | 1621/3000 [1:49:15<1:08:18,  2.97s/it, lr: 1.0e-04 loss: 2.150e-02]mindexpander_qwen_v1:  54%|#####4    | 1622/3000 [1:49:15<1:24:01,  3.66s/it, lr: 1.0e-04 loss: 2.150e-02]mindexpander_qwen_v1:  54%|#####4    | 1622/3000 [1:49:15<1:24:01,  3.66s/it, lr: 1.0e-04 loss: 2.150e-02]mindexpander_qwen_v1:  54%|#####4    | 1622/3000 [1:49:19<1:24:01,  3.66s/it, lr: 1.0e-04 loss: 8.079e-02]mindexpander_qwen_v1:  54%|#####4    | 1622/3000 [1:49:19<1:24:01,  3.66s/it, lr: 1.0e-04 loss: 8.079e-02]mindexpander_qwen_v1:  54%|#####4    | 1623/3000 [1:49:19<1:25:59,  3.75s/it, lr: 1.0e-04 loss: 8.079e-02]mindexpander_qwen_v1:  54%|#####4    | 1623/3000 [1:49:19<1:25:59,  3.75s/it, lr: 1.0e-04 loss: 8.079e-02]mindexpander_qwen_v1:  54%|#####4    | 1623/3000 [1:49:25<1:25:59,  3.75s/it, lr: 1.0e-04 loss: 1.094e-02]mindexpander_qwen_v1:  54%|#####4    | 1623/3000 [1:49:25<1:25:59,  3.75s/it, lr: 1.0e-04 loss: 1.094e-02]mindexpander_qwen_v1:  54%|#####4    | 1624/3000 [1:49:25<1:38:25,  4.29s/it, lr: 1.0e-04 loss: 1.094e-02]mindexpander_qwen_v1:  54%|#####4    | 1624/3000 [1:49:25<1:38:25,  4.29s/it, lr: 1.0e-04 loss: 1.094e-02]mindexpander_qwen_v1:  54%|#####4    | 1624/3000 [1:49:29<1:38:25,  4.29s/it, lr: 1.0e-04 loss: 2.196e-02]mindexpander_qwen_v1:  54%|#####4    | 1624/3000 [1:49:29<1:38:25,  4.29s/it, lr: 1.0e-04 loss: 2.196e-02]mindexpander_qwen_v1:  54%|#####4    | 1625/3000 [1:49:29<1:34:50,  4.14s/it, lr: 1.0e-04 loss: 2.196e-02]mindexpander_qwen_v1:  54%|#####4    | 1625/3000 [1:49:29<1:34:50,  4.14s/it, lr: 1.0e-04 loss: 2.196e-02]mindexpander_qwen_v1:  54%|#####4    | 1625/3000 [1:49:31<1:34:50,  4.14s/it, lr: 1.0e-04 loss: 3.932e-02]mindexpander_qwen_v1:  54%|#####4    | 1625/3000 [1:49:31<1:34:50,  4.14s/it, lr: 1.0e-04 loss: 3.932e-02]mindexpander_qwen_v1:  54%|#####4    | 1626/3000 [1:49:31<1:23:46,  3.66s/it, lr: 1.0e-04 loss: 3.932e-02]mindexpander_qwen_v1:  54%|#####4    | 1626/3000 [1:49:31<1:23:46,  3.66s/it, lr: 1.0e-04 loss: 3.932e-02]mindexpander_qwen_v1:  54%|#####4    | 1626/3000 [1:49:34<1:23:46,  3.66s/it, lr: 1.0e-04 loss: 2.444e-02]mindexpander_qwen_v1:  54%|#####4    | 1626/3000 [1:49:34<1:23:46,  3.66s/it, lr: 1.0e-04 loss: 2.444e-02]mindexpander_qwen_v1:  54%|#####4    | 1627/3000 [1:49:34<1:17:03,  3.37s/it, lr: 1.0e-04 loss: 2.444e-02]mindexpander_qwen_v1:  54%|#####4    | 1627/3000 [1:49:34<1:17:03,  3.37s/it, lr: 1.0e-04 loss: 2.444e-02]mindexpander_qwen_v1:  54%|#####4    | 1627/3000 [1:49:40<1:17:03,  3.37s/it, lr: 1.0e-04 loss: 1.289e-01]mindexpander_qwen_v1:  54%|#####4    | 1627/3000 [1:49:40<1:17:03,  3.37s/it, lr: 1.0e-04 loss: 1.289e-01]mindexpander_qwen_v1:  54%|#####4    | 1628/3000 [1:49:40<1:32:59,  4.07s/it, lr: 1.0e-04 loss: 1.289e-01]mindexpander_qwen_v1:  54%|#####4    | 1628/3000 [1:49:40<1:32:59,  4.07s/it, lr: 1.0e-04 loss: 1.289e-01]mindexpander_qwen_v1:  54%|#####4    | 1628/3000 [1:49:43<1:32:59,  4.07s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:  54%|#####4    | 1628/3000 [1:49:43<1:32:59,  4.07s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:  54%|#####4    | 1629/3000 [1:49:43<1:30:44,  3.97s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:  54%|#####4    | 1629/3000 [1:49:43<1:30:44,  3.97s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:  54%|#####4    | 1629/3000 [1:49:46<1:30:44,  3.97s/it, lr: 1.0e-04 loss: 2.428e-02]mindexpander_qwen_v1:  54%|#####4    | 1629/3000 [1:49:46<1:30:44,  3.97s/it, lr: 1.0e-04 loss: 2.428e-02]mindexpander_qwen_v1:  54%|#####4    | 1630/3000 [1:49:50<1:30:40,  3.97s/it, lr: 1.0e-04 loss: 3.574e-02]mindexpander_qwen_v1:  54%|#####4    | 1630/3000 [1:49:50<1:30:40,  3.97s/it, lr: 1.0e-04 loss: 3.574e-02]mindexpander_qwen_v1:  54%|#####4    | 1631/3000 [1:49:50<1:09:32,  3.05s/it, lr: 1.0e-04 loss: 3.574e-02]mindexpander_qwen_v1:  54%|#####4    | 1631/3000 [1:49:50<1:09:32,  3.05s/it, lr: 1.0e-04 loss: 3.574e-02]mindexpander_qwen_v1:  54%|#####4    | 1631/3000 [1:49:52<1:09:32,  3.05s/it, lr: 1.0e-04 loss: 8.275e-03]mindexpander_qwen_v1:  54%|#####4    | 1631/3000 [1:49:52<1:09:32,  3.05s/it, lr: 1.0e-04 loss: 8.275e-03]mindexpander_qwen_v1:  54%|#####4    | 1632/3000 [1:49:52<1:06:08,  2.90s/it, lr: 1.0e-04 loss: 8.275e-03]mindexpander_qwen_v1:  54%|#####4    | 1632/3000 [1:49:52<1:06:08,  2.90s/it, lr: 1.0e-04 loss: 8.275e-03]mindexpander_qwen_v1:  54%|#####4    | 1632/3000 [1:49:58<1:06:08,  2.90s/it, lr: 1.0e-04 loss: 3.027e-02]mindexpander_qwen_v1:  54%|#####4    | 1632/3000 [1:49:58<1:06:08,  2.90s/it, lr: 1.0e-04 loss: 3.027e-02]mindexpander_qwen_v1:  54%|#####4    | 1633/3000 [1:49:58<1:23:01,  3.64s/it, lr: 1.0e-04 loss: 3.027e-02]mindexpander_qwen_v1:  54%|#####4    | 1633/3000 [1:49:58<1:23:01,  3.64s/it, lr: 1.0e-04 loss: 3.027e-02]mindexpander_qwen_v1:  54%|#####4    | 1633/3000 [1:50:04<1:23:01,  3.64s/it, lr: 1.0e-04 loss: 7.861e-02]mindexpander_qwen_v1:  54%|#####4    | 1633/3000 [1:50:04<1:23:01,  3.64s/it, lr: 1.0e-04 loss: 7.861e-02]mindexpander_qwen_v1:  54%|#####4    | 1634/3000 [1:50:04<1:35:59,  4.22s/it, lr: 1.0e-04 loss: 7.861e-02]mindexpander_qwen_v1:  54%|#####4    | 1634/3000 [1:50:04<1:35:59,  4.22s/it, lr: 1.0e-04 loss: 7.861e-02]mindexpander_qwen_v1:  54%|#####4    | 1634/3000 [1:50:06<1:35:59,  4.22s/it, lr: 1.0e-04 loss: 3.246e-02]mindexpander_qwen_v1:  54%|#####4    | 1634/3000 [1:50:06<1:35:59,  4.22s/it, lr: 1.0e-04 loss: 3.246e-02]mindexpander_qwen_v1:  55%|#####4    | 1635/3000 [1:50:06<1:25:53,  3.78s/it, lr: 1.0e-04 loss: 3.246e-02]mindexpander_qwen_v1:  55%|#####4    | 1635/3000 [1:50:06<1:25:53,  3.78s/it, lr: 1.0e-04 loss: 3.246e-02]mindexpander_qwen_v1:  55%|#####4    | 1635/3000 [1:50:09<1:25:53,  3.78s/it, lr: 1.0e-04 loss: 5.097e-02]mindexpander_qwen_v1:  55%|#####4    | 1635/3000 [1:50:09<1:25:53,  3.78s/it, lr: 1.0e-04 loss: 5.097e-02]mindexpander_qwen_v1:  55%|#####4    | 1636/3000 [1:50:09<1:17:16,  3.40s/it, lr: 1.0e-04 loss: 5.097e-02]mindexpander_qwen_v1:  55%|#####4    | 1636/3000 [1:50:09<1:17:16,  3.40s/it, lr: 1.0e-04 loss: 5.097e-02]mindexpander_qwen_v1:  55%|#####4    | 1636/3000 [1:50:14<1:17:16,  3.40s/it, lr: 1.0e-04 loss: 2.894e-02]mindexpander_qwen_v1:  55%|#####4    | 1636/3000 [1:50:14<1:17:16,  3.40s/it, lr: 1.0e-04 loss: 2.894e-02]mindexpander_qwen_v1:  55%|#####4    | 1637/3000 [1:50:14<1:32:42,  4.08s/it, lr: 1.0e-04 loss: 2.894e-02]mindexpander_qwen_v1:  55%|#####4    | 1637/3000 [1:50:14<1:32:42,  4.08s/it, lr: 1.0e-04 loss: 2.894e-02]mindexpander_qwen_v1:  55%|#####4    | 1637/3000 [1:50:18<1:32:42,  4.08s/it, lr: 1.0e-04 loss: 8.393e-02]mindexpander_qwen_v1:  55%|#####4    | 1637/3000 [1:50:18<1:32:42,  4.08s/it, lr: 1.0e-04 loss: 8.393e-02]mindexpander_qwen_v1:  55%|#####4    | 1638/3000 [1:50:18<1:30:25,  3.98s/it, lr: 1.0e-04 loss: 8.393e-02]mindexpander_qwen_v1:  55%|#####4    | 1638/3000 [1:50:18<1:30:25,  3.98s/it, lr: 1.0e-04 loss: 8.393e-02]mindexpander_qwen_v1:  55%|#####4    | 1638/3000 [1:50:24<1:30:25,  3.98s/it, lr: 1.0e-04 loss: 4.843e-02]mindexpander_qwen_v1:  55%|#####4    | 1638/3000 [1:50:24<1:30:25,  3.98s/it, lr: 1.0e-04 loss: 4.843e-02]mindexpander_qwen_v1:  55%|#####4    | 1639/3000 [1:50:24<1:43:05,  4.54s/it, lr: 1.0e-04 loss: 4.843e-02]mindexpander_qwen_v1:  55%|#####4    | 1639/3000 [1:50:24<1:43:05,  4.54s/it, lr: 1.0e-04 loss: 4.843e-02]mindexpander_qwen_v1:  55%|#####4    | 1639/3000 [1:50:27<1:43:05,  4.54s/it, lr: 1.0e-04 loss: 1.610e-01]mindexpander_qwen_v1:  55%|#####4    | 1639/3000 [1:50:27<1:43:05,  4.54s/it, lr: 1.0e-04 loss: 1.610e-01]mindexpander_qwen_v1:  55%|#####4    | 1640/3000 [1:50:30<1:43:01,  4.54s/it, lr: 1.0e-04 loss: 6.633e-02]mindexpander_qwen_v1:  55%|#####4    | 1640/3000 [1:50:30<1:43:01,  4.54s/it, lr: 1.0e-04 loss: 6.633e-02]mindexpander_qwen_v1:  55%|#####4    | 1641/3000 [1:50:30<1:15:14,  3.32s/it, lr: 1.0e-04 loss: 6.633e-02]mindexpander_qwen_v1:  55%|#####4    | 1641/3000 [1:50:30<1:15:14,  3.32s/it, lr: 1.0e-04 loss: 6.633e-02]mindexpander_qwen_v1:  55%|#####4    | 1641/3000 [1:50:36<1:15:14,  3.32s/it, lr: 1.0e-04 loss: 1.420e-01]mindexpander_qwen_v1:  55%|#####4    | 1641/3000 [1:50:36<1:15:14,  3.32s/it, lr: 1.0e-04 loss: 1.420e-01]mindexpander_qwen_v1:  55%|#####4    | 1642/3000 [1:50:36<1:28:44,  3.92s/it, lr: 1.0e-04 loss: 1.420e-01]mindexpander_qwen_v1:  55%|#####4    | 1642/3000 [1:50:36<1:28:44,  3.92s/it, lr: 1.0e-04 loss: 1.420e-01]mindexpander_qwen_v1:  55%|#####4    | 1642/3000 [1:50:40<1:28:44,  3.92s/it, lr: 1.0e-04 loss: 1.143e-01]mindexpander_qwen_v1:  55%|#####4    | 1642/3000 [1:50:40<1:28:44,  3.92s/it, lr: 1.0e-04 loss: 1.143e-01]mindexpander_qwen_v1:  55%|#####4    | 1643/3000 [1:50:40<1:28:34,  3.92s/it, lr: 1.0e-04 loss: 1.143e-01]mindexpander_qwen_v1:  55%|#####4    | 1643/3000 [1:50:40<1:28:34,  3.92s/it, lr: 1.0e-04 loss: 1.143e-01]mindexpander_qwen_v1:  55%|#####4    | 1643/3000 [1:50:44<1:28:34,  3.92s/it, lr: 1.0e-04 loss: 1.757e-01]mindexpander_qwen_v1:  55%|#####4    | 1643/3000 [1:50:44<1:28:34,  3.92s/it, lr: 1.0e-04 loss: 1.757e-01]mindexpander_qwen_v1:  55%|#####4    | 1644/3000 [1:50:44<1:27:26,  3.87s/it, lr: 1.0e-04 loss: 1.757e-01]mindexpander_qwen_v1:  55%|#####4    | 1644/3000 [1:50:44<1:27:26,  3.87s/it, lr: 1.0e-04 loss: 1.757e-01]mindexpander_qwen_v1:  55%|#####4    | 1644/3000 [1:50:46<1:27:26,  3.87s/it, lr: 1.0e-04 loss: 1.080e-01]mindexpander_qwen_v1:  55%|#####4    | 1644/3000 [1:50:46<1:27:26,  3.87s/it, lr: 1.0e-04 loss: 1.080e-01]mindexpander_qwen_v1:  55%|#####4    | 1645/3000 [1:50:46<1:18:24,  3.47s/it, lr: 1.0e-04 loss: 1.080e-01]mindexpander_qwen_v1:  55%|#####4    | 1645/3000 [1:50:46<1:18:24,  3.47s/it, lr: 1.0e-04 loss: 1.080e-01]mindexpander_qwen_v1:  55%|#####4    | 1645/3000 [1:50:52<1:18:24,  3.47s/it, lr: 1.0e-04 loss: 1.491e-01]mindexpander_qwen_v1:  55%|#####4    | 1645/3000 [1:50:52<1:18:24,  3.47s/it, lr: 1.0e-04 loss: 1.491e-01]mindexpander_qwen_v1:  55%|#####4    | 1646/3000 [1:50:52<1:33:01,  4.12s/it, lr: 1.0e-04 loss: 1.491e-01]mindexpander_qwen_v1:  55%|#####4    | 1646/3000 [1:50:52<1:33:01,  4.12s/it, lr: 1.0e-04 loss: 1.491e-01]mindexpander_qwen_v1:  55%|#####4    | 1646/3000 [1:50:56<1:33:01,  4.12s/it, lr: 1.0e-04 loss: 2.124e-02]mindexpander_qwen_v1:  55%|#####4    | 1646/3000 [1:50:56<1:33:01,  4.12s/it, lr: 1.0e-04 loss: 2.124e-02]mindexpander_qwen_v1:  55%|#####4    | 1647/3000 [1:50:56<1:31:33,  4.06s/it, lr: 1.0e-04 loss: 2.124e-02]mindexpander_qwen_v1:  55%|#####4    | 1647/3000 [1:50:56<1:31:33,  4.06s/it, lr: 1.0e-04 loss: 2.124e-02]mindexpander_qwen_v1:  55%|#####4    | 1647/3000 [1:51:02<1:31:33,  4.06s/it, lr: 1.0e-04 loss: 9.773e-03]mindexpander_qwen_v1:  55%|#####4    | 1647/3000 [1:51:02<1:31:33,  4.06s/it, lr: 1.0e-04 loss: 9.773e-03]mindexpander_qwen_v1:  55%|#####4    | 1648/3000 [1:51:02<1:42:36,  4.55s/it, lr: 1.0e-04 loss: 9.773e-03]mindexpander_qwen_v1:  55%|#####4    | 1648/3000 [1:51:02<1:42:36,  4.55s/it, lr: 1.0e-04 loss: 9.773e-03]mindexpander_qwen_v1:  55%|#####4    | 1648/3000 [1:51:04<1:42:36,  4.55s/it, lr: 1.0e-04 loss: 1.367e-01]mindexpander_qwen_v1:  55%|#####4    | 1648/3000 [1:51:04<1:42:36,  4.55s/it, lr: 1.0e-04 loss: 1.367e-01]mindexpander_qwen_v1:  55%|#####4    | 1649/3000 [1:51:04<1:28:34,  3.93s/it, lr: 1.0e-04 loss: 1.367e-01]mindexpander_qwen_v1:  55%|#####4    | 1649/3000 [1:51:04<1:28:34,  3.93s/it, lr: 1.0e-04 loss: 1.367e-01]mindexpander_qwen_v1:  55%|#####4    | 1649/3000 [1:51:08<1:28:34,  3.93s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:  55%|#####4    | 1649/3000 [1:51:08<1:28:34,  3.93s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:  55%|#####5    | 1650/3000 [1:51:14<1:28:30,  3.93s/it, lr: 1.0e-04 loss: 1.691e-02]mindexpander_qwen_v1:  55%|#####5    | 1650/3000 [1:51:14<1:28:30,  3.93s/it, lr: 1.0e-04 loss: 1.691e-02]mindexpander_qwen_v1:  55%|#####5    | 1651/3000 [1:51:14<1:18:42,  3.50s/it, lr: 1.0e-04 loss: 1.691e-02]mindexpander_qwen_v1:  55%|#####5    | 1651/3000 [1:51:14<1:18:42,  3.50s/it, lr: 1.0e-04 loss: 1.691e-02]mindexpander_qwen_v1:  55%|#####5    | 1651/3000 [1:51:16<1:18:42,  3.50s/it, lr: 1.0e-04 loss: 1.015e-01]mindexpander_qwen_v1:  55%|#####5    | 1651/3000 [1:51:16<1:18:42,  3.50s/it, lr: 1.0e-04 loss: 1.015e-01]mindexpander_qwen_v1:  55%|#####5    | 1652/3000 [1:51:16<1:12:51,  3.24s/it, lr: 1.0e-04 loss: 1.015e-01]mindexpander_qwen_v1:  55%|#####5    | 1652/3000 [1:51:16<1:12:51,  3.24s/it, lr: 1.0e-04 loss: 1.015e-01]mindexpander_qwen_v1:  55%|#####5    | 1652/3000 [1:51:19<1:12:51,  3.24s/it, lr: 1.0e-04 loss: 1.088e-01]mindexpander_qwen_v1:  55%|#####5    | 1652/3000 [1:51:19<1:12:51,  3.24s/it, lr: 1.0e-04 loss: 1.088e-01]mindexpander_qwen_v1:  55%|#####5    | 1653/3000 [1:51:19<1:08:09,  3.04s/it, lr: 1.0e-04 loss: 1.088e-01]mindexpander_qwen_v1:  55%|#####5    | 1653/3000 [1:51:19<1:08:09,  3.04s/it, lr: 1.0e-04 loss: 1.088e-01]mindexpander_qwen_v1:  55%|#####5    | 1653/3000 [1:51:23<1:08:09,  3.04s/it, lr: 1.0e-04 loss: 3.346e-02]mindexpander_qwen_v1:  55%|#####5    | 1653/3000 [1:51:23<1:08:09,  3.04s/it, lr: 1.0e-04 loss: 3.346e-02]mindexpander_qwen_v1:  55%|#####5    | 1654/3000 [1:51:23<1:12:21,  3.23s/it, lr: 1.0e-04 loss: 3.346e-02]mindexpander_qwen_v1:  55%|#####5    | 1654/3000 [1:51:23<1:12:21,  3.23s/it, lr: 1.0e-04 loss: 3.346e-02]mindexpander_qwen_v1:  55%|#####5    | 1654/3000 [1:51:29<1:12:21,  3.23s/it, lr: 1.0e-04 loss: 8.823e-02]mindexpander_qwen_v1:  55%|#####5    | 1654/3000 [1:51:29<1:12:21,  3.23s/it, lr: 1.0e-04 loss: 8.823e-02]mindexpander_qwen_v1:  55%|#####5    | 1655/3000 [1:51:29<1:28:58,  3.97s/it, lr: 1.0e-04 loss: 8.823e-02]mindexpander_qwen_v1:  55%|#####5    | 1655/3000 [1:51:29<1:28:58,  3.97s/it, lr: 1.0e-04 loss: 8.823e-02]mindexpander_qwen_v1:  55%|#####5    | 1655/3000 [1:51:31<1:28:58,  3.97s/it, lr: 1.0e-04 loss: 2.963e-02]mindexpander_qwen_v1:  55%|#####5    | 1655/3000 [1:51:31<1:28:58,  3.97s/it, lr: 1.0e-04 loss: 2.963e-02]mindexpander_qwen_v1:  55%|#####5    | 1656/3000 [1:51:31<1:19:12,  3.54s/it, lr: 1.0e-04 loss: 2.963e-02]mindexpander_qwen_v1:  55%|#####5    | 1656/3000 [1:51:31<1:19:12,  3.54s/it, lr: 1.0e-04 loss: 2.963e-02]mindexpander_qwen_v1:  55%|#####5    | 1656/3000 [1:51:35<1:19:12,  3.54s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  55%|#####5    | 1656/3000 [1:51:35<1:19:12,  3.54s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  55%|#####5    | 1657/3000 [1:51:35<1:20:24,  3.59s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  55%|#####5    | 1657/3000 [1:51:35<1:20:24,  3.59s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  55%|#####5    | 1657/3000 [1:51:38<1:20:24,  3.59s/it, lr: 1.0e-04 loss: 3.528e-02]mindexpander_qwen_v1:  55%|#####5    | 1657/3000 [1:51:38<1:20:24,  3.59s/it, lr: 1.0e-04 loss: 3.528e-02]mindexpander_qwen_v1:  55%|#####5    | 1658/3000 [1:51:38<1:21:16,  3.63s/it, lr: 1.0e-04 loss: 3.528e-02]mindexpander_qwen_v1:  55%|#####5    | 1658/3000 [1:51:38<1:21:16,  3.63s/it, lr: 1.0e-04 loss: 3.528e-02]mindexpander_qwen_v1:  55%|#####5    | 1658/3000 [1:51:41<1:21:16,  3.63s/it, lr: 1.0e-04 loss: 1.560e-01]mindexpander_qwen_v1:  55%|#####5    | 1658/3000 [1:51:41<1:21:16,  3.63s/it, lr: 1.0e-04 loss: 1.560e-01]mindexpander_qwen_v1:  55%|#####5    | 1659/3000 [1:51:41<1:14:37,  3.34s/it, lr: 1.0e-04 loss: 1.560e-01]mindexpander_qwen_v1:  55%|#####5    | 1659/3000 [1:51:41<1:14:37,  3.34s/it, lr: 1.0e-04 loss: 1.560e-01]mindexpander_qwen_v1:  55%|#####5    | 1659/3000 [1:51:44<1:14:37,  3.34s/it, lr: 1.0e-04 loss: 3.591e-02]mindexpander_qwen_v1:  55%|#####5    | 1659/3000 [1:51:44<1:14:37,  3.34s/it, lr: 1.0e-04 loss: 3.591e-02]mindexpander_qwen_v1:  55%|#####5    | 1660/3000 [1:51:47<1:14:34,  3.34s/it, lr: 1.0e-04 loss: 1.702e-02]mindexpander_qwen_v1:  55%|#####5    | 1660/3000 [1:51:47<1:14:34,  3.34s/it, lr: 1.0e-04 loss: 1.702e-02]mindexpander_qwen_v1:  55%|#####5    | 1661/3000 [1:51:47<59:28,  2.67s/it, lr: 1.0e-04 loss: 1.702e-02]  mindexpander_qwen_v1:  55%|#####5    | 1661/3000 [1:51:47<59:28,  2.67s/it, lr: 1.0e-04 loss: 1.702e-02]  mindexpander_qwen_v1:  55%|#####5    | 1661/3000 [1:51:50<59:28,  2.67s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  55%|#####5    | 1661/3000 [1:51:50<59:28,  2.67s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  55%|#####5    | 1662/3000 [1:51:50<58:13,  2.61s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  55%|#####5    | 1662/3000 [1:51:50<58:13,  2.61s/it, lr: 1.0e-04 loss: 1.107e-01]mindexpander_qwen_v1:  55%|#####5    | 1662/3000 [1:51:56<58:13,  2.61s/it, lr: 1.0e-04 loss: 5.198e-02]mindexpander_qwen_v1:  55%|#####5    | 1662/3000 [1:51:56<58:13,  2.61s/it, lr: 1.0e-04 loss: 5.198e-02]mindexpander_qwen_v1:  55%|#####5    | 1663/3000 [1:51:56<1:17:14,  3.47s/it, lr: 1.0e-04 loss: 5.198e-02]mindexpander_qwen_v1:  55%|#####5    | 1663/3000 [1:51:56<1:17:14,  3.47s/it, lr: 1.0e-04 loss: 5.198e-02]mindexpander_qwen_v1:  55%|#####5    | 1663/3000 [1:51:58<1:17:14,  3.47s/it, lr: 1.0e-04 loss: 1.822e-01]mindexpander_qwen_v1:  55%|#####5    | 1663/3000 [1:51:58<1:17:14,  3.47s/it, lr: 1.0e-04 loss: 1.822e-01]mindexpander_qwen_v1:  55%|#####5    | 1664/3000 [1:51:58<1:11:00,  3.19s/it, lr: 1.0e-04 loss: 1.822e-01]mindexpander_qwen_v1:  55%|#####5    | 1664/3000 [1:51:58<1:11:00,  3.19s/it, lr: 1.0e-04 loss: 1.822e-01]mindexpander_qwen_v1:  55%|#####5    | 1664/3000 [1:52:02<1:11:00,  3.19s/it, lr: 1.0e-04 loss: 1.795e-02]mindexpander_qwen_v1:  55%|#####5    | 1664/3000 [1:52:02<1:11:00,  3.19s/it, lr: 1.0e-04 loss: 1.795e-02]mindexpander_qwen_v1:  56%|#####5    | 1665/3000 [1:52:02<1:14:20,  3.34s/it, lr: 1.0e-04 loss: 1.795e-02]mindexpander_qwen_v1:  56%|#####5    | 1665/3000 [1:52:02<1:14:20,  3.34s/it, lr: 1.0e-04 loss: 1.795e-02]mindexpander_qwen_v1:  56%|#####5    | 1665/3000 [1:52:08<1:14:20,  3.34s/it, lr: 1.0e-04 loss: 1.841e-01]mindexpander_qwen_v1:  56%|#####5    | 1665/3000 [1:52:08<1:14:20,  3.34s/it, lr: 1.0e-04 loss: 1.841e-01]mindexpander_qwen_v1:  56%|#####5    | 1666/3000 [1:52:08<1:29:31,  4.03s/it, lr: 1.0e-04 loss: 1.841e-01]mindexpander_qwen_v1:  56%|#####5    | 1666/3000 [1:52:08<1:29:31,  4.03s/it, lr: 1.0e-04 loss: 1.841e-01]mindexpander_qwen_v1:  56%|#####5    | 1666/3000 [1:52:13<1:29:31,  4.03s/it, lr: 1.0e-04 loss: 1.749e-01]mindexpander_qwen_v1:  56%|#####5    | 1666/3000 [1:52:13<1:29:31,  4.03s/it, lr: 1.0e-04 loss: 1.749e-01]mindexpander_qwen_v1:  56%|#####5    | 1667/3000 [1:52:13<1:41:24,  4.56s/it, lr: 1.0e-04 loss: 1.749e-01]mindexpander_qwen_v1:  56%|#####5    | 1667/3000 [1:52:13<1:41:24,  4.56s/it, lr: 1.0e-04 loss: 1.749e-01]mindexpander_qwen_v1:  56%|#####5    | 1667/3000 [1:52:16<1:41:24,  4.56s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  56%|#####5    | 1667/3000 [1:52:16<1:41:24,  4.56s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  56%|#####5    | 1668/3000 [1:52:16<1:27:33,  3.94s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  56%|#####5    | 1668/3000 [1:52:16<1:27:33,  3.94s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  56%|#####5    | 1668/3000 [1:52:18<1:27:33,  3.94s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:  56%|#####5    | 1668/3000 [1:52:18<1:27:33,  3.94s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:  56%|#####5    | 1669/3000 [1:52:18<1:17:39,  3.50s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:  56%|#####5    | 1669/3000 [1:52:18<1:17:39,  3.50s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:  56%|#####5    | 1669/3000 [1:52:24<1:17:39,  3.50s/it, lr: 1.0e-04 loss: 1.862e-01]mindexpander_qwen_v1:  56%|#####5    | 1669/3000 [1:52:24<1:17:39,  3.50s/it, lr: 1.0e-04 loss: 1.862e-01]mindexpander_qwen_v1:  56%|#####5    | 1670/3000 [1:52:28<1:17:36,  3.50s/it, lr: 1.0e-04 loss: 1.845e-02]mindexpander_qwen_v1:  56%|#####5    | 1670/3000 [1:52:28<1:17:36,  3.50s/it, lr: 1.0e-04 loss: 1.845e-02]mindexpander_qwen_v1:  56%|#####5    | 1671/3000 [1:52:28<1:01:47,  2.79s/it, lr: 1.0e-04 loss: 1.845e-02]mindexpander_qwen_v1:  56%|#####5    | 1671/3000 [1:52:28<1:01:47,  2.79s/it, lr: 1.0e-04 loss: 1.845e-02]mindexpander_qwen_v1:  56%|#####5    | 1671/3000 [1:52:34<1:01:47,  2.79s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:  56%|#####5    | 1671/3000 [1:52:34<1:01:47,  2.79s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:  56%|#####5    | 1672/3000 [1:52:34<1:17:50,  3.52s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:  56%|#####5    | 1672/3000 [1:52:34<1:17:50,  3.52s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:  56%|#####5    | 1672/3000 [1:52:37<1:17:50,  3.52s/it, lr: 1.0e-04 loss: 1.201e-01]mindexpander_qwen_v1:  56%|#####5    | 1672/3000 [1:52:37<1:17:50,  3.52s/it, lr: 1.0e-04 loss: 1.201e-01]mindexpander_qwen_v1:  56%|#####5    | 1673/3000 [1:52:37<1:19:00,  3.57s/it, lr: 1.0e-04 loss: 1.201e-01]mindexpander_qwen_v1:  56%|#####5    | 1673/3000 [1:52:37<1:19:00,  3.57s/it, lr: 1.0e-04 loss: 1.201e-01]mindexpander_qwen_v1:  56%|#####5    | 1673/3000 [1:52:43<1:19:00,  3.57s/it, lr: 1.0e-04 loss: 1.592e-01]mindexpander_qwen_v1:  56%|#####5    | 1673/3000 [1:52:43<1:19:00,  3.57s/it, lr: 1.0e-04 loss: 1.592e-01]mindexpander_qwen_v1:  56%|#####5    | 1674/3000 [1:52:43<1:31:59,  4.16s/it, lr: 1.0e-04 loss: 1.592e-01]mindexpander_qwen_v1:  56%|#####5    | 1674/3000 [1:52:43<1:31:59,  4.16s/it, lr: 1.0e-04 loss: 1.592e-01]mindexpander_qwen_v1:  56%|#####5    | 1674/3000 [1:52:49<1:31:59,  4.16s/it, lr: 1.0e-04 loss: 1.413e-02]mindexpander_qwen_v1:  56%|#####5    | 1674/3000 [1:52:49<1:31:59,  4.16s/it, lr: 1.0e-04 loss: 1.413e-02]mindexpander_qwen_v1:  56%|#####5    | 1675/3000 [1:52:49<1:42:28,  4.64s/it, lr: 1.0e-04 loss: 1.413e-02]mindexpander_qwen_v1:  56%|#####5    | 1675/3000 [1:52:49<1:42:28,  4.64s/it, lr: 1.0e-04 loss: 1.413e-02]mindexpander_qwen_v1:  56%|#####5    | 1675/3000 [1:52:55<1:42:28,  4.64s/it, lr: 1.0e-04 loss: 4.207e-04]mindexpander_qwen_v1:  56%|#####5    | 1675/3000 [1:52:55<1:42:28,  4.64s/it, lr: 1.0e-04 loss: 4.207e-04]mindexpander_qwen_v1:  56%|#####5    | 1676/3000 [1:52:55<1:49:20,  4.96s/it, lr: 1.0e-04 loss: 4.207e-04]mindexpander_qwen_v1:  56%|#####5    | 1676/3000 [1:52:55<1:49:20,  4.96s/it, lr: 1.0e-04 loss: 4.207e-04]mindexpander_qwen_v1:  56%|#####5    | 1676/3000 [1:52:58<1:49:20,  4.96s/it, lr: 1.0e-04 loss: 9.357e-02]mindexpander_qwen_v1:  56%|#####5    | 1676/3000 [1:52:58<1:49:20,  4.96s/it, lr: 1.0e-04 loss: 9.357e-02]mindexpander_qwen_v1:  56%|#####5    | 1677/3000 [1:52:58<1:41:28,  4.60s/it, lr: 1.0e-04 loss: 9.357e-02]mindexpander_qwen_v1:  56%|#####5    | 1677/3000 [1:52:58<1:41:28,  4.60s/it, lr: 1.0e-04 loss: 9.357e-02]mindexpander_qwen_v1:  56%|#####5    | 1677/3000 [1:53:02<1:41:28,  4.60s/it, lr: 1.0e-04 loss: 5.200e-03]mindexpander_qwen_v1:  56%|#####5    | 1677/3000 [1:53:02<1:41:28,  4.60s/it, lr: 1.0e-04 loss: 5.200e-03]mindexpander_qwen_v1:  56%|#####5    | 1678/3000 [1:53:02<1:35:48,  4.35s/it, lr: 1.0e-04 loss: 5.200e-03]mindexpander_qwen_v1:  56%|#####5    | 1678/3000 [1:53:02<1:35:48,  4.35s/it, lr: 1.0e-04 loss: 5.200e-03]mindexpander_qwen_v1:  56%|#####5    | 1678/3000 [1:53:05<1:35:48,  4.35s/it, lr: 1.0e-04 loss: 6.024e-02]mindexpander_qwen_v1:  56%|#####5    | 1678/3000 [1:53:05<1:35:48,  4.35s/it, lr: 1.0e-04 loss: 6.024e-02]mindexpander_qwen_v1:  56%|#####5    | 1679/3000 [1:53:05<1:24:45,  3.85s/it, lr: 1.0e-04 loss: 6.024e-02]mindexpander_qwen_v1:  56%|#####5    | 1679/3000 [1:53:05<1:24:45,  3.85s/it, lr: 1.0e-04 loss: 6.024e-02]mindexpander_qwen_v1:  56%|#####5    | 1679/3000 [1:53:11<1:24:45,  3.85s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  56%|#####5    | 1679/3000 [1:53:11<1:24:45,  3.85s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  56%|#####6    | 1680/3000 [1:53:15<1:24:41,  3.85s/it, lr: 1.0e-04 loss: 9.012e-02]mindexpander_qwen_v1:  56%|#####6    | 1680/3000 [1:53:15<1:24:41,  3.85s/it, lr: 1.0e-04 loss: 9.012e-02]mindexpander_qwen_v1:  56%|#####6    | 1681/3000 [1:53:15<1:04:43,  2.94s/it, lr: 1.0e-04 loss: 9.012e-02]mindexpander_qwen_v1:  56%|#####6    | 1681/3000 [1:53:15<1:04:43,  2.94s/it, lr: 1.0e-04 loss: 9.012e-02]mindexpander_qwen_v1:  56%|#####6    | 1681/3000 [1:53:17<1:04:43,  2.94s/it, lr: 1.0e-04 loss: 1.940e-01]mindexpander_qwen_v1:  56%|#####6    | 1681/3000 [1:53:17<1:04:43,  2.94s/it, lr: 1.0e-04 loss: 1.940e-01]mindexpander_qwen_v1:  56%|#####6    | 1682/3000 [1:53:17<1:02:09,  2.83s/it, lr: 1.0e-04 loss: 1.940e-01]mindexpander_qwen_v1:  56%|#####6    | 1682/3000 [1:53:17<1:02:09,  2.83s/it, lr: 1.0e-04 loss: 1.940e-01]mindexpander_qwen_v1:  56%|#####6    | 1682/3000 [1:53:21<1:02:09,  2.83s/it, lr: 1.0e-04 loss: 1.437e-01]mindexpander_qwen_v1:  56%|#####6    | 1682/3000 [1:53:21<1:02:09,  2.83s/it, lr: 1.0e-04 loss: 1.437e-01]mindexpander_qwen_v1:  56%|#####6    | 1683/3000 [1:53:21<1:08:41,  3.13s/it, lr: 1.0e-04 loss: 1.437e-01]mindexpander_qwen_v1:  56%|#####6    | 1683/3000 [1:53:21<1:08:41,  3.13s/it, lr: 1.0e-04 loss: 1.437e-01]mindexpander_qwen_v1:  56%|#####6    | 1683/3000 [1:53:25<1:08:41,  3.13s/it, lr: 1.0e-04 loss: 3.407e-02]mindexpander_qwen_v1:  56%|#####6    | 1683/3000 [1:53:25<1:08:41,  3.13s/it, lr: 1.0e-04 loss: 3.407e-02]mindexpander_qwen_v1:  56%|#####6    | 1684/3000 [1:53:25<1:12:13,  3.29s/it, lr: 1.0e-04 loss: 3.407e-02]mindexpander_qwen_v1:  56%|#####6    | 1684/3000 [1:53:25<1:12:13,  3.29s/it, lr: 1.0e-04 loss: 3.407e-02]mindexpander_qwen_v1:  56%|#####6    | 1684/3000 [1:53:29<1:12:13,  3.29s/it, lr: 1.0e-04 loss: 1.464e-02]mindexpander_qwen_v1:  56%|#####6    | 1684/3000 [1:53:29<1:12:13,  3.29s/it, lr: 1.0e-04 loss: 1.464e-02]mindexpander_qwen_v1:  56%|#####6    | 1685/3000 [1:53:29<1:14:51,  3.42s/it, lr: 1.0e-04 loss: 1.464e-02]mindexpander_qwen_v1:  56%|#####6    | 1685/3000 [1:53:29<1:14:51,  3.42s/it, lr: 1.0e-04 loss: 1.464e-02]mindexpander_qwen_v1:  56%|#####6    | 1685/3000 [1:53:31<1:14:51,  3.42s/it, lr: 1.0e-04 loss: 4.183e-02]mindexpander_qwen_v1:  56%|#####6    | 1685/3000 [1:53:31<1:14:51,  3.42s/it, lr: 1.0e-04 loss: 4.183e-02]mindexpander_qwen_v1:  56%|#####6    | 1686/3000 [1:53:31<1:08:43,  3.14s/it, lr: 1.0e-04 loss: 4.183e-02]mindexpander_qwen_v1:  56%|#####6    | 1686/3000 [1:53:31<1:08:43,  3.14s/it, lr: 1.0e-04 loss: 4.183e-02]mindexpander_qwen_v1:  56%|#####6    | 1686/3000 [1:53:35<1:08:43,  3.14s/it, lr: 1.0e-04 loss: 3.348e-02]mindexpander_qwen_v1:  56%|#####6    | 1686/3000 [1:53:35<1:08:43,  3.14s/it, lr: 1.0e-04 loss: 3.348e-02]mindexpander_qwen_v1:  56%|#####6    | 1687/3000 [1:53:35<1:13:34,  3.36s/it, lr: 1.0e-04 loss: 3.348e-02]mindexpander_qwen_v1:  56%|#####6    | 1687/3000 [1:53:35<1:13:34,  3.36s/it, lr: 1.0e-04 loss: 3.348e-02]mindexpander_qwen_v1:  56%|#####6    | 1687/3000 [1:53:37<1:13:34,  3.36s/it, lr: 1.0e-04 loss: 3.835e-02]mindexpander_qwen_v1:  56%|#####6    | 1687/3000 [1:53:37<1:13:34,  3.36s/it, lr: 1.0e-04 loss: 3.835e-02]mindexpander_qwen_v1:  56%|#####6    | 1688/3000 [1:53:37<1:07:37,  3.09s/it, lr: 1.0e-04 loss: 3.835e-02]mindexpander_qwen_v1:  56%|#####6    | 1688/3000 [1:53:37<1:07:37,  3.09s/it, lr: 1.0e-04 loss: 3.835e-02]mindexpander_qwen_v1:  56%|#####6    | 1688/3000 [1:53:41<1:07:37,  3.09s/it, lr: 1.0e-04 loss: 5.254e-02]mindexpander_qwen_v1:  56%|#####6    | 1688/3000 [1:53:41<1:07:37,  3.09s/it, lr: 1.0e-04 loss: 5.254e-02]mindexpander_qwen_v1:  56%|#####6    | 1689/3000 [1:53:41<1:11:38,  3.28s/it, lr: 1.0e-04 loss: 5.254e-02]mindexpander_qwen_v1:  56%|#####6    | 1689/3000 [1:53:41<1:11:38,  3.28s/it, lr: 1.0e-04 loss: 5.254e-02]mindexpander_qwen_v1:  56%|#####6    | 1689/3000 [1:53:44<1:11:38,  3.28s/it, lr: 1.0e-04 loss: 3.257e-02]mindexpander_qwen_v1:  56%|#####6    | 1689/3000 [1:53:44<1:11:38,  3.28s/it, lr: 1.0e-04 loss: 3.257e-02]mindexpander_qwen_v1:  56%|#####6    | 1690/3000 [1:53:49<1:11:34,  3.28s/it, lr: 1.0e-04 loss: 1.270e-02]mindexpander_qwen_v1:  56%|#####6    | 1690/3000 [1:53:49<1:11:34,  3.28s/it, lr: 1.0e-04 loss: 1.270e-02]mindexpander_qwen_v1:  56%|#####6    | 1691/3000 [1:53:49<1:08:08,  3.12s/it, lr: 1.0e-04 loss: 1.270e-02]mindexpander_qwen_v1:  56%|#####6    | 1691/3000 [1:53:49<1:08:08,  3.12s/it, lr: 1.0e-04 loss: 1.270e-02]mindexpander_qwen_v1:  56%|#####6    | 1691/3000 [1:53:52<1:08:08,  3.12s/it, lr: 1.0e-04 loss: 1.758e-01]mindexpander_qwen_v1:  56%|#####6    | 1691/3000 [1:53:52<1:08:08,  3.12s/it, lr: 1.0e-04 loss: 1.758e-01]mindexpander_qwen_v1:  56%|#####6    | 1692/3000 [1:53:52<1:04:27,  2.96s/it, lr: 1.0e-04 loss: 1.758e-01]mindexpander_qwen_v1:  56%|#####6    | 1692/3000 [1:53:52<1:04:27,  2.96s/it, lr: 1.0e-04 loss: 1.758e-01]mindexpander_qwen_v1:  56%|#####6    | 1692/3000 [1:53:58<1:04:27,  2.96s/it, lr: 1.0e-04 loss: 4.690e-02]mindexpander_qwen_v1:  56%|#####6    | 1692/3000 [1:53:58<1:04:27,  2.96s/it, lr: 1.0e-04 loss: 4.690e-02]mindexpander_qwen_v1:  56%|#####6    | 1693/3000 [1:53:58<1:20:19,  3.69s/it, lr: 1.0e-04 loss: 4.690e-02]mindexpander_qwen_v1:  56%|#####6    | 1693/3000 [1:53:58<1:20:19,  3.69s/it, lr: 1.0e-04 loss: 4.690e-02]mindexpander_qwen_v1:  56%|#####6    | 1693/3000 [1:54:03<1:20:19,  3.69s/it, lr: 1.0e-04 loss: 1.681e-01]mindexpander_qwen_v1:  56%|#####6    | 1693/3000 [1:54:03<1:20:19,  3.69s/it, lr: 1.0e-04 loss: 1.681e-01]mindexpander_qwen_v1:  56%|#####6    | 1694/3000 [1:54:03<1:32:28,  4.25s/it, lr: 1.0e-04 loss: 1.681e-01]mindexpander_qwen_v1:  56%|#####6    | 1694/3000 [1:54:03<1:32:28,  4.25s/it, lr: 1.0e-04 loss: 1.681e-01]mindexpander_qwen_v1:  56%|#####6    | 1694/3000 [1:54:06<1:32:28,  4.25s/it, lr: 1.0e-04 loss: 4.252e-02]mindexpander_qwen_v1:  56%|#####6    | 1694/3000 [1:54:06<1:32:28,  4.25s/it, lr: 1.0e-04 loss: 4.252e-02]mindexpander_qwen_v1:  56%|#####6    | 1695/3000 [1:54:06<1:22:51,  3.81s/it, lr: 1.0e-04 loss: 4.252e-02]mindexpander_qwen_v1:  56%|#####6    | 1695/3000 [1:54:06<1:22:51,  3.81s/it, lr: 1.0e-04 loss: 4.252e-02]mindexpander_qwen_v1:  56%|#####6    | 1695/3000 [1:54:10<1:22:51,  3.81s/it, lr: 1.0e-04 loss: 1.111e-01]mindexpander_qwen_v1:  56%|#####6    | 1695/3000 [1:54:10<1:22:51,  3.81s/it, lr: 1.0e-04 loss: 1.111e-01]mindexpander_qwen_v1:  57%|#####6    | 1696/3000 [1:54:10<1:22:20,  3.79s/it, lr: 1.0e-04 loss: 1.111e-01]mindexpander_qwen_v1:  57%|#####6    | 1696/3000 [1:54:10<1:22:20,  3.79s/it, lr: 1.0e-04 loss: 1.111e-01]mindexpander_qwen_v1:  57%|#####6    | 1696/3000 [1:54:12<1:22:20,  3.79s/it, lr: 1.0e-04 loss: 2.664e-02]mindexpander_qwen_v1:  57%|#####6    | 1696/3000 [1:54:12<1:22:20,  3.79s/it, lr: 1.0e-04 loss: 2.664e-02]mindexpander_qwen_v1:  57%|#####6    | 1697/3000 [1:54:12<1:13:54,  3.40s/it, lr: 1.0e-04 loss: 2.664e-02]mindexpander_qwen_v1:  57%|#####6    | 1697/3000 [1:54:12<1:13:54,  3.40s/it, lr: 1.0e-04 loss: 2.664e-02]mindexpander_qwen_v1:  57%|#####6    | 1697/3000 [1:54:16<1:13:54,  3.40s/it, lr: 1.0e-04 loss: 2.328e-02]mindexpander_qwen_v1:  57%|#####6    | 1697/3000 [1:54:16<1:13:54,  3.40s/it, lr: 1.0e-04 loss: 2.328e-02]mindexpander_qwen_v1:  57%|#####6    | 1698/3000 [1:54:16<1:16:02,  3.50s/it, lr: 1.0e-04 loss: 2.328e-02]mindexpander_qwen_v1:  57%|#####6    | 1698/3000 [1:54:16<1:16:02,  3.50s/it, lr: 1.0e-04 loss: 2.328e-02]mindexpander_qwen_v1:  57%|#####6    | 1698/3000 [1:54:19<1:16:02,  3.50s/it, lr: 1.0e-04 loss: 8.551e-02]mindexpander_qwen_v1:  57%|#####6    | 1698/3000 [1:54:19<1:16:02,  3.50s/it, lr: 1.0e-04 loss: 8.551e-02]mindexpander_qwen_v1:  57%|#####6    | 1699/3000 [1:54:19<1:10:29,  3.25s/it, lr: 1.0e-04 loss: 8.551e-02]mindexpander_qwen_v1:  57%|#####6    | 1699/3000 [1:54:19<1:10:29,  3.25s/it, lr: 1.0e-04 loss: 8.551e-02]mindexpander_qwen_v1:  57%|#####6    | 1699/3000 [1:54:22<1:10:29,  3.25s/it, lr: 1.0e-04 loss: 8.134e-03]mindexpander_qwen_v1:  57%|#####6    | 1699/3000 [1:54:22<1:10:29,  3.25s/it, lr: 1.0e-04 loss: 8.134e-03]mindexpander_qwen_v1:  57%|#####6    | 1700/3000 [1:54:28<1:10:25,  3.25s/it, lr: 1.0e-04 loss: 1.369e-01]mindexpander_qwen_v1:  57%|#####6    | 1700/3000 [1:54:28<1:10:25,  3.25s/it, lr: 1.0e-04 loss: 1.369e-01]mindexpander_qwen_v1:  57%|#####6    | 1701/3000 [1:54:28<1:06:39,  3.08s/it, lr: 1.0e-04 loss: 1.369e-01]mindexpander_qwen_v1:  57%|#####6    | 1701/3000 [1:54:28<1:06:39,  3.08s/it, lr: 1.0e-04 loss: 1.369e-01]mindexpander_qwen_v1:  57%|#####6    | 1701/3000 [1:54:34<1:06:39,  3.08s/it, lr: 1.0e-04 loss: 7.710e-02]mindexpander_qwen_v1:  57%|#####6    | 1701/3000 [1:54:34<1:06:39,  3.08s/it, lr: 1.0e-04 loss: 7.710e-02]mindexpander_qwen_v1:  57%|#####6    | 1702/3000 [1:54:34<1:20:50,  3.74s/it, lr: 1.0e-04 loss: 7.710e-02]mindexpander_qwen_v1:  57%|#####6    | 1702/3000 [1:54:34<1:20:50,  3.74s/it, lr: 1.0e-04 loss: 7.710e-02]mindexpander_qwen_v1:  57%|#####6    | 1702/3000 [1:54:40<1:20:50,  3.74s/it, lr: 1.0e-04 loss: 4.679e-02]mindexpander_qwen_v1:  57%|#####6    | 1702/3000 [1:54:40<1:20:50,  3.74s/it, lr: 1.0e-04 loss: 4.679e-02]mindexpander_qwen_v1:  57%|#####6    | 1703/3000 [1:54:40<1:32:51,  4.30s/it, lr: 1.0e-04 loss: 4.679e-02]mindexpander_qwen_v1:  57%|#####6    | 1703/3000 [1:54:40<1:32:51,  4.30s/it, lr: 1.0e-04 loss: 4.679e-02]mindexpander_qwen_v1:  57%|#####6    | 1703/3000 [1:54:44<1:32:51,  4.30s/it, lr: 1.0e-04 loss: 6.420e-03]mindexpander_qwen_v1:  57%|#####6    | 1703/3000 [1:54:44<1:32:51,  4.30s/it, lr: 1.0e-04 loss: 6.420e-03]mindexpander_qwen_v1:  57%|#####6    | 1704/3000 [1:54:44<1:29:32,  4.15s/it, lr: 1.0e-04 loss: 6.420e-03]mindexpander_qwen_v1:  57%|#####6    | 1704/3000 [1:54:44<1:29:32,  4.15s/it, lr: 1.0e-04 loss: 6.420e-03]mindexpander_qwen_v1:  57%|#####6    | 1704/3000 [1:54:46<1:29:32,  4.15s/it, lr: 1.0e-04 loss: 7.916e-02]mindexpander_qwen_v1:  57%|#####6    | 1704/3000 [1:54:46<1:29:32,  4.15s/it, lr: 1.0e-04 loss: 7.916e-02]mindexpander_qwen_v1:  57%|#####6    | 1705/3000 [1:54:46<1:19:15,  3.67s/it, lr: 1.0e-04 loss: 7.916e-02]mindexpander_qwen_v1:  57%|#####6    | 1705/3000 [1:54:46<1:19:15,  3.67s/it, lr: 1.0e-04 loss: 7.916e-02]mindexpander_qwen_v1:  57%|#####6    | 1705/3000 [1:54:52<1:19:15,  3.67s/it, lr: 1.0e-04 loss: 1.578e-02]mindexpander_qwen_v1:  57%|#####6    | 1705/3000 [1:54:52<1:19:15,  3.67s/it, lr: 1.0e-04 loss: 1.578e-02]mindexpander_qwen_v1:  57%|#####6    | 1706/3000 [1:54:52<1:31:57,  4.26s/it, lr: 1.0e-04 loss: 1.578e-02]mindexpander_qwen_v1:  57%|#####6    | 1706/3000 [1:54:52<1:31:57,  4.26s/it, lr: 1.0e-04 loss: 1.578e-02]mindexpander_qwen_v1:  57%|#####6    | 1706/3000 [1:54:58<1:31:57,  4.26s/it, lr: 1.0e-04 loss: 1.663e-02]mindexpander_qwen_v1:  57%|#####6    | 1706/3000 [1:54:58<1:31:57,  4.26s/it, lr: 1.0e-04 loss: 1.663e-02]mindexpander_qwen_v1:  57%|#####6    | 1707/3000 [1:54:58<1:42:05,  4.74s/it, lr: 1.0e-04 loss: 1.663e-02]mindexpander_qwen_v1:  57%|#####6    | 1707/3000 [1:54:58<1:42:05,  4.74s/it, lr: 1.0e-04 loss: 1.663e-02]mindexpander_qwen_v1:  57%|#####6    | 1707/3000 [1:55:00<1:42:05,  4.74s/it, lr: 1.0e-04 loss: 7.595e-02]mindexpander_qwen_v1:  57%|#####6    | 1707/3000 [1:55:00<1:42:05,  4.74s/it, lr: 1.0e-04 loss: 7.595e-02]mindexpander_qwen_v1:  57%|#####6    | 1708/3000 [1:55:00<1:27:34,  4.07s/it, lr: 1.0e-04 loss: 7.595e-02]mindexpander_qwen_v1:  57%|#####6    | 1708/3000 [1:55:00<1:27:34,  4.07s/it, lr: 1.0e-04 loss: 7.595e-02]mindexpander_qwen_v1:  57%|#####6    | 1708/3000 [1:55:06<1:27:34,  4.07s/it, lr: 1.0e-04 loss: 1.090e-02]mindexpander_qwen_v1:  57%|#####6    | 1708/3000 [1:55:06<1:27:34,  4.07s/it, lr: 1.0e-04 loss: 1.090e-02]mindexpander_qwen_v1:  57%|#####6    | 1709/3000 [1:55:06<1:38:09,  4.56s/it, lr: 1.0e-04 loss: 1.090e-02]mindexpander_qwen_v1:  57%|#####6    | 1709/3000 [1:55:06<1:38:09,  4.56s/it, lr: 1.0e-04 loss: 1.090e-02]mindexpander_qwen_v1:  57%|#####6    | 1709/3000 [1:55:09<1:38:09,  4.56s/it, lr: 1.0e-04 loss: 5.835e-02]mindexpander_qwen_v1:  57%|#####6    | 1709/3000 [1:55:09<1:38:09,  4.56s/it, lr: 1.0e-04 loss: 5.835e-02]mindexpander_qwen_v1:  57%|#####6    | 1710/3000 [1:55:15<1:38:04,  4.56s/it, lr: 1.0e-04 loss: 1.167e-01]mindexpander_qwen_v1:  57%|#####6    | 1710/3000 [1:55:15<1:38:04,  4.56s/it, lr: 1.0e-04 loss: 1.167e-01]mindexpander_qwen_v1:  57%|#####7    | 1711/3000 [1:55:15<1:22:34,  3.84s/it, lr: 1.0e-04 loss: 1.167e-01]mindexpander_qwen_v1:  57%|#####7    | 1711/3000 [1:55:15<1:22:34,  3.84s/it, lr: 1.0e-04 loss: 1.167e-01]mindexpander_qwen_v1:  57%|#####7    | 1711/3000 [1:55:18<1:22:34,  3.84s/it, lr: 1.0e-04 loss: 1.424e-02]mindexpander_qwen_v1:  57%|#####7    | 1711/3000 [1:55:18<1:22:34,  3.84s/it, lr: 1.0e-04 loss: 1.424e-02]mindexpander_qwen_v1:  57%|#####7    | 1712/3000 [1:55:18<1:22:01,  3.82s/it, lr: 1.0e-04 loss: 1.424e-02]mindexpander_qwen_v1:  57%|#####7    | 1712/3000 [1:55:18<1:22:01,  3.82s/it, lr: 1.0e-04 loss: 1.424e-02]mindexpander_qwen_v1:  57%|#####7    | 1712/3000 [1:55:21<1:22:01,  3.82s/it, lr: 1.0e-04 loss: 1.273e-01]mindexpander_qwen_v1:  57%|#####7    | 1712/3000 [1:55:21<1:22:01,  3.82s/it, lr: 1.0e-04 loss: 1.273e-01]mindexpander_qwen_v1:  57%|#####7    | 1713/3000 [1:55:21<1:14:19,  3.46s/it, lr: 1.0e-04 loss: 1.273e-01]mindexpander_qwen_v1:  57%|#####7    | 1713/3000 [1:55:21<1:14:19,  3.46s/it, lr: 1.0e-04 loss: 1.273e-01]mindexpander_qwen_v1:  57%|#####7    | 1713/3000 [1:55:25<1:14:19,  3.46s/it, lr: 1.0e-04 loss: 1.671e-01]mindexpander_qwen_v1:  57%|#####7    | 1713/3000 [1:55:25<1:14:19,  3.46s/it, lr: 1.0e-04 loss: 1.671e-01]mindexpander_qwen_v1:  57%|#####7    | 1714/3000 [1:55:25<1:15:53,  3.54s/it, lr: 1.0e-04 loss: 1.671e-01]mindexpander_qwen_v1:  57%|#####7    | 1714/3000 [1:55:25<1:15:53,  3.54s/it, lr: 1.0e-04 loss: 1.671e-01]mindexpander_qwen_v1:  57%|#####7    | 1714/3000 [1:55:31<1:15:53,  3.54s/it, lr: 1.0e-04 loss: 2.187e-02]mindexpander_qwen_v1:  57%|#####7    | 1714/3000 [1:55:31<1:15:53,  3.54s/it, lr: 1.0e-04 loss: 2.187e-02]mindexpander_qwen_v1:  57%|#####7    | 1715/3000 [1:55:31<1:29:59,  4.20s/it, lr: 1.0e-04 loss: 2.187e-02]mindexpander_qwen_v1:  57%|#####7    | 1715/3000 [1:55:31<1:29:59,  4.20s/it, lr: 1.0e-04 loss: 2.187e-02]mindexpander_qwen_v1:  57%|#####7    | 1715/3000 [1:55:33<1:29:59,  4.20s/it, lr: 1.0e-04 loss: 1.804e-01]mindexpander_qwen_v1:  57%|#####7    | 1715/3000 [1:55:33<1:29:59,  4.20s/it, lr: 1.0e-04 loss: 1.804e-01]mindexpander_qwen_v1:  57%|#####7    | 1716/3000 [1:55:33<1:19:18,  3.71s/it, lr: 1.0e-04 loss: 1.804e-01]mindexpander_qwen_v1:  57%|#####7    | 1716/3000 [1:55:33<1:19:18,  3.71s/it, lr: 1.0e-04 loss: 1.804e-01]mindexpander_qwen_v1:  57%|#####7    | 1716/3000 [1:55:37<1:19:18,  3.71s/it, lr: 1.0e-04 loss: 4.929e-02]mindexpander_qwen_v1:  57%|#####7    | 1716/3000 [1:55:37<1:19:18,  3.71s/it, lr: 1.0e-04 loss: 4.929e-02]mindexpander_qwen_v1:  57%|#####7    | 1717/3000 [1:55:37<1:19:29,  3.72s/it, lr: 1.0e-04 loss: 4.929e-02]mindexpander_qwen_v1:  57%|#####7    | 1717/3000 [1:55:37<1:19:29,  3.72s/it, lr: 1.0e-04 loss: 4.929e-02]mindexpander_qwen_v1:  57%|#####7    | 1717/3000 [1:55:40<1:19:29,  3.72s/it, lr: 1.0e-04 loss: 1.770e-01]mindexpander_qwen_v1:  57%|#####7    | 1717/3000 [1:55:40<1:19:29,  3.72s/it, lr: 1.0e-04 loss: 1.770e-01]mindexpander_qwen_v1:  57%|#####7    | 1718/3000 [1:55:40<1:19:35,  3.73s/it, lr: 1.0e-04 loss: 1.770e-01]mindexpander_qwen_v1:  57%|#####7    | 1718/3000 [1:55:40<1:19:35,  3.73s/it, lr: 1.0e-04 loss: 1.770e-01]mindexpander_qwen_v1:  57%|#####7    | 1718/3000 [1:55:46<1:19:35,  3.73s/it, lr: 1.0e-04 loss: 3.665e-02]mindexpander_qwen_v1:  57%|#####7    | 1718/3000 [1:55:46<1:19:35,  3.73s/it, lr: 1.0e-04 loss: 3.665e-02]mindexpander_qwen_v1:  57%|#####7    | 1719/3000 [1:55:46<1:33:17,  4.37s/it, lr: 1.0e-04 loss: 3.665e-02]mindexpander_qwen_v1:  57%|#####7    | 1719/3000 [1:55:46<1:33:17,  4.37s/it, lr: 1.0e-04 loss: 3.665e-02]mindexpander_qwen_v1:  57%|#####7    | 1719/3000 [1:55:52<1:33:17,  4.37s/it, lr: 1.0e-04 loss: 9.414e-02]mindexpander_qwen_v1:  57%|#####7    | 1719/3000 [1:55:52<1:33:17,  4.37s/it, lr: 1.0e-04 loss: 9.414e-02]mindexpander_qwen_v1:  57%|#####7    | 1720/3000 [1:55:58<1:33:13,  4.37s/it, lr: 1.0e-04 loss: 1.103e-01]mindexpander_qwen_v1:  57%|#####7    | 1720/3000 [1:55:58<1:33:13,  4.37s/it, lr: 1.0e-04 loss: 1.103e-01]mindexpander_qwen_v1:  57%|#####7    | 1721/3000 [1:55:58<1:18:36,  3.69s/it, lr: 1.0e-04 loss: 1.103e-01]mindexpander_qwen_v1:  57%|#####7    | 1721/3000 [1:55:58<1:18:36,  3.69s/it, lr: 1.0e-04 loss: 1.103e-01]mindexpander_qwen_v1:  57%|#####7    | 1721/3000 [1:56:00<1:18:36,  3.69s/it, lr: 1.0e-04 loss: 1.566e-01]mindexpander_qwen_v1:  57%|#####7    | 1721/3000 [1:56:00<1:18:36,  3.69s/it, lr: 1.0e-04 loss: 1.566e-01]mindexpander_qwen_v1:  57%|#####7    | 1722/3000 [1:56:00<1:12:05,  3.38s/it, lr: 1.0e-04 loss: 1.566e-01]mindexpander_qwen_v1:  57%|#####7    | 1722/3000 [1:56:00<1:12:05,  3.38s/it, lr: 1.0e-04 loss: 1.566e-01]mindexpander_qwen_v1:  57%|#####7    | 1722/3000 [1:56:06<1:12:05,  3.38s/it, lr: 1.0e-04 loss: 1.505e-02]mindexpander_qwen_v1:  57%|#####7    | 1722/3000 [1:56:06<1:12:05,  3.38s/it, lr: 1.0e-04 loss: 1.505e-02]mindexpander_qwen_v1:  57%|#####7    | 1723/3000 [1:56:06<1:25:55,  4.04s/it, lr: 1.0e-04 loss: 1.505e-02]mindexpander_qwen_v1:  57%|#####7    | 1723/3000 [1:56:06<1:25:55,  4.04s/it, lr: 1.0e-04 loss: 1.505e-02]mindexpander_qwen_v1:  57%|#####7    | 1723/3000 [1:56:12<1:25:55,  4.04s/it, lr: 1.0e-04 loss: 1.242e-02]mindexpander_qwen_v1:  57%|#####7    | 1723/3000 [1:56:12<1:25:55,  4.04s/it, lr: 1.0e-04 loss: 1.242e-02]mindexpander_qwen_v1:  57%|#####7    | 1724/3000 [1:56:12<1:35:47,  4.50s/it, lr: 1.0e-04 loss: 1.242e-02]mindexpander_qwen_v1:  57%|#####7    | 1724/3000 [1:56:12<1:35:47,  4.50s/it, lr: 1.0e-04 loss: 1.242e-02]mindexpander_qwen_v1:  57%|#####7    | 1724/3000 [1:56:18<1:35:47,  4.50s/it, lr: 1.0e-04 loss: 1.470e-02]mindexpander_qwen_v1:  57%|#####7    | 1724/3000 [1:56:18<1:35:47,  4.50s/it, lr: 1.0e-04 loss: 1.470e-02]mindexpander_qwen_v1:  57%|#####7    | 1725/3000 [1:56:18<1:43:09,  4.85s/it, lr: 1.0e-04 loss: 1.470e-02]mindexpander_qwen_v1:  57%|#####7    | 1725/3000 [1:56:18<1:43:09,  4.85s/it, lr: 1.0e-04 loss: 1.470e-02]mindexpander_qwen_v1:  57%|#####7    | 1725/3000 [1:56:22<1:43:09,  4.85s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  57%|#####7    | 1725/3000 [1:56:22<1:43:09,  4.85s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  58%|#####7    | 1726/3000 [1:56:22<1:36:28,  4.54s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  58%|#####7    | 1726/3000 [1:56:22<1:36:28,  4.54s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  58%|#####7    | 1726/3000 [1:56:25<1:36:28,  4.54s/it, lr: 1.0e-04 loss: 5.462e-02]mindexpander_qwen_v1:  58%|#####7    | 1726/3000 [1:56:25<1:36:28,  4.54s/it, lr: 1.0e-04 loss: 5.462e-02]mindexpander_qwen_v1:  58%|#####7    | 1727/3000 [1:56:25<1:32:44,  4.37s/it, lr: 1.0e-04 loss: 5.462e-02]mindexpander_qwen_v1:  58%|#####7    | 1727/3000 [1:56:25<1:32:44,  4.37s/it, lr: 1.0e-04 loss: 5.462e-02]mindexpander_qwen_v1:  58%|#####7    | 1727/3000 [1:56:28<1:32:44,  4.37s/it, lr: 1.0e-04 loss: 1.143e-02]mindexpander_qwen_v1:  58%|#####7    | 1727/3000 [1:56:28<1:32:44,  4.37s/it, lr: 1.0e-04 loss: 1.143e-02]mindexpander_qwen_v1:  58%|#####7    | 1728/3000 [1:56:28<1:20:51,  3.81s/it, lr: 1.0e-04 loss: 1.143e-02]mindexpander_qwen_v1:  58%|#####7    | 1728/3000 [1:56:28<1:20:51,  3.81s/it, lr: 1.0e-04 loss: 1.143e-02]mindexpander_qwen_v1:  58%|#####7    | 1728/3000 [1:56:32<1:20:51,  3.81s/it, lr: 1.0e-04 loss: 1.230e-01]mindexpander_qwen_v1:  58%|#####7    | 1728/3000 [1:56:32<1:20:51,  3.81s/it, lr: 1.0e-04 loss: 1.230e-01]mindexpander_qwen_v1:  58%|#####7    | 1729/3000 [1:56:32<1:20:20,  3.79s/it, lr: 1.0e-04 loss: 1.230e-01]mindexpander_qwen_v1:  58%|#####7    | 1729/3000 [1:56:32<1:20:20,  3.79s/it, lr: 1.0e-04 loss: 1.230e-01]mindexpander_qwen_v1:  58%|#####7    | 1729/3000 [1:56:34<1:20:20,  3.79s/it, lr: 1.0e-04 loss: 5.369e-02]mindexpander_qwen_v1:  58%|#####7    | 1729/3000 [1:56:34<1:20:20,  3.79s/it, lr: 1.0e-04 loss: 5.369e-02]mindexpander_qwen_v1:  58%|#####7    | 1730/3000 [1:56:38<1:20:17,  3.79s/it, lr: 1.0e-04 loss: 7.790e-02]mindexpander_qwen_v1:  58%|#####7    | 1730/3000 [1:56:38<1:20:17,  3.79s/it, lr: 1.0e-04 loss: 7.790e-02]mindexpander_qwen_v1:  58%|#####7    | 1731/3000 [1:56:38<1:02:27,  2.95s/it, lr: 1.0e-04 loss: 7.790e-02]mindexpander_qwen_v1:  58%|#####7    | 1731/3000 [1:56:38<1:02:27,  2.95s/it, lr: 1.0e-04 loss: 7.790e-02]mindexpander_qwen_v1:  58%|#####7    | 1731/3000 [1:56:41<1:02:27,  2.95s/it, lr: 1.0e-04 loss: 5.234e-03]mindexpander_qwen_v1:  58%|#####7    | 1731/3000 [1:56:41<1:02:27,  2.95s/it, lr: 1.0e-04 loss: 5.234e-03]mindexpander_qwen_v1:  58%|#####7    | 1732/3000 [1:56:41<59:48,  2.83s/it, lr: 1.0e-04 loss: 5.234e-03]  mindexpander_qwen_v1:  58%|#####7    | 1732/3000 [1:56:41<59:48,  2.83s/it, lr: 1.0e-04 loss: 5.234e-03]  mindexpander_qwen_v1:  58%|#####7    | 1732/3000 [1:56:46<59:48,  2.83s/it, lr: 1.0e-04 loss: 1.154e-02]mindexpander_qwen_v1:  58%|#####7    | 1732/3000 [1:56:46<59:48,  2.83s/it, lr: 1.0e-04 loss: 1.154e-02]mindexpander_qwen_v1:  58%|#####7    | 1733/3000 [1:56:46<1:15:51,  3.59s/it, lr: 1.0e-04 loss: 1.154e-02]mindexpander_qwen_v1:  58%|#####7    | 1733/3000 [1:56:46<1:15:51,  3.59s/it, lr: 1.0e-04 loss: 1.154e-02]mindexpander_qwen_v1:  58%|#####7    | 1733/3000 [1:56:49<1:15:51,  3.59s/it, lr: 1.0e-04 loss: 1.483e-01]mindexpander_qwen_v1:  58%|#####7    | 1733/3000 [1:56:49<1:15:51,  3.59s/it, lr: 1.0e-04 loss: 1.483e-01]mindexpander_qwen_v1:  58%|#####7    | 1734/3000 [1:56:49<1:09:15,  3.28s/it, lr: 1.0e-04 loss: 1.483e-01]mindexpander_qwen_v1:  58%|#####7    | 1734/3000 [1:56:49<1:09:15,  3.28s/it, lr: 1.0e-04 loss: 1.483e-01]mindexpander_qwen_v1:  58%|#####7    | 1734/3000 [1:56:53<1:09:15,  3.28s/it, lr: 1.0e-04 loss: 4.080e-02]mindexpander_qwen_v1:  58%|#####7    | 1734/3000 [1:56:53<1:09:15,  3.28s/it, lr: 1.0e-04 loss: 4.080e-02]mindexpander_qwen_v1:  58%|#####7    | 1735/3000 [1:56:53<1:12:55,  3.46s/it, lr: 1.0e-04 loss: 4.080e-02]mindexpander_qwen_v1:  58%|#####7    | 1735/3000 [1:56:53<1:12:55,  3.46s/it, lr: 1.0e-04 loss: 4.080e-02]mindexpander_qwen_v1:  58%|#####7    | 1735/3000 [1:56:55<1:12:55,  3.46s/it, lr: 1.0e-04 loss: 2.583e-02]mindexpander_qwen_v1:  58%|#####7    | 1735/3000 [1:56:55<1:12:55,  3.46s/it, lr: 1.0e-04 loss: 2.583e-02]mindexpander_qwen_v1:  58%|#####7    | 1736/3000 [1:56:55<1:06:49,  3.17s/it, lr: 1.0e-04 loss: 2.583e-02]mindexpander_qwen_v1:  58%|#####7    | 1736/3000 [1:56:55<1:06:49,  3.17s/it, lr: 1.0e-04 loss: 2.583e-02]mindexpander_qwen_v1:  58%|#####7    | 1736/3000 [1:56:59<1:06:49,  3.17s/it, lr: 1.0e-04 loss: 9.879e-02]mindexpander_qwen_v1:  58%|#####7    | 1736/3000 [1:56:59<1:06:49,  3.17s/it, lr: 1.0e-04 loss: 9.879e-02]mindexpander_qwen_v1:  58%|#####7    | 1737/3000 [1:56:59<1:10:15,  3.34s/it, lr: 1.0e-04 loss: 9.879e-02]mindexpander_qwen_v1:  58%|#####7    | 1737/3000 [1:56:59<1:10:15,  3.34s/it, lr: 1.0e-04 loss: 9.879e-02]mindexpander_qwen_v1:  58%|#####7    | 1737/3000 [1:57:05<1:10:15,  3.34s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  58%|#####7    | 1737/3000 [1:57:05<1:10:15,  3.34s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  58%|#####7    | 1738/3000 [1:57:05<1:25:04,  4.05s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  58%|#####7    | 1738/3000 [1:57:05<1:25:04,  4.05s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  58%|#####7    | 1738/3000 [1:57:07<1:25:04,  4.05s/it, lr: 1.0e-04 loss: 6.291e-02]mindexpander_qwen_v1:  58%|#####7    | 1738/3000 [1:57:07<1:25:04,  4.05s/it, lr: 1.0e-04 loss: 6.291e-02]mindexpander_qwen_v1:  58%|#####7    | 1739/3000 [1:57:07<1:16:17,  3.63s/it, lr: 1.0e-04 loss: 6.291e-02]mindexpander_qwen_v1:  58%|#####7    | 1739/3000 [1:57:07<1:16:17,  3.63s/it, lr: 1.0e-04 loss: 6.291e-02]mindexpander_qwen_v1:  58%|#####7    | 1739/3000 [1:57:13<1:16:17,  3.63s/it, lr: 1.0e-04 loss: 1.240e-01]mindexpander_qwen_v1:  58%|#####7    | 1739/3000 [1:57:13<1:16:17,  3.63s/it, lr: 1.0e-04 loss: 1.240e-01]mindexpander_qwen_v1:  58%|#####8    | 1740/3000 [1:57:16<1:16:13,  3.63s/it, lr: 1.0e-04 loss: 2.358e-02]mindexpander_qwen_v1:  58%|#####8    | 1740/3000 [1:57:16<1:16:13,  3.63s/it, lr: 1.0e-04 loss: 2.358e-02]mindexpander_qwen_v1:  58%|#####8    | 1741/3000 [1:57:16<53:08,  2.53s/it, lr: 1.0e-04 loss: 2.358e-02]  mindexpander_qwen_v1:  58%|#####8    | 1741/3000 [1:57:16<53:08,  2.53s/it, lr: 1.0e-04 loss: 2.358e-02]  mindexpander_qwen_v1:  58%|#####8    | 1741/3000 [1:57:20<53:08,  2.53s/it, lr: 1.0e-04 loss: 1.177e-01]mindexpander_qwen_v1:  58%|#####8    | 1741/3000 [1:57:20<53:08,  2.53s/it, lr: 1.0e-04 loss: 1.177e-01]mindexpander_qwen_v1:  58%|#####8    | 1742/3000 [1:57:20<59:23,  2.83s/it, lr: 1.0e-04 loss: 1.177e-01]mindexpander_qwen_v1:  58%|#####8    | 1742/3000 [1:57:20<59:23,  2.83s/it, lr: 1.0e-04 loss: 1.177e-01]mindexpander_qwen_v1:  58%|#####8    | 1742/3000 [1:57:24<59:23,  2.83s/it, lr: 1.0e-04 loss: 1.749e-01]mindexpander_qwen_v1:  58%|#####8    | 1742/3000 [1:57:24<59:23,  2.83s/it, lr: 1.0e-04 loss: 1.749e-01]mindexpander_qwen_v1:  58%|#####8    | 1743/3000 [1:57:24<1:05:39,  3.13s/it, lr: 1.0e-04 loss: 1.749e-01]mindexpander_qwen_v1:  58%|#####8    | 1743/3000 [1:57:24<1:05:39,  3.13s/it, lr: 1.0e-04 loss: 1.749e-01]mindexpander_qwen_v1:  58%|#####8    | 1743/3000 [1:57:27<1:05:39,  3.13s/it, lr: 1.0e-04 loss: 1.752e-01]mindexpander_qwen_v1:  58%|#####8    | 1743/3000 [1:57:27<1:05:39,  3.13s/it, lr: 1.0e-04 loss: 1.752e-01]mindexpander_qwen_v1:  58%|#####8    | 1744/3000 [1:57:27<1:09:04,  3.30s/it, lr: 1.0e-04 loss: 1.752e-01]mindexpander_qwen_v1:  58%|#####8    | 1744/3000 [1:57:27<1:09:04,  3.30s/it, lr: 1.0e-04 loss: 1.752e-01]mindexpander_qwen_v1:  58%|#####8    | 1744/3000 [1:57:30<1:09:04,  3.30s/it, lr: 1.0e-04 loss: 3.526e-02]mindexpander_qwen_v1:  58%|#####8    | 1744/3000 [1:57:30<1:09:04,  3.30s/it, lr: 1.0e-04 loss: 3.526e-02]mindexpander_qwen_v1:  58%|#####8    | 1745/3000 [1:57:30<1:04:03,  3.06s/it, lr: 1.0e-04 loss: 3.526e-02]mindexpander_qwen_v1:  58%|#####8    | 1745/3000 [1:57:30<1:04:03,  3.06s/it, lr: 1.0e-04 loss: 3.526e-02]mindexpander_qwen_v1:  58%|#####8    | 1745/3000 [1:57:35<1:04:03,  3.06s/it, lr: 1.0e-04 loss: 2.221e-02]mindexpander_qwen_v1:  58%|#####8    | 1745/3000 [1:57:35<1:04:03,  3.06s/it, lr: 1.0e-04 loss: 2.221e-02]mindexpander_qwen_v1:  58%|#####8    | 1746/3000 [1:57:35<1:19:59,  3.83s/it, lr: 1.0e-04 loss: 2.221e-02]mindexpander_qwen_v1:  58%|#####8    | 1746/3000 [1:57:35<1:19:59,  3.83s/it, lr: 1.0e-04 loss: 2.221e-02]mindexpander_qwen_v1:  58%|#####8    | 1746/3000 [1:57:39<1:19:59,  3.83s/it, lr: 1.0e-04 loss: 9.148e-02]mindexpander_qwen_v1:  58%|#####8    | 1746/3000 [1:57:39<1:19:59,  3.83s/it, lr: 1.0e-04 loss: 9.148e-02]mindexpander_qwen_v1:  58%|#####8    | 1747/3000 [1:57:39<1:20:25,  3.85s/it, lr: 1.0e-04 loss: 9.148e-02]mindexpander_qwen_v1:  58%|#####8    | 1747/3000 [1:57:39<1:20:25,  3.85s/it, lr: 1.0e-04 loss: 9.148e-02]mindexpander_qwen_v1:  58%|#####8    | 1747/3000 [1:57:43<1:20:25,  3.85s/it, lr: 1.0e-04 loss: 1.088e-01]mindexpander_qwen_v1:  58%|#####8    | 1747/3000 [1:57:43<1:20:25,  3.85s/it, lr: 1.0e-04 loss: 1.088e-01]mindexpander_qwen_v1:  58%|#####8    | 1748/3000 [1:57:43<1:19:40,  3.82s/it, lr: 1.0e-04 loss: 1.088e-01]mindexpander_qwen_v1:  58%|#####8    | 1748/3000 [1:57:43<1:19:40,  3.82s/it, lr: 1.0e-04 loss: 1.088e-01]mindexpander_qwen_v1:  58%|#####8    | 1748/3000 [1:57:47<1:19:40,  3.82s/it, lr: 1.0e-04 loss: 1.807e-01]mindexpander_qwen_v1:  58%|#####8    | 1748/3000 [1:57:47<1:19:40,  3.82s/it, lr: 1.0e-04 loss: 1.807e-01]mindexpander_qwen_v1:  58%|#####8    | 1749/3000 [1:57:47<1:19:10,  3.80s/it, lr: 1.0e-04 loss: 1.807e-01]mindexpander_qwen_v1:  58%|#####8    | 1749/3000 [1:57:47<1:19:10,  3.80s/it, lr: 1.0e-04 loss: 1.807e-01]mindexpander_qwen_v1:  58%|#####8    | 1749/3000 [1:57:51<1:19:10,  3.80s/it, lr: 1.0e-04 loss: 1.514e-01]mindexpander_qwen_v1:  58%|#####8    | 1749/3000 [1:57:51<1:19:10,  3.80s/it, lr: 1.0e-04 loss: 1.514e-01]
+Saving at step 1750
+Saved checkpoint to /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000001750.safetensors
+Saved optimizer to /app/ai-toolkit/output/mindexpander_qwen_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000000750.safetensors
+
+
+Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:   0%|          | 0/2 [00:00<?, ?it/s][A[A
+
+Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.64s/it]Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.64s/it][A[A
+
+Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.82s/it]Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.82s/it][A[A
+
+                                                                                                                                [A[Amindexpander_qwen_v1:  58%|#####8    | 1750/3000 [1:57:55<1:19:06,  3.80s/it, lr: 1.0e-04 loss: 2.760e-03]mindexpander_qwen_v1:  58%|#####8    | 1750/3000 [1:57:55<1:19:06,  3.80s/it, lr: 1.0e-04 loss: 2.760e-03]mindexpander_qwen_v1:  58%|#####8    | 1751/3000 [1:57:55<1:01:35,  2.96s/it, lr: 1.0e-04 loss: 2.760e-03]mindexpander_qwen_v1:  58%|#####8    | 1751/3000 [1:57:55<1:01:35,  2.96s/it, lr: 1.0e-04 loss: 2.760e-03]mindexpander_qwen_v1:  58%|#####8    | 1751/3000 [1:57:57<1:01:35,  2.96s/it, lr: 1.0e-04 loss: 4.747e-02]mindexpander_qwen_v1:  58%|#####8    | 1751/3000 [1:57:57<1:01:35,  2.96s/it, lr: 1.0e-04 loss: 4.747e-02]mindexpander_qwen_v1:  58%|#####8    | 1752/3000 [1:57:57<58:53,  2.83s/it, lr: 1.0e-04 loss: 4.747e-02]  mindexpander_qwen_v1:  58%|#####8    | 1752/3000 [1:57:57<58:53,  2.83s/it, lr: 1.0e-04 loss: 4.747e-02]  mindexpander_qwen_v1:  58%|#####8    | 1752/3000 [1:58:01<58:53,  2.83s/it, lr: 1.0e-04 loss: 4.069e-02]mindexpander_qwen_v1:  58%|#####8    | 1752/3000 [1:58:01<58:53,  2.83s/it, lr: 1.0e-04 loss: 4.069e-02]mindexpander_qwen_v1:  58%|#####8    | 1753/3000 [1:58:01<1:03:42,  3.06s/it, lr: 1.0e-04 loss: 4.069e-02]mindexpander_qwen_v1:  58%|#####8    | 1753/3000 [1:58:01<1:03:42,  3.06s/it, lr: 1.0e-04 loss: 4.069e-02]mindexpander_qwen_v1:  58%|#####8    | 1753/3000 [1:58:03<1:03:42,  3.06s/it, lr: 1.0e-04 loss: 3.758e-02]mindexpander_qwen_v1:  58%|#####8    | 1753/3000 [1:58:03<1:03:42,  3.06s/it, lr: 1.0e-04 loss: 3.758e-02]mindexpander_qwen_v1:  58%|#####8    | 1754/3000 [1:58:03<1:01:11,  2.95s/it, lr: 1.0e-04 loss: 3.758e-02]mindexpander_qwen_v1:  58%|#####8    | 1754/3000 [1:58:03<1:01:11,  2.95s/it, lr: 1.0e-04 loss: 3.758e-02]mindexpander_qwen_v1:  58%|#####8    | 1754/3000 [1:58:09<1:01:11,  2.95s/it, lr: 1.0e-04 loss: 5.225e-02]mindexpander_qwen_v1:  58%|#####8    | 1754/3000 [1:58:09<1:01:11,  2.95s/it, lr: 1.0e-04 loss: 5.225e-02]mindexpander_qwen_v1:  58%|#####8    | 1755/3000 [1:58:09<1:17:18,  3.73s/it, lr: 1.0e-04 loss: 5.225e-02]mindexpander_qwen_v1:  58%|#####8    | 1755/3000 [1:58:09<1:17:18,  3.73s/it, lr: 1.0e-04 loss: 5.225e-02]mindexpander_qwen_v1:  58%|#####8    | 1755/3000 [1:58:13<1:17:18,  3.73s/it, lr: 1.0e-04 loss: 9.613e-03]mindexpander_qwen_v1:  58%|#####8    | 1755/3000 [1:58:13<1:17:18,  3.73s/it, lr: 1.0e-04 loss: 9.613e-03]mindexpander_qwen_v1:  59%|#####8    | 1756/3000 [1:58:13<1:17:15,  3.73s/it, lr: 1.0e-04 loss: 9.613e-03]mindexpander_qwen_v1:  59%|#####8    | 1756/3000 [1:58:13<1:17:15,  3.73s/it, lr: 1.0e-04 loss: 9.613e-03]mindexpander_qwen_v1:  59%|#####8    | 1756/3000 [1:58:15<1:17:15,  3.73s/it, lr: 1.0e-04 loss: 5.216e-02]mindexpander_qwen_v1:  59%|#####8    | 1756/3000 [1:58:15<1:17:15,  3.73s/it, lr: 1.0e-04 loss: 5.216e-02]mindexpander_qwen_v1:  59%|#####8    | 1757/3000 [1:58:15<1:09:31,  3.36s/it, lr: 1.0e-04 loss: 5.216e-02]mindexpander_qwen_v1:  59%|#####8    | 1757/3000 [1:58:15<1:09:31,  3.36s/it, lr: 1.0e-04 loss: 5.216e-02]mindexpander_qwen_v1:  59%|#####8    | 1757/3000 [1:58:18<1:09:31,  3.36s/it, lr: 1.0e-04 loss: 9.347e-02]mindexpander_qwen_v1:  59%|#####8    | 1757/3000 [1:58:18<1:09:31,  3.36s/it, lr: 1.0e-04 loss: 9.347e-02]mindexpander_qwen_v1:  59%|#####8    | 1758/3000 [1:58:18<1:05:00,  3.14s/it, lr: 1.0e-04 loss: 9.347e-02]mindexpander_qwen_v1:  59%|#####8    | 1758/3000 [1:58:18<1:05:00,  3.14s/it, lr: 1.0e-04 loss: 9.347e-02]mindexpander_qwen_v1:  59%|#####8    | 1758/3000 [1:58:24<1:05:00,  3.14s/it, lr: 1.0e-04 loss: 1.681e-01]mindexpander_qwen_v1:  59%|#####8    | 1758/3000 [1:58:24<1:05:00,  3.14s/it, lr: 1.0e-04 loss: 1.681e-01]mindexpander_qwen_v1:  59%|#####8    | 1759/3000 [1:58:24<1:20:48,  3.91s/it, lr: 1.0e-04 loss: 1.681e-01]mindexpander_qwen_v1:  59%|#####8    | 1759/3000 [1:58:24<1:20:48,  3.91s/it, lr: 1.0e-04 loss: 1.681e-01]mindexpander_qwen_v1:  59%|#####8    | 1759/3000 [1:58:29<1:20:48,  3.91s/it, lr: 1.0e-04 loss: 5.541e-02]mindexpander_qwen_v1:  59%|#####8    | 1759/3000 [1:58:29<1:20:48,  3.91s/it, lr: 1.0e-04 loss: 5.541e-02]mindexpander_qwen_v1:  59%|#####8    | 1760/3000 [1:58:35<1:20:45,  3.91s/it, lr: 1.0e-04 loss: 4.407e-02]mindexpander_qwen_v1:  59%|#####8    | 1760/3000 [1:58:35<1:20:45,  3.91s/it, lr: 1.0e-04 loss: 4.407e-02]mindexpander_qwen_v1:  59%|#####8    | 1761/3000 [1:58:35<1:10:57,  3.44s/it, lr: 1.0e-04 loss: 4.407e-02]mindexpander_qwen_v1:  59%|#####8    | 1761/3000 [1:58:35<1:10:57,  3.44s/it, lr: 1.0e-04 loss: 4.407e-02]mindexpander_qwen_v1:  59%|#####8    | 1761/3000 [1:58:41<1:10:57,  3.44s/it, lr: 1.0e-04 loss: 4.979e-02]mindexpander_qwen_v1:  59%|#####8    | 1761/3000 [1:58:41<1:10:57,  3.44s/it, lr: 1.0e-04 loss: 4.979e-02]mindexpander_qwen_v1:  59%|#####8    | 1762/3000 [1:58:41<1:23:22,  4.04s/it, lr: 1.0e-04 loss: 4.979e-02]mindexpander_qwen_v1:  59%|#####8    | 1762/3000 [1:58:41<1:23:22,  4.04s/it, lr: 1.0e-04 loss: 4.979e-02]mindexpander_qwen_v1:  59%|#####8    | 1762/3000 [1:58:43<1:23:22,  4.04s/it, lr: 1.0e-04 loss: 1.051e-01]mindexpander_qwen_v1:  59%|#####8    | 1762/3000 [1:58:43<1:23:22,  4.04s/it, lr: 1.0e-04 loss: 1.051e-01]mindexpander_qwen_v1:  59%|#####8    | 1763/3000 [1:58:43<1:14:45,  3.63s/it, lr: 1.0e-04 loss: 1.051e-01]mindexpander_qwen_v1:  59%|#####8    | 1763/3000 [1:58:43<1:14:45,  3.63s/it, lr: 1.0e-04 loss: 1.051e-01]mindexpander_qwen_v1:  59%|#####8    | 1763/3000 [1:58:46<1:14:45,  3.63s/it, lr: 1.0e-04 loss: 1.544e-01]mindexpander_qwen_v1:  59%|#####8    | 1763/3000 [1:58:46<1:14:45,  3.63s/it, lr: 1.0e-04 loss: 1.544e-01]mindexpander_qwen_v1:  59%|#####8    | 1764/3000 [1:58:46<1:08:07,  3.31s/it, lr: 1.0e-04 loss: 1.544e-01]mindexpander_qwen_v1:  59%|#####8    | 1764/3000 [1:58:46<1:08:07,  3.31s/it, lr: 1.0e-04 loss: 1.544e-01]mindexpander_qwen_v1:  59%|#####8    | 1764/3000 [1:58:48<1:08:07,  3.31s/it, lr: 1.0e-04 loss: 1.041e-01]mindexpander_qwen_v1:  59%|#####8    | 1764/3000 [1:58:48<1:08:07,  3.31s/it, lr: 1.0e-04 loss: 1.041e-01]mindexpander_qwen_v1:  59%|#####8    | 1765/3000 [1:58:48<1:03:06,  3.07s/it, lr: 1.0e-04 loss: 1.041e-01]mindexpander_qwen_v1:  59%|#####8    | 1765/3000 [1:58:48<1:03:06,  3.07s/it, lr: 1.0e-04 loss: 1.041e-01]mindexpander_qwen_v1:  59%|#####8    | 1765/3000 [1:58:51<1:03:06,  3.07s/it, lr: 1.0e-04 loss: 1.564e-01]mindexpander_qwen_v1:  59%|#####8    | 1765/3000 [1:58:51<1:03:06,  3.07s/it, lr: 1.0e-04 loss: 1.564e-01]mindexpander_qwen_v1:  59%|#####8    | 1766/3000 [1:58:51<1:00:34,  2.95s/it, lr: 1.0e-04 loss: 1.564e-01]mindexpander_qwen_v1:  59%|#####8    | 1766/3000 [1:58:51<1:00:34,  2.95s/it, lr: 1.0e-04 loss: 1.564e-01]mindexpander_qwen_v1:  59%|#####8    | 1766/3000 [1:58:57<1:00:34,  2.95s/it, lr: 1.0e-04 loss: 1.559e-01]mindexpander_qwen_v1:  59%|#####8    | 1766/3000 [1:58:57<1:00:34,  2.95s/it, lr: 1.0e-04 loss: 1.559e-01]mindexpander_qwen_v1:  59%|#####8    | 1767/3000 [1:58:57<1:17:11,  3.76s/it, lr: 1.0e-04 loss: 1.559e-01]mindexpander_qwen_v1:  59%|#####8    | 1767/3000 [1:58:57<1:17:11,  3.76s/it, lr: 1.0e-04 loss: 1.559e-01]mindexpander_qwen_v1:  59%|#####8    | 1767/3000 [1:59:02<1:17:11,  3.76s/it, lr: 1.0e-04 loss: 1.859e-01]mindexpander_qwen_v1:  59%|#####8    | 1767/3000 [1:59:02<1:17:11,  3.76s/it, lr: 1.0e-04 loss: 1.859e-01]mindexpander_qwen_v1:  59%|#####8    | 1768/3000 [1:59:02<1:29:09,  4.34s/it, lr: 1.0e-04 loss: 1.859e-01]mindexpander_qwen_v1:  59%|#####8    | 1768/3000 [1:59:02<1:29:09,  4.34s/it, lr: 1.0e-04 loss: 1.859e-01]mindexpander_qwen_v1:  59%|#####8    | 1768/3000 [1:59:08<1:29:09,  4.34s/it, lr: 1.0e-04 loss: 2.998e-02]mindexpander_qwen_v1:  59%|#####8    | 1768/3000 [1:59:08<1:29:09,  4.34s/it, lr: 1.0e-04 loss: 2.998e-02]mindexpander_qwen_v1:  59%|#####8    | 1769/3000 [1:59:08<1:37:39,  4.76s/it, lr: 1.0e-04 loss: 2.998e-02]mindexpander_qwen_v1:  59%|#####8    | 1769/3000 [1:59:08<1:37:39,  4.76s/it, lr: 1.0e-04 loss: 2.998e-02]mindexpander_qwen_v1:  59%|#####8    | 1769/3000 [1:59:15<1:37:39,  4.76s/it, lr: 1.0e-04 loss: 3.525e-02]mindexpander_qwen_v1:  59%|#####8    | 1769/3000 [1:59:15<1:37:39,  4.76s/it, lr: 1.0e-04 loss: 3.525e-02]mindexpander_qwen_v1:  59%|#####8    | 1770/3000 [1:59:18<1:37:34,  4.76s/it, lr: 1.0e-04 loss: 5.850e-02]mindexpander_qwen_v1:  59%|#####8    | 1770/3000 [1:59:18<1:37:34,  4.76s/it, lr: 1.0e-04 loss: 5.850e-02]mindexpander_qwen_v1:  59%|#####9    | 1771/3000 [1:59:18<1:10:31,  3.44s/it, lr: 1.0e-04 loss: 5.850e-02]mindexpander_qwen_v1:  59%|#####9    | 1771/3000 [1:59:18<1:10:31,  3.44s/it, lr: 1.0e-04 loss: 5.850e-02]mindexpander_qwen_v1:  59%|#####9    | 1771/3000 [1:59:24<1:10:31,  3.44s/it, lr: 1.0e-04 loss: 1.241e-01]mindexpander_qwen_v1:  59%|#####9    | 1771/3000 [1:59:24<1:10:31,  3.44s/it, lr: 1.0e-04 loss: 1.241e-01]mindexpander_qwen_v1:  59%|#####9    | 1772/3000 [1:59:24<1:22:09,  4.01s/it, lr: 1.0e-04 loss: 1.241e-01]mindexpander_qwen_v1:  59%|#####9    | 1772/3000 [1:59:24<1:22:09,  4.01s/it, lr: 1.0e-04 loss: 1.241e-01]mindexpander_qwen_v1:  59%|#####9    | 1772/3000 [1:59:30<1:22:09,  4.01s/it, lr: 1.0e-04 loss: 7.490e-02]mindexpander_qwen_v1:  59%|#####9    | 1772/3000 [1:59:30<1:22:09,  4.01s/it, lr: 1.0e-04 loss: 7.490e-02]mindexpander_qwen_v1:  59%|#####9    | 1773/3000 [1:59:30<1:31:23,  4.47s/it, lr: 1.0e-04 loss: 7.490e-02]mindexpander_qwen_v1:  59%|#####9    | 1773/3000 [1:59:30<1:31:23,  4.47s/it, lr: 1.0e-04 loss: 7.490e-02]mindexpander_qwen_v1:  59%|#####9    | 1773/3000 [1:59:34<1:31:23,  4.47s/it, lr: 1.0e-04 loss: 1.742e-01]mindexpander_qwen_v1:  59%|#####9    | 1773/3000 [1:59:34<1:31:23,  4.47s/it, lr: 1.0e-04 loss: 1.742e-01]mindexpander_qwen_v1:  59%|#####9    | 1774/3000 [1:59:34<1:28:14,  4.32s/it, lr: 1.0e-04 loss: 1.742e-01]mindexpander_qwen_v1:  59%|#####9    | 1774/3000 [1:59:34<1:28:14,  4.32s/it, lr: 1.0e-04 loss: 1.742e-01]mindexpander_qwen_v1:  59%|#####9    | 1774/3000 [1:59:36<1:28:14,  4.32s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  59%|#####9    | 1774/3000 [1:59:36<1:28:14,  4.32s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  59%|#####9    | 1775/3000 [1:59:36<1:17:36,  3.80s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  59%|#####9    | 1775/3000 [1:59:36<1:17:36,  3.80s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  59%|#####9    | 1775/3000 [1:59:40<1:17:36,  3.80s/it, lr: 1.0e-04 loss: 8.973e-02]mindexpander_qwen_v1:  59%|#####9    | 1775/3000 [1:59:40<1:17:36,  3.80s/it, lr: 1.0e-04 loss: 8.973e-02]mindexpander_qwen_v1:  59%|#####9    | 1776/3000 [1:59:40<1:17:13,  3.79s/it, lr: 1.0e-04 loss: 8.973e-02]mindexpander_qwen_v1:  59%|#####9    | 1776/3000 [1:59:40<1:17:13,  3.79s/it, lr: 1.0e-04 loss: 8.973e-02]mindexpander_qwen_v1:  59%|#####9    | 1776/3000 [1:59:44<1:17:13,  3.79s/it, lr: 1.0e-04 loss: 8.376e-02]mindexpander_qwen_v1:  59%|#####9    | 1776/3000 [1:59:44<1:17:13,  3.79s/it, lr: 1.0e-04 loss: 8.376e-02]mindexpander_qwen_v1:  59%|#####9    | 1777/3000 [1:59:44<1:16:52,  3.77s/it, lr: 1.0e-04 loss: 8.376e-02]mindexpander_qwen_v1:  59%|#####9    | 1777/3000 [1:59:44<1:16:52,  3.77s/it, lr: 1.0e-04 loss: 8.376e-02]mindexpander_qwen_v1:  59%|#####9    | 1777/3000 [1:59:46<1:16:52,  3.77s/it, lr: 1.0e-04 loss: 1.406e-01]mindexpander_qwen_v1:  59%|#####9    | 1777/3000 [1:59:46<1:16:52,  3.77s/it, lr: 1.0e-04 loss: 1.406e-01]mindexpander_qwen_v1:  59%|#####9    | 1778/3000 [1:59:46<1:10:00,  3.44s/it, lr: 1.0e-04 loss: 1.406e-01]mindexpander_qwen_v1:  59%|#####9    | 1778/3000 [1:59:46<1:10:00,  3.44s/it, lr: 1.0e-04 loss: 1.406e-01]mindexpander_qwen_v1:  59%|#####9    | 1778/3000 [1:59:50<1:10:00,  3.44s/it, lr: 1.0e-04 loss: 1.288e-04]mindexpander_qwen_v1:  59%|#####9    | 1778/3000 [1:59:50<1:10:00,  3.44s/it, lr: 1.0e-04 loss: 1.288e-04]mindexpander_qwen_v1:  59%|#####9    | 1779/3000 [1:59:50<1:11:44,  3.53s/it, lr: 1.0e-04 loss: 1.288e-04]mindexpander_qwen_v1:  59%|#####9    | 1779/3000 [1:59:50<1:11:44,  3.53s/it, lr: 1.0e-04 loss: 1.288e-04]mindexpander_qwen_v1:  59%|#####9    | 1779/3000 [1:59:56<1:11:44,  3.53s/it, lr: 1.0e-04 loss: 4.458e-02]mindexpander_qwen_v1:  59%|#####9    | 1779/3000 [1:59:56<1:11:44,  3.53s/it, lr: 1.0e-04 loss: 4.458e-02]mindexpander_qwen_v1:  59%|#####9    | 1780/3000 [1:59:58<1:11:40,  3.53s/it, lr: 1.0e-04 loss: 7.356e-02]mindexpander_qwen_v1:  59%|#####9    | 1780/3000 [1:59:58<1:11:40,  3.53s/it, lr: 1.0e-04 loss: 7.356e-02]mindexpander_qwen_v1:  59%|#####9    | 1781/3000 [1:59:58<50:16,  2.47s/it, lr: 1.0e-04 loss: 7.356e-02]  mindexpander_qwen_v1:  59%|#####9    | 1781/3000 [1:59:58<50:16,  2.47s/it, lr: 1.0e-04 loss: 7.356e-02]  mindexpander_qwen_v1:  59%|#####9    | 1781/3000 [2:00:01<50:16,  2.47s/it, lr: 1.0e-04 loss: 1.443e-01]mindexpander_qwen_v1:  59%|#####9    | 1781/3000 [2:00:01<50:16,  2.47s/it, lr: 1.0e-04 loss: 1.443e-01]mindexpander_qwen_v1:  59%|#####9    | 1782/3000 [2:00:01<50:58,  2.51s/it, lr: 1.0e-04 loss: 1.443e-01]mindexpander_qwen_v1:  59%|#####9    | 1782/3000 [2:00:01<50:58,  2.51s/it, lr: 1.0e-04 loss: 1.443e-01]mindexpander_qwen_v1:  59%|#####9    | 1782/3000 [2:00:07<50:58,  2.51s/it, lr: 1.0e-04 loss: 1.827e-01]mindexpander_qwen_v1:  59%|#####9    | 1782/3000 [2:00:07<50:58,  2.51s/it, lr: 1.0e-04 loss: 1.827e-01]mindexpander_qwen_v1:  59%|#####9    | 1783/3000 [2:00:07<1:08:03,  3.36s/it, lr: 1.0e-04 loss: 1.827e-01]mindexpander_qwen_v1:  59%|#####9    | 1783/3000 [2:00:07<1:08:03,  3.36s/it, lr: 1.0e-04 loss: 1.827e-01]mindexpander_qwen_v1:  59%|#####9    | 1783/3000 [2:00:10<1:08:03,  3.36s/it, lr: 1.0e-04 loss: 1.774e-01]mindexpander_qwen_v1:  59%|#####9    | 1783/3000 [2:00:10<1:08:03,  3.36s/it, lr: 1.0e-04 loss: 1.774e-01]mindexpander_qwen_v1:  59%|#####9    | 1784/3000 [2:00:10<1:10:08,  3.46s/it, lr: 1.0e-04 loss: 1.774e-01]mindexpander_qwen_v1:  59%|#####9    | 1784/3000 [2:00:10<1:10:08,  3.46s/it, lr: 1.0e-04 loss: 1.774e-01]mindexpander_qwen_v1:  59%|#####9    | 1784/3000 [2:00:14<1:10:08,  3.46s/it, lr: 1.0e-04 loss: 1.671e-01]mindexpander_qwen_v1:  59%|#####9    | 1784/3000 [2:00:14<1:10:08,  3.46s/it, lr: 1.0e-04 loss: 1.671e-01]mindexpander_qwen_v1:  60%|#####9    | 1785/3000 [2:00:14<1:11:40,  3.54s/it, lr: 1.0e-04 loss: 1.671e-01]mindexpander_qwen_v1:  60%|#####9    | 1785/3000 [2:00:14<1:11:40,  3.54s/it, lr: 1.0e-04 loss: 1.671e-01]mindexpander_qwen_v1:  60%|#####9    | 1785/3000 [2:00:20<1:11:40,  3.54s/it, lr: 1.0e-04 loss: 8.774e-02]mindexpander_qwen_v1:  60%|#####9    | 1785/3000 [2:00:20<1:11:40,  3.54s/it, lr: 1.0e-04 loss: 8.774e-02]mindexpander_qwen_v1:  60%|#####9    | 1786/3000 [2:00:20<1:25:06,  4.21s/it, lr: 1.0e-04 loss: 8.774e-02]mindexpander_qwen_v1:  60%|#####9    | 1786/3000 [2:00:20<1:25:06,  4.21s/it, lr: 1.0e-04 loss: 8.774e-02]mindexpander_qwen_v1:  60%|#####9    | 1786/3000 [2:00:24<1:25:06,  4.21s/it, lr: 1.0e-04 loss: 1.812e-02]mindexpander_qwen_v1:  60%|#####9    | 1786/3000 [2:00:24<1:25:06,  4.21s/it, lr: 1.0e-04 loss: 1.812e-02]mindexpander_qwen_v1:  60%|#####9    | 1787/3000 [2:00:24<1:22:21,  4.07s/it, lr: 1.0e-04 loss: 1.812e-02]mindexpander_qwen_v1:  60%|#####9    | 1787/3000 [2:00:24<1:22:21,  4.07s/it, lr: 1.0e-04 loss: 1.812e-02]mindexpander_qwen_v1:  60%|#####9    | 1787/3000 [2:00:28<1:22:21,  4.07s/it, lr: 1.0e-04 loss: 6.255e-02]mindexpander_qwen_v1:  60%|#####9    | 1787/3000 [2:00:28<1:22:21,  4.07s/it, lr: 1.0e-04 loss: 6.255e-02]mindexpander_qwen_v1:  60%|#####9    | 1788/3000 [2:00:28<1:20:19,  3.98s/it, lr: 1.0e-04 loss: 6.255e-02]mindexpander_qwen_v1:  60%|#####9    | 1788/3000 [2:00:28<1:20:19,  3.98s/it, lr: 1.0e-04 loss: 6.255e-02]mindexpander_qwen_v1:  60%|#####9    | 1788/3000 [2:00:33<1:20:19,  3.98s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  60%|#####9    | 1788/3000 [2:00:33<1:20:19,  3.98s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  60%|#####9    | 1789/3000 [2:00:33<1:31:08,  4.52s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  60%|#####9    | 1789/3000 [2:00:33<1:31:08,  4.52s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  60%|#####9    | 1789/3000 [2:00:37<1:31:08,  4.52s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  60%|#####9    | 1789/3000 [2:00:37<1:31:08,  4.52s/it, lr: 1.0e-04 loss: 1.783e-01]mindexpander_qwen_v1:  60%|#####9    | 1790/3000 [2:00:43<1:31:04,  4.52s/it, lr: 1.0e-04 loss: 4.336e-02]mindexpander_qwen_v1:  60%|#####9    | 1790/3000 [2:00:43<1:31:04,  4.52s/it, lr: 1.0e-04 loss: 4.336e-02]mindexpander_qwen_v1:  60%|#####9    | 1791/3000 [2:00:43<1:15:56,  3.77s/it, lr: 1.0e-04 loss: 4.336e-02]mindexpander_qwen_v1:  60%|#####9    | 1791/3000 [2:00:43<1:15:56,  3.77s/it, lr: 1.0e-04 loss: 4.336e-02]mindexpander_qwen_v1:  60%|#####9    | 1791/3000 [2:00:45<1:15:56,  3.77s/it, lr: 1.0e-04 loss: 1.431e-01]mindexpander_qwen_v1:  60%|#####9    | 1791/3000 [2:00:45<1:15:56,  3.77s/it, lr: 1.0e-04 loss: 1.431e-01]mindexpander_qwen_v1:  60%|#####9    | 1792/3000 [2:00:45<1:09:21,  3.44s/it, lr: 1.0e-04 loss: 1.431e-01]mindexpander_qwen_v1:  60%|#####9    | 1792/3000 [2:00:45<1:09:21,  3.44s/it, lr: 1.0e-04 loss: 1.431e-01]mindexpander_qwen_v1:  60%|#####9    | 1792/3000 [2:00:48<1:09:21,  3.44s/it, lr: 1.0e-04 loss: 1.148e-01]mindexpander_qwen_v1:  60%|#####9    | 1792/3000 [2:00:48<1:09:21,  3.44s/it, lr: 1.0e-04 loss: 1.148e-01]mindexpander_qwen_v1:  60%|#####9    | 1793/3000 [2:00:48<1:04:06,  3.19s/it, lr: 1.0e-04 loss: 1.148e-01]mindexpander_qwen_v1:  60%|#####9    | 1793/3000 [2:00:48<1:04:06,  3.19s/it, lr: 1.0e-04 loss: 1.148e-01]mindexpander_qwen_v1:  60%|#####9    | 1793/3000 [2:00:54<1:04:06,  3.19s/it, lr: 1.0e-04 loss: 1.517e-01]mindexpander_qwen_v1:  60%|#####9    | 1793/3000 [2:00:54<1:04:06,  3.19s/it, lr: 1.0e-04 loss: 1.517e-01]mindexpander_qwen_v1:  60%|#####9    | 1794/3000 [2:00:54<1:18:43,  3.92s/it, lr: 1.0e-04 loss: 1.517e-01]mindexpander_qwen_v1:  60%|#####9    | 1794/3000 [2:00:54<1:18:43,  3.92s/it, lr: 1.0e-04 loss: 1.517e-01]mindexpander_qwen_v1:  60%|#####9    | 1794/3000 [2:00:56<1:18:43,  3.92s/it, lr: 1.0e-04 loss: 6.718e-02]mindexpander_qwen_v1:  60%|#####9    | 1794/3000 [2:00:56<1:18:43,  3.92s/it, lr: 1.0e-04 loss: 6.718e-02]mindexpander_qwen_v1:  60%|#####9    | 1795/3000 [2:00:56<1:10:26,  3.51s/it, lr: 1.0e-04 loss: 6.718e-02]mindexpander_qwen_v1:  60%|#####9    | 1795/3000 [2:00:56<1:10:26,  3.51s/it, lr: 1.0e-04 loss: 6.718e-02]mindexpander_qwen_v1:  60%|#####9    | 1795/3000 [2:00:59<1:10:26,  3.51s/it, lr: 1.0e-04 loss: 5.178e-02]mindexpander_qwen_v1:  60%|#####9    | 1795/3000 [2:00:59<1:10:26,  3.51s/it, lr: 1.0e-04 loss: 5.178e-02]mindexpander_qwen_v1:  60%|#####9    | 1796/3000 [2:00:59<1:04:19,  3.21s/it, lr: 1.0e-04 loss: 5.178e-02]mindexpander_qwen_v1:  60%|#####9    | 1796/3000 [2:00:59<1:04:19,  3.21s/it, lr: 1.0e-04 loss: 5.178e-02]mindexpander_qwen_v1:  60%|#####9    | 1796/3000 [2:01:01<1:04:19,  3.21s/it, lr: 1.0e-04 loss: 5.362e-02]mindexpander_qwen_v1:  60%|#####9    | 1796/3000 [2:01:01<1:04:19,  3.21s/it, lr: 1.0e-04 loss: 5.362e-02]mindexpander_qwen_v1:  60%|#####9    | 1797/3000 [2:01:01<59:53,  2.99s/it, lr: 1.0e-04 loss: 5.362e-02]  mindexpander_qwen_v1:  60%|#####9    | 1797/3000 [2:01:01<59:53,  2.99s/it, lr: 1.0e-04 loss: 5.362e-02]  mindexpander_qwen_v1:  60%|#####9    | 1797/3000 [2:01:04<59:53,  2.99s/it, lr: 1.0e-04 loss: 1.959e-01]mindexpander_qwen_v1:  60%|#####9    | 1797/3000 [2:01:04<59:53,  2.99s/it, lr: 1.0e-04 loss: 1.959e-01]mindexpander_qwen_v1:  60%|#####9    | 1798/3000 [2:01:04<57:49,  2.89s/it, lr: 1.0e-04 loss: 1.959e-01]mindexpander_qwen_v1:  60%|#####9    | 1798/3000 [2:01:04<57:49,  2.89s/it, lr: 1.0e-04 loss: 1.959e-01]mindexpander_qwen_v1:  60%|#####9    | 1798/3000 [2:01:10<57:49,  2.89s/it, lr: 1.0e-04 loss: 7.891e-02]mindexpander_qwen_v1:  60%|#####9    | 1798/3000 [2:01:10<57:49,  2.89s/it, lr: 1.0e-04 loss: 7.891e-02]mindexpander_qwen_v1:  60%|#####9    | 1799/3000 [2:01:10<1:14:43,  3.73s/it, lr: 1.0e-04 loss: 7.891e-02]mindexpander_qwen_v1:  60%|#####9    | 1799/3000 [2:01:10<1:14:43,  3.73s/it, lr: 1.0e-04 loss: 7.891e-02]mindexpander_qwen_v1:  60%|#####9    | 1799/3000 [2:01:12<1:14:43,  3.73s/it, lr: 1.0e-04 loss: 5.020e-02]mindexpander_qwen_v1:  60%|#####9    | 1799/3000 [2:01:12<1:14:43,  3.73s/it, lr: 1.0e-04 loss: 5.020e-02]mindexpander_qwen_v1:  60%|######    | 1800/3000 [2:01:16<1:14:40,  3.73s/it, lr: 1.0e-04 loss: 2.846e-02]mindexpander_qwen_v1:  60%|######    | 1800/3000 [2:01:16<1:14:40,  3.73s/it, lr: 1.0e-04 loss: 2.846e-02]mindexpander_qwen_v1:  60%|######    | 1801/3000 [2:01:16<57:34,  2.88s/it, lr: 1.0e-04 loss: 2.846e-02]  mindexpander_qwen_v1:  60%|######    | 1801/3000 [2:01:16<57:34,  2.88s/it, lr: 1.0e-04 loss: 2.846e-02]  mindexpander_qwen_v1:  60%|######    | 1801/3000 [2:01:20<57:34,  2.88s/it, lr: 1.0e-04 loss: 1.450e-01]mindexpander_qwen_v1:  60%|######    | 1801/3000 [2:01:20<57:34,  2.88s/it, lr: 1.0e-04 loss: 1.450e-01]mindexpander_qwen_v1:  60%|######    | 1802/3000 [2:01:20<1:02:58,  3.15s/it, lr: 1.0e-04 loss: 1.450e-01]mindexpander_qwen_v1:  60%|######    | 1802/3000 [2:01:20<1:02:58,  3.15s/it, lr: 1.0e-04 loss: 1.450e-01]mindexpander_qwen_v1:  60%|######    | 1802/3000 [2:01:26<1:02:58,  3.15s/it, lr: 1.0e-04 loss: 8.826e-02]mindexpander_qwen_v1:  60%|######    | 1802/3000 [2:01:26<1:02:58,  3.15s/it, lr: 1.0e-04 loss: 8.826e-02]mindexpander_qwen_v1:  60%|######    | 1803/3000 [2:01:26<1:16:27,  3.83s/it, lr: 1.0e-04 loss: 8.826e-02]mindexpander_qwen_v1:  60%|######    | 1803/3000 [2:01:26<1:16:27,  3.83s/it, lr: 1.0e-04 loss: 8.826e-02]mindexpander_qwen_v1:  60%|######    | 1803/3000 [2:01:30<1:16:27,  3.83s/it, lr: 1.0e-04 loss: 1.355e-01]mindexpander_qwen_v1:  60%|######    | 1803/3000 [2:01:30<1:16:27,  3.83s/it, lr: 1.0e-04 loss: 1.355e-01]mindexpander_qwen_v1:  60%|######    | 1804/3000 [2:01:30<1:15:54,  3.81s/it, lr: 1.0e-04 loss: 1.355e-01]mindexpander_qwen_v1:  60%|######    | 1804/3000 [2:01:30<1:15:54,  3.81s/it, lr: 1.0e-04 loss: 1.355e-01]mindexpander_qwen_v1:  60%|######    | 1804/3000 [2:01:32<1:15:54,  3.81s/it, lr: 1.0e-04 loss: 9.109e-03]mindexpander_qwen_v1:  60%|######    | 1804/3000 [2:01:32<1:15:54,  3.81s/it, lr: 1.0e-04 loss: 9.109e-03]mindexpander_qwen_v1:  60%|######    | 1805/3000 [2:01:32<1:08:19,  3.43s/it, lr: 1.0e-04 loss: 9.109e-03]mindexpander_qwen_v1:  60%|######    | 1805/3000 [2:01:32<1:08:19,  3.43s/it, lr: 1.0e-04 loss: 9.109e-03]mindexpander_qwen_v1:  60%|######    | 1805/3000 [2:01:35<1:08:19,  3.43s/it, lr: 1.0e-04 loss: 1.254e-01]mindexpander_qwen_v1:  60%|######    | 1805/3000 [2:01:35<1:08:19,  3.43s/it, lr: 1.0e-04 loss: 1.254e-01]mindexpander_qwen_v1:  60%|######    | 1806/3000 [2:01:35<1:03:45,  3.20s/it, lr: 1.0e-04 loss: 1.254e-01]mindexpander_qwen_v1:  60%|######    | 1806/3000 [2:01:35<1:03:45,  3.20s/it, lr: 1.0e-04 loss: 1.254e-01]mindexpander_qwen_v1:  60%|######    | 1806/3000 [2:01:40<1:03:45,  3.20s/it, lr: 1.0e-04 loss: 5.949e-02]mindexpander_qwen_v1:  60%|######    | 1806/3000 [2:01:40<1:03:45,  3.20s/it, lr: 1.0e-04 loss: 5.949e-02]mindexpander_qwen_v1:  60%|######    | 1807/3000 [2:01:40<1:18:20,  3.94s/it, lr: 1.0e-04 loss: 5.949e-02]mindexpander_qwen_v1:  60%|######    | 1807/3000 [2:01:40<1:18:20,  3.94s/it, lr: 1.0e-04 loss: 5.949e-02]mindexpander_qwen_v1:  60%|######    | 1807/3000 [2:01:43<1:18:20,  3.94s/it, lr: 1.0e-04 loss: 1.434e-01]mindexpander_qwen_v1:  60%|######    | 1807/3000 [2:01:43<1:18:20,  3.94s/it, lr: 1.0e-04 loss: 1.434e-01]mindexpander_qwen_v1:  60%|######    | 1808/3000 [2:01:43<1:09:35,  3.50s/it, lr: 1.0e-04 loss: 1.434e-01]mindexpander_qwen_v1:  60%|######    | 1808/3000 [2:01:43<1:09:35,  3.50s/it, lr: 1.0e-04 loss: 1.434e-01]mindexpander_qwen_v1:  60%|######    | 1808/3000 [2:01:49<1:09:35,  3.50s/it, lr: 1.0e-04 loss: 3.234e-02]mindexpander_qwen_v1:  60%|######    | 1808/3000 [2:01:49<1:09:35,  3.50s/it, lr: 1.0e-04 loss: 3.234e-02]mindexpander_qwen_v1:  60%|######    | 1809/3000 [2:01:49<1:22:43,  4.17s/it, lr: 1.0e-04 loss: 3.234e-02]mindexpander_qwen_v1:  60%|######    | 1809/3000 [2:01:49<1:22:43,  4.17s/it, lr: 1.0e-04 loss: 3.234e-02]mindexpander_qwen_v1:  60%|######    | 1809/3000 [2:01:51<1:22:43,  4.17s/it, lr: 1.0e-04 loss: 6.830e-02]mindexpander_qwen_v1:  60%|######    | 1809/3000 [2:01:51<1:22:43,  4.17s/it, lr: 1.0e-04 loss: 6.830e-02]mindexpander_qwen_v1:  60%|######    | 1810/3000 [2:01:55<1:22:39,  4.17s/it, lr: 1.0e-04 loss: 4.473e-02]mindexpander_qwen_v1:  60%|######    | 1810/3000 [2:01:55<1:22:39,  4.17s/it, lr: 1.0e-04 loss: 4.473e-02]mindexpander_qwen_v1:  60%|######    | 1811/3000 [2:01:55<1:01:47,  3.12s/it, lr: 1.0e-04 loss: 4.473e-02]mindexpander_qwen_v1:  60%|######    | 1811/3000 [2:01:55<1:01:47,  3.12s/it, lr: 1.0e-04 loss: 4.473e-02]mindexpander_qwen_v1:  60%|######    | 1811/3000 [2:01:59<1:01:47,  3.12s/it, lr: 1.0e-04 loss: 2.403e-02]mindexpander_qwen_v1:  60%|######    | 1811/3000 [2:01:59<1:01:47,  3.12s/it, lr: 1.0e-04 loss: 2.403e-02]mindexpander_qwen_v1:  60%|######    | 1812/3000 [2:01:59<1:04:46,  3.27s/it, lr: 1.0e-04 loss: 2.403e-02]mindexpander_qwen_v1:  60%|######    | 1812/3000 [2:01:59<1:04:46,  3.27s/it, lr: 1.0e-04 loss: 2.403e-02]mindexpander_qwen_v1:  60%|######    | 1812/3000 [2:02:01<1:04:46,  3.27s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  60%|######    | 1812/3000 [2:02:01<1:04:46,  3.27s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  60%|######    | 1813/3000 [2:02:01<1:00:30,  3.06s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  60%|######    | 1813/3000 [2:02:01<1:00:30,  3.06s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  60%|######    | 1813/3000 [2:02:04<1:00:30,  3.06s/it, lr: 1.0e-04 loss: 2.570e-02]mindexpander_qwen_v1:  60%|######    | 1813/3000 [2:02:04<1:00:30,  3.06s/it, lr: 1.0e-04 loss: 2.570e-02]mindexpander_qwen_v1:  60%|######    | 1814/3000 [2:02:04<58:13,  2.95s/it, lr: 1.0e-04 loss: 2.570e-02]  mindexpander_qwen_v1:  60%|######    | 1814/3000 [2:02:04<58:13,  2.95s/it, lr: 1.0e-04 loss: 2.570e-02]  mindexpander_qwen_v1:  60%|######    | 1814/3000 [2:02:08<58:13,  2.95s/it, lr: 1.0e-04 loss: 5.494e-02]mindexpander_qwen_v1:  60%|######    | 1814/3000 [2:02:08<58:13,  2.95s/it, lr: 1.0e-04 loss: 5.494e-02]mindexpander_qwen_v1:  60%|######    | 1815/3000 [2:02:08<1:02:34,  3.17s/it, lr: 1.0e-04 loss: 5.494e-02]mindexpander_qwen_v1:  60%|######    | 1815/3000 [2:02:08<1:02:34,  3.17s/it, lr: 1.0e-04 loss: 5.494e-02]mindexpander_qwen_v1:  60%|######    | 1815/3000 [2:02:11<1:02:34,  3.17s/it, lr: 1.0e-04 loss: 1.752e-01]mindexpander_qwen_v1:  60%|######    | 1815/3000 [2:02:11<1:02:34,  3.17s/it, lr: 1.0e-04 loss: 1.752e-01]mindexpander_qwen_v1:  61%|######    | 1816/3000 [2:02:11<1:05:44,  3.33s/it, lr: 1.0e-04 loss: 1.752e-01]mindexpander_qwen_v1:  61%|######    | 1816/3000 [2:02:11<1:05:44,  3.33s/it, lr: 1.0e-04 loss: 1.752e-01]mindexpander_qwen_v1:  61%|######    | 1816/3000 [2:02:17<1:05:44,  3.33s/it, lr: 1.0e-04 loss: 7.092e-02]mindexpander_qwen_v1:  61%|######    | 1816/3000 [2:02:17<1:05:44,  3.33s/it, lr: 1.0e-04 loss: 7.092e-02]mindexpander_qwen_v1:  61%|######    | 1817/3000 [2:02:17<1:19:32,  4.03s/it, lr: 1.0e-04 loss: 7.092e-02]mindexpander_qwen_v1:  61%|######    | 1817/3000 [2:02:17<1:19:32,  4.03s/it, lr: 1.0e-04 loss: 7.092e-02]mindexpander_qwen_v1:  61%|######    | 1817/3000 [2:02:21<1:19:32,  4.03s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  61%|######    | 1817/3000 [2:02:21<1:19:32,  4.03s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  61%|######    | 1818/3000 [2:02:21<1:18:48,  4.00s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  61%|######    | 1818/3000 [2:02:21<1:18:48,  4.00s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  61%|######    | 1818/3000 [2:02:25<1:18:48,  4.00s/it, lr: 1.0e-04 loss: 1.227e-01]mindexpander_qwen_v1:  61%|######    | 1818/3000 [2:02:25<1:18:48,  4.00s/it, lr: 1.0e-04 loss: 1.227e-01]mindexpander_qwen_v1:  61%|######    | 1819/3000 [2:02:25<1:17:16,  3.93s/it, lr: 1.0e-04 loss: 1.227e-01]mindexpander_qwen_v1:  61%|######    | 1819/3000 [2:02:25<1:17:16,  3.93s/it, lr: 1.0e-04 loss: 1.227e-01]mindexpander_qwen_v1:  61%|######    | 1819/3000 [2:02:31<1:17:16,  3.93s/it, lr: 1.0e-04 loss: 1.854e-01]mindexpander_qwen_v1:  61%|######    | 1819/3000 [2:02:31<1:17:16,  3.93s/it, lr: 1.0e-04 loss: 1.854e-01]mindexpander_qwen_v1:  61%|######    | 1820/3000 [2:02:36<1:17:12,  3.93s/it, lr: 1.0e-04 loss: 1.699e-02]mindexpander_qwen_v1:  61%|######    | 1820/3000 [2:02:36<1:17:12,  3.93s/it, lr: 1.0e-04 loss: 1.699e-02]mindexpander_qwen_v1:  61%|######    | 1821/3000 [2:02:36<1:07:44,  3.45s/it, lr: 1.0e-04 loss: 1.699e-02]mindexpander_qwen_v1:  61%|######    | 1821/3000 [2:02:36<1:07:44,  3.45s/it, lr: 1.0e-04 loss: 1.699e-02]mindexpander_qwen_v1:  61%|######    | 1821/3000 [2:02:42<1:07:44,  3.45s/it, lr: 1.0e-04 loss: 8.884e-02]mindexpander_qwen_v1:  61%|######    | 1821/3000 [2:02:42<1:07:44,  3.45s/it, lr: 1.0e-04 loss: 8.884e-02]mindexpander_qwen_v1:  61%|######    | 1822/3000 [2:02:42<1:19:27,  4.05s/it, lr: 1.0e-04 loss: 8.884e-02]mindexpander_qwen_v1:  61%|######    | 1822/3000 [2:02:42<1:19:27,  4.05s/it, lr: 1.0e-04 loss: 8.884e-02]mindexpander_qwen_v1:  61%|######    | 1822/3000 [2:02:45<1:19:27,  4.05s/it, lr: 1.0e-04 loss: 5.884e-02]mindexpander_qwen_v1:  61%|######    | 1822/3000 [2:02:45<1:19:27,  4.05s/it, lr: 1.0e-04 loss: 5.884e-02]mindexpander_qwen_v1:  61%|######    | 1823/3000 [2:02:45<1:11:13,  3.63s/it, lr: 1.0e-04 loss: 5.884e-02]mindexpander_qwen_v1:  61%|######    | 1823/3000 [2:02:45<1:11:13,  3.63s/it, lr: 1.0e-04 loss: 5.884e-02]mindexpander_qwen_v1:  61%|######    | 1823/3000 [2:02:50<1:11:13,  3.63s/it, lr: 1.0e-04 loss: 1.760e-01]mindexpander_qwen_v1:  61%|######    | 1823/3000 [2:02:50<1:11:13,  3.63s/it, lr: 1.0e-04 loss: 1.760e-01]mindexpander_qwen_v1:  61%|######    | 1824/3000 [2:02:50<1:22:26,  4.21s/it, lr: 1.0e-04 loss: 1.760e-01]mindexpander_qwen_v1:  61%|######    | 1824/3000 [2:02:50<1:22:26,  4.21s/it, lr: 1.0e-04 loss: 1.760e-01]mindexpander_qwen_v1:  61%|######    | 1824/3000 [2:02:53<1:22:26,  4.21s/it, lr: 1.0e-04 loss: 1.976e-01]mindexpander_qwen_v1:  61%|######    | 1824/3000 [2:02:53<1:22:26,  4.21s/it, lr: 1.0e-04 loss: 1.976e-01]mindexpander_qwen_v1:  61%|######    | 1825/3000 [2:02:53<1:12:47,  3.72s/it, lr: 1.0e-04 loss: 1.976e-01]mindexpander_qwen_v1:  61%|######    | 1825/3000 [2:02:53<1:12:47,  3.72s/it, lr: 1.0e-04 loss: 1.976e-01]mindexpander_qwen_v1:  61%|######    | 1825/3000 [2:02:59<1:12:47,  3.72s/it, lr: 1.0e-04 loss: 1.127e-01]mindexpander_qwen_v1:  61%|######    | 1825/3000 [2:02:59<1:12:47,  3.72s/it, lr: 1.0e-04 loss: 1.127e-01]mindexpander_qwen_v1:  61%|######    | 1826/3000 [2:02:59<1:24:58,  4.34s/it, lr: 1.0e-04 loss: 1.127e-01]mindexpander_qwen_v1:  61%|######    | 1826/3000 [2:02:59<1:24:58,  4.34s/it, lr: 1.0e-04 loss: 1.127e-01]mindexpander_qwen_v1:  61%|######    | 1826/3000 [2:03:05<1:24:58,  4.34s/it, lr: 1.0e-04 loss: 1.723e-02]mindexpander_qwen_v1:  61%|######    | 1826/3000 [2:03:05<1:24:58,  4.34s/it, lr: 1.0e-04 loss: 1.723e-02]mindexpander_qwen_v1:  61%|######    | 1827/3000 [2:03:05<1:32:57,  4.76s/it, lr: 1.0e-04 loss: 1.723e-02]mindexpander_qwen_v1:  61%|######    | 1827/3000 [2:03:05<1:32:57,  4.76s/it, lr: 1.0e-04 loss: 1.723e-02]mindexpander_qwen_v1:  61%|######    | 1827/3000 [2:03:07<1:32:57,  4.76s/it, lr: 1.0e-04 loss: 1.424e-02]mindexpander_qwen_v1:  61%|######    | 1827/3000 [2:03:07<1:32:57,  4.76s/it, lr: 1.0e-04 loss: 1.424e-02]mindexpander_qwen_v1:  61%|######    | 1828/3000 [2:03:07<1:19:53,  4.09s/it, lr: 1.0e-04 loss: 1.424e-02]mindexpander_qwen_v1:  61%|######    | 1828/3000 [2:03:07<1:19:53,  4.09s/it, lr: 1.0e-04 loss: 1.424e-02]mindexpander_qwen_v1:  61%|######    | 1828/3000 [2:03:11<1:19:53,  4.09s/it, lr: 1.0e-04 loss: 9.479e-02]mindexpander_qwen_v1:  61%|######    | 1828/3000 [2:03:11<1:19:53,  4.09s/it, lr: 1.0e-04 loss: 9.479e-02]mindexpander_qwen_v1:  61%|######    | 1829/3000 [2:03:11<1:18:00,  4.00s/it, lr: 1.0e-04 loss: 9.479e-02]mindexpander_qwen_v1:  61%|######    | 1829/3000 [2:03:11<1:18:00,  4.00s/it, lr: 1.0e-04 loss: 9.479e-02]mindexpander_qwen_v1:  61%|######    | 1829/3000 [2:03:14<1:18:00,  4.00s/it, lr: 1.0e-04 loss: 6.998e-04]mindexpander_qwen_v1:  61%|######    | 1829/3000 [2:03:14<1:18:00,  4.00s/it, lr: 1.0e-04 loss: 6.998e-04]mindexpander_qwen_v1:  61%|######1   | 1830/3000 [2:03:16<1:17:56,  4.00s/it, lr: 1.0e-04 loss: 2.024e-03]mindexpander_qwen_v1:  61%|######1   | 1830/3000 [2:03:16<1:17:56,  4.00s/it, lr: 1.0e-04 loss: 2.024e-03]mindexpander_qwen_v1:  61%|######1   | 1831/3000 [2:03:16<53:14,  2.73s/it, lr: 1.0e-04 loss: 2.024e-03]  mindexpander_qwen_v1:  61%|######1   | 1831/3000 [2:03:16<53:14,  2.73s/it, lr: 1.0e-04 loss: 2.024e-03]  mindexpander_qwen_v1:  61%|######1   | 1831/3000 [2:03:22<53:14,  2.73s/it, lr: 1.0e-04 loss: 1.352e-02]mindexpander_qwen_v1:  61%|######1   | 1831/3000 [2:03:22<53:14,  2.73s/it, lr: 1.0e-04 loss: 1.352e-02]mindexpander_qwen_v1:  61%|######1   | 1832/3000 [2:03:22<1:07:49,  3.48s/it, lr: 1.0e-04 loss: 1.352e-02]mindexpander_qwen_v1:  61%|######1   | 1832/3000 [2:03:22<1:07:49,  3.48s/it, lr: 1.0e-04 loss: 1.352e-02]mindexpander_qwen_v1:  61%|######1   | 1832/3000 [2:03:28<1:07:49,  3.48s/it, lr: 1.0e-04 loss: 3.220e-02]mindexpander_qwen_v1:  61%|######1   | 1832/3000 [2:03:28<1:07:49,  3.48s/it, lr: 1.0e-04 loss: 3.220e-02]mindexpander_qwen_v1:  61%|######1   | 1833/3000 [2:03:28<1:19:16,  4.08s/it, lr: 1.0e-04 loss: 3.220e-02]mindexpander_qwen_v1:  61%|######1   | 1833/3000 [2:03:28<1:19:16,  4.08s/it, lr: 1.0e-04 loss: 3.220e-02]mindexpander_qwen_v1:  61%|######1   | 1833/3000 [2:03:34<1:19:16,  4.08s/it, lr: 1.0e-04 loss: 7.940e-02]mindexpander_qwen_v1:  61%|######1   | 1833/3000 [2:03:34<1:19:16,  4.08s/it, lr: 1.0e-04 loss: 7.940e-02]mindexpander_qwen_v1:  61%|######1   | 1834/3000 [2:03:34<1:28:54,  4.57s/it, lr: 1.0e-04 loss: 7.940e-02]mindexpander_qwen_v1:  61%|######1   | 1834/3000 [2:03:34<1:28:54,  4.57s/it, lr: 1.0e-04 loss: 7.940e-02]mindexpander_qwen_v1:  61%|######1   | 1834/3000 [2:03:38<1:28:54,  4.57s/it, lr: 1.0e-04 loss: 5.611e-02]mindexpander_qwen_v1:  61%|######1   | 1834/3000 [2:03:38<1:28:54,  4.57s/it, lr: 1.0e-04 loss: 5.611e-02]mindexpander_qwen_v1:  61%|######1   | 1835/3000 [2:03:38<1:24:20,  4.34s/it, lr: 1.0e-04 loss: 5.611e-02]mindexpander_qwen_v1:  61%|######1   | 1835/3000 [2:03:38<1:24:20,  4.34s/it, lr: 1.0e-04 loss: 5.611e-02]mindexpander_qwen_v1:  61%|######1   | 1835/3000 [2:03:41<1:24:20,  4.34s/it, lr: 1.0e-04 loss: 2.280e-02]mindexpander_qwen_v1:  61%|######1   | 1835/3000 [2:03:41<1:24:20,  4.34s/it, lr: 1.0e-04 loss: 2.280e-02]mindexpander_qwen_v1:  61%|######1   | 1836/3000 [2:03:41<1:20:57,  4.17s/it, lr: 1.0e-04 loss: 2.280e-02]mindexpander_qwen_v1:  61%|######1   | 1836/3000 [2:03:41<1:20:57,  4.17s/it, lr: 1.0e-04 loss: 2.280e-02]mindexpander_qwen_v1:  61%|######1   | 1836/3000 [2:03:44<1:20:57,  4.17s/it, lr: 1.0e-04 loss: 1.460e-01]mindexpander_qwen_v1:  61%|######1   | 1836/3000 [2:03:44<1:20:57,  4.17s/it, lr: 1.0e-04 loss: 1.460e-01]mindexpander_qwen_v1:  61%|######1   | 1837/3000 [2:03:44<1:11:14,  3.67s/it, lr: 1.0e-04 loss: 1.460e-01]mindexpander_qwen_v1:  61%|######1   | 1837/3000 [2:03:44<1:11:14,  3.67s/it, lr: 1.0e-04 loss: 1.460e-01]mindexpander_qwen_v1:  61%|######1   | 1837/3000 [2:03:50<1:11:14,  3.67s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  61%|######1   | 1837/3000 [2:03:50<1:11:14,  3.67s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  61%|######1   | 1838/3000 [2:03:50<1:23:52,  4.33s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  61%|######1   | 1838/3000 [2:03:50<1:23:52,  4.33s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  61%|######1   | 1838/3000 [2:03:53<1:23:52,  4.33s/it, lr: 1.0e-04 loss: 7.003e-02]mindexpander_qwen_v1:  61%|######1   | 1838/3000 [2:03:53<1:23:52,  4.33s/it, lr: 1.0e-04 loss: 7.003e-02]mindexpander_qwen_v1:  61%|######1   | 1839/3000 [2:03:53<1:20:25,  4.16s/it, lr: 1.0e-04 loss: 7.003e-02]mindexpander_qwen_v1:  61%|######1   | 1839/3000 [2:03:53<1:20:25,  4.16s/it, lr: 1.0e-04 loss: 7.003e-02]mindexpander_qwen_v1:  61%|######1   | 1839/3000 [2:03:57<1:20:25,  4.16s/it, lr: 1.0e-04 loss: 9.868e-02]mindexpander_qwen_v1:  61%|######1   | 1839/3000 [2:03:57<1:20:25,  4.16s/it, lr: 1.0e-04 loss: 9.868e-02]mindexpander_qwen_v1:  61%|######1   | 1840/3000 [2:04:01<1:20:21,  4.16s/it, lr: 1.0e-04 loss: 1.389e-01]mindexpander_qwen_v1:  61%|######1   | 1840/3000 [2:04:01<1:20:21,  4.16s/it, lr: 1.0e-04 loss: 1.389e-01]mindexpander_qwen_v1:  61%|######1   | 1841/3000 [2:04:01<1:00:06,  3.11s/it, lr: 1.0e-04 loss: 1.389e-01]mindexpander_qwen_v1:  61%|######1   | 1841/3000 [2:04:01<1:00:06,  3.11s/it, lr: 1.0e-04 loss: 1.389e-01]mindexpander_qwen_v1:  61%|######1   | 1841/3000 [2:04:05<1:00:06,  3.11s/it, lr: 1.0e-04 loss: 1.610e-01]mindexpander_qwen_v1:  61%|######1   | 1841/3000 [2:04:05<1:00:06,  3.11s/it, lr: 1.0e-04 loss: 1.610e-01]mindexpander_qwen_v1:  61%|######1   | 1842/3000 [2:04:05<1:03:53,  3.31s/it, lr: 1.0e-04 loss: 1.610e-01]mindexpander_qwen_v1:  61%|######1   | 1842/3000 [2:04:05<1:03:53,  3.31s/it, lr: 1.0e-04 loss: 1.610e-01]mindexpander_qwen_v1:  61%|######1   | 1842/3000 [2:04:07<1:03:53,  3.31s/it, lr: 1.0e-04 loss: 7.610e-02]mindexpander_qwen_v1:  61%|######1   | 1842/3000 [2:04:07<1:03:53,  3.31s/it, lr: 1.0e-04 loss: 7.610e-02]mindexpander_qwen_v1:  61%|######1   | 1843/3000 [2:04:07<59:30,  3.09s/it, lr: 1.0e-04 loss: 7.610e-02]  mindexpander_qwen_v1:  61%|######1   | 1843/3000 [2:04:07<59:30,  3.09s/it, lr: 1.0e-04 loss: 7.610e-02]  mindexpander_qwen_v1:  61%|######1   | 1843/3000 [2:04:13<59:30,  3.09s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  61%|######1   | 1843/3000 [2:04:13<59:30,  3.09s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  61%|######1   | 1844/3000 [2:04:13<1:13:23,  3.81s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  61%|######1   | 1844/3000 [2:04:13<1:13:23,  3.81s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  61%|######1   | 1844/3000 [2:04:17<1:13:23,  3.81s/it, lr: 1.0e-04 loss: 9.057e-02]mindexpander_qwen_v1:  61%|######1   | 1844/3000 [2:04:17<1:13:23,  3.81s/it, lr: 1.0e-04 loss: 9.057e-02]mindexpander_qwen_v1:  62%|######1   | 1845/3000 [2:04:17<1:12:55,  3.79s/it, lr: 1.0e-04 loss: 9.057e-02]mindexpander_qwen_v1:  62%|######1   | 1845/3000 [2:04:17<1:12:55,  3.79s/it, lr: 1.0e-04 loss: 9.057e-02]mindexpander_qwen_v1:  62%|######1   | 1845/3000 [2:04:23<1:12:55,  3.79s/it, lr: 1.0e-04 loss: 3.314e-02]mindexpander_qwen_v1:  62%|######1   | 1845/3000 [2:04:23<1:12:55,  3.79s/it, lr: 1.0e-04 loss: 3.314e-02]mindexpander_qwen_v1:  62%|######1   | 1846/3000 [2:04:23<1:24:34,  4.40s/it, lr: 1.0e-04 loss: 3.314e-02]mindexpander_qwen_v1:  62%|######1   | 1846/3000 [2:04:23<1:24:34,  4.40s/it, lr: 1.0e-04 loss: 3.314e-02]mindexpander_qwen_v1:  62%|######1   | 1846/3000 [2:04:25<1:24:34,  4.40s/it, lr: 1.0e-04 loss: 3.106e-02]mindexpander_qwen_v1:  62%|######1   | 1846/3000 [2:04:25<1:24:34,  4.40s/it, lr: 1.0e-04 loss: 3.106e-02]mindexpander_qwen_v1:  62%|######1   | 1847/3000 [2:04:25<1:13:44,  3.84s/it, lr: 1.0e-04 loss: 3.106e-02]mindexpander_qwen_v1:  62%|######1   | 1847/3000 [2:04:25<1:13:44,  3.84s/it, lr: 1.0e-04 loss: 3.106e-02]mindexpander_qwen_v1:  62%|######1   | 1847/3000 [2:04:28<1:13:44,  3.84s/it, lr: 1.0e-04 loss: 2.693e-02]mindexpander_qwen_v1:  62%|######1   | 1847/3000 [2:04:28<1:13:44,  3.84s/it, lr: 1.0e-04 loss: 2.693e-02]mindexpander_qwen_v1:  62%|######1   | 1848/3000 [2:04:28<1:05:56,  3.43s/it, lr: 1.0e-04 loss: 2.693e-02]mindexpander_qwen_v1:  62%|######1   | 1848/3000 [2:04:28<1:05:56,  3.43s/it, lr: 1.0e-04 loss: 2.693e-02]mindexpander_qwen_v1:  62%|######1   | 1848/3000 [2:04:30<1:05:56,  3.43s/it, lr: 1.0e-04 loss: 2.657e-02]mindexpander_qwen_v1:  62%|######1   | 1848/3000 [2:04:30<1:05:56,  3.43s/it, lr: 1.0e-04 loss: 2.657e-02]mindexpander_qwen_v1:  62%|######1   | 1849/3000 [2:04:30<1:00:22,  3.15s/it, lr: 1.0e-04 loss: 2.657e-02]mindexpander_qwen_v1:  62%|######1   | 1849/3000 [2:04:30<1:00:22,  3.15s/it, lr: 1.0e-04 loss: 2.657e-02]mindexpander_qwen_v1:  62%|######1   | 1849/3000 [2:04:36<1:00:22,  3.15s/it, lr: 1.0e-04 loss: 1.922e-02]mindexpander_qwen_v1:  62%|######1   | 1849/3000 [2:04:36<1:00:22,  3.15s/it, lr: 1.0e-04 loss: 1.922e-02]mindexpander_qwen_v1:  62%|######1   | 1850/3000 [2:04:42<1:00:19,  3.15s/it, lr: 1.0e-04 loss: 5.538e-02]mindexpander_qwen_v1:  62%|######1   | 1850/3000 [2:04:42<1:00:19,  3.15s/it, lr: 1.0e-04 loss: 5.538e-02]mindexpander_qwen_v1:  62%|######1   | 1851/3000 [2:04:42<57:55,  3.03s/it, lr: 1.0e-04 loss: 5.538e-02]  mindexpander_qwen_v1:  62%|######1   | 1851/3000 [2:04:42<57:55,  3.03s/it, lr: 1.0e-04 loss: 5.538e-02]  mindexpander_qwen_v1:  62%|######1   | 1851/3000 [2:04:44<57:55,  3.03s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  62%|######1   | 1851/3000 [2:04:44<57:55,  3.03s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  62%|######1   | 1852/3000 [2:04:44<55:09,  2.88s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  62%|######1   | 1852/3000 [2:04:44<55:09,  2.88s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  62%|######1   | 1852/3000 [2:04:47<55:09,  2.88s/it, lr: 1.0e-04 loss: 6.083e-02]mindexpander_qwen_v1:  62%|######1   | 1852/3000 [2:04:47<55:09,  2.88s/it, lr: 1.0e-04 loss: 6.083e-02]mindexpander_qwen_v1:  62%|######1   | 1853/3000 [2:04:47<52:59,  2.77s/it, lr: 1.0e-04 loss: 6.083e-02]mindexpander_qwen_v1:  62%|######1   | 1853/3000 [2:04:47<52:59,  2.77s/it, lr: 1.0e-04 loss: 6.083e-02]mindexpander_qwen_v1:  62%|######1   | 1853/3000 [2:04:51<52:59,  2.77s/it, lr: 1.0e-04 loss: 1.574e-01]mindexpander_qwen_v1:  62%|######1   | 1853/3000 [2:04:51<52:59,  2.77s/it, lr: 1.0e-04 loss: 1.574e-01]mindexpander_qwen_v1:  62%|######1   | 1854/3000 [2:04:51<58:52,  3.08s/it, lr: 1.0e-04 loss: 1.574e-01]mindexpander_qwen_v1:  62%|######1   | 1854/3000 [2:04:51<58:52,  3.08s/it, lr: 1.0e-04 loss: 1.574e-01]mindexpander_qwen_v1:  62%|######1   | 1854/3000 [2:04:56<58:52,  3.08s/it, lr: 1.0e-04 loss: 4.710e-02]mindexpander_qwen_v1:  62%|######1   | 1854/3000 [2:04:56<58:52,  3.08s/it, lr: 1.0e-04 loss: 4.710e-02]mindexpander_qwen_v1:  62%|######1   | 1855/3000 [2:04:56<1:13:05,  3.83s/it, lr: 1.0e-04 loss: 4.710e-02]mindexpander_qwen_v1:  62%|######1   | 1855/3000 [2:04:56<1:13:05,  3.83s/it, lr: 1.0e-04 loss: 4.710e-02]mindexpander_qwen_v1:  62%|######1   | 1855/3000 [2:05:00<1:13:05,  3.83s/it, lr: 1.0e-04 loss: 7.474e-02]mindexpander_qwen_v1:  62%|######1   | 1855/3000 [2:05:00<1:13:05,  3.83s/it, lr: 1.0e-04 loss: 7.474e-02]mindexpander_qwen_v1:  62%|######1   | 1856/3000 [2:05:00<1:12:33,  3.81s/it, lr: 1.0e-04 loss: 7.474e-02]mindexpander_qwen_v1:  62%|######1   | 1856/3000 [2:05:00<1:12:33,  3.81s/it, lr: 1.0e-04 loss: 7.474e-02]mindexpander_qwen_v1:  62%|######1   | 1856/3000 [2:05:04<1:12:33,  3.81s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:  62%|######1   | 1856/3000 [2:05:04<1:12:33,  3.81s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:  62%|######1   | 1857/3000 [2:05:04<1:12:10,  3.79s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:  62%|######1   | 1857/3000 [2:05:04<1:12:10,  3.79s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:  62%|######1   | 1857/3000 [2:05:06<1:12:10,  3.79s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  62%|######1   | 1857/3000 [2:05:06<1:12:10,  3.79s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  62%|######1   | 1858/3000 [2:05:06<1:05:41,  3.45s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  62%|######1   | 1858/3000 [2:05:06<1:05:41,  3.45s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  62%|######1   | 1858/3000 [2:05:12<1:05:41,  3.45s/it, lr: 1.0e-04 loss: 1.416e-02]mindexpander_qwen_v1:  62%|######1   | 1858/3000 [2:05:12<1:05:41,  3.45s/it, lr: 1.0e-04 loss: 1.416e-02]mindexpander_qwen_v1:  62%|######1   | 1859/3000 [2:05:12<1:18:34,  4.13s/it, lr: 1.0e-04 loss: 1.416e-02]mindexpander_qwen_v1:  62%|######1   | 1859/3000 [2:05:12<1:18:34,  4.13s/it, lr: 1.0e-04 loss: 1.416e-02]mindexpander_qwen_v1:  62%|######1   | 1859/3000 [2:05:15<1:18:34,  4.13s/it, lr: 1.0e-04 loss: 1.522e-02]mindexpander_qwen_v1:  62%|######1   | 1859/3000 [2:05:15<1:18:34,  4.13s/it, lr: 1.0e-04 loss: 1.522e-02]mindexpander_qwen_v1:  62%|######2   | 1860/3000 [2:05:19<1:18:30,  4.13s/it, lr: 1.0e-04 loss: 5.072e-02]mindexpander_qwen_v1:  62%|######2   | 1860/3000 [2:05:19<1:18:30,  4.13s/it, lr: 1.0e-04 loss: 5.072e-02]mindexpander_qwen_v1:  62%|######2   | 1861/3000 [2:05:19<58:51,  3.10s/it, lr: 1.0e-04 loss: 5.072e-02]  mindexpander_qwen_v1:  62%|######2   | 1861/3000 [2:05:19<58:51,  3.10s/it, lr: 1.0e-04 loss: 5.072e-02]  mindexpander_qwen_v1:  62%|######2   | 1861/3000 [2:05:25<58:51,  3.10s/it, lr: 1.0e-04 loss: 1.378e-01]mindexpander_qwen_v1:  62%|######2   | 1861/3000 [2:05:25<58:51,  3.10s/it, lr: 1.0e-04 loss: 1.378e-01]mindexpander_qwen_v1:  62%|######2   | 1862/3000 [2:05:25<1:12:07,  3.80s/it, lr: 1.0e-04 loss: 1.378e-01]mindexpander_qwen_v1:  62%|######2   | 1862/3000 [2:05:25<1:12:07,  3.80s/it, lr: 1.0e-04 loss: 1.378e-01]mindexpander_qwen_v1:  62%|######2   | 1862/3000 [2:05:27<1:12:07,  3.80s/it, lr: 1.0e-04 loss: 4.478e-02]mindexpander_qwen_v1:  62%|######2   | 1862/3000 [2:05:27<1:12:07,  3.80s/it, lr: 1.0e-04 loss: 4.478e-02]mindexpander_qwen_v1:  62%|######2   | 1863/3000 [2:05:27<1:05:23,  3.45s/it, lr: 1.0e-04 loss: 4.478e-02]mindexpander_qwen_v1:  62%|######2   | 1863/3000 [2:05:27<1:05:23,  3.45s/it, lr: 1.0e-04 loss: 4.478e-02]mindexpander_qwen_v1:  62%|######2   | 1863/3000 [2:05:31<1:05:23,  3.45s/it, lr: 1.0e-04 loss: 1.133e-02]mindexpander_qwen_v1:  62%|######2   | 1863/3000 [2:05:31<1:05:23,  3.45s/it, lr: 1.0e-04 loss: 1.133e-02]mindexpander_qwen_v1:  62%|######2   | 1864/3000 [2:05:31<1:06:49,  3.53s/it, lr: 1.0e-04 loss: 1.133e-02]mindexpander_qwen_v1:  62%|######2   | 1864/3000 [2:05:31<1:06:49,  3.53s/it, lr: 1.0e-04 loss: 1.133e-02]mindexpander_qwen_v1:  62%|######2   | 1864/3000 [2:05:35<1:06:49,  3.53s/it, lr: 1.0e-04 loss: 9.814e-02]mindexpander_qwen_v1:  62%|######2   | 1864/3000 [2:05:35<1:06:49,  3.53s/it, lr: 1.0e-04 loss: 9.814e-02]mindexpander_qwen_v1:  62%|######2   | 1865/3000 [2:05:35<1:07:54,  3.59s/it, lr: 1.0e-04 loss: 9.814e-02]mindexpander_qwen_v1:  62%|######2   | 1865/3000 [2:05:35<1:07:54,  3.59s/it, lr: 1.0e-04 loss: 9.814e-02]mindexpander_qwen_v1:  62%|######2   | 1865/3000 [2:05:39<1:07:54,  3.59s/it, lr: 1.0e-04 loss: 1.163e-01]mindexpander_qwen_v1:  62%|######2   | 1865/3000 [2:05:39<1:07:54,  3.59s/it, lr: 1.0e-04 loss: 1.163e-01]mindexpander_qwen_v1:  62%|######2   | 1866/3000 [2:05:39<1:09:30,  3.68s/it, lr: 1.0e-04 loss: 1.163e-01]mindexpander_qwen_v1:  62%|######2   | 1866/3000 [2:05:39<1:09:30,  3.68s/it, lr: 1.0e-04 loss: 1.163e-01]mindexpander_qwen_v1:  62%|######2   | 1866/3000 [2:05:41<1:09:30,  3.68s/it, lr: 1.0e-04 loss: 9.528e-02]mindexpander_qwen_v1:  62%|######2   | 1866/3000 [2:05:41<1:09:30,  3.68s/it, lr: 1.0e-04 loss: 9.528e-02]mindexpander_qwen_v1:  62%|######2   | 1867/3000 [2:05:41<1:02:44,  3.32s/it, lr: 1.0e-04 loss: 9.528e-02]mindexpander_qwen_v1:  62%|######2   | 1867/3000 [2:05:41<1:02:44,  3.32s/it, lr: 1.0e-04 loss: 9.528e-02]mindexpander_qwen_v1:  62%|######2   | 1867/3000 [2:05:43<1:02:44,  3.32s/it, lr: 1.0e-04 loss: 1.765e-01]mindexpander_qwen_v1:  62%|######2   | 1867/3000 [2:05:43<1:02:44,  3.32s/it, lr: 1.0e-04 loss: 1.765e-01]mindexpander_qwen_v1:  62%|######2   | 1868/3000 [2:05:43<57:51,  3.07s/it, lr: 1.0e-04 loss: 1.765e-01]  mindexpander_qwen_v1:  62%|######2   | 1868/3000 [2:05:43<57:51,  3.07s/it, lr: 1.0e-04 loss: 1.765e-01]  mindexpander_qwen_v1:  62%|######2   | 1868/3000 [2:05:46<57:51,  3.07s/it, lr: 1.0e-04 loss: 1.962e-02]mindexpander_qwen_v1:  62%|######2   | 1868/3000 [2:05:46<57:51,  3.07s/it, lr: 1.0e-04 loss: 1.962e-02]mindexpander_qwen_v1:  62%|######2   | 1869/3000 [2:05:46<54:24,  2.89s/it, lr: 1.0e-04 loss: 1.962e-02]mindexpander_qwen_v1:  62%|######2   | 1869/3000 [2:05:46<54:24,  2.89s/it, lr: 1.0e-04 loss: 1.962e-02]mindexpander_qwen_v1:  62%|######2   | 1869/3000 [2:05:52<54:24,  2.89s/it, lr: 1.0e-04 loss: 1.409e-01]mindexpander_qwen_v1:  62%|######2   | 1869/3000 [2:05:52<54:24,  2.89s/it, lr: 1.0e-04 loss: 1.409e-01]mindexpander_qwen_v1:  62%|######2   | 1870/3000 [2:05:58<54:21,  2.89s/it, lr: 1.0e-04 loss: 3.734e-02]mindexpander_qwen_v1:  62%|######2   | 1870/3000 [2:05:58<54:21,  2.89s/it, lr: 1.0e-04 loss: 3.734e-02]mindexpander_qwen_v1:  62%|######2   | 1871/3000 [2:05:58<54:13,  2.88s/it, lr: 1.0e-04 loss: 3.734e-02]mindexpander_qwen_v1:  62%|######2   | 1871/3000 [2:05:58<54:13,  2.88s/it, lr: 1.0e-04 loss: 3.734e-02]mindexpander_qwen_v1:  62%|######2   | 1871/3000 [2:06:03<54:13,  2.88s/it, lr: 1.0e-04 loss: 1.654e-01]mindexpander_qwen_v1:  62%|######2   | 1871/3000 [2:06:03<54:13,  2.88s/it, lr: 1.0e-04 loss: 1.654e-01]mindexpander_qwen_v1:  62%|######2   | 1872/3000 [2:06:03<1:07:30,  3.59s/it, lr: 1.0e-04 loss: 1.654e-01]mindexpander_qwen_v1:  62%|######2   | 1872/3000 [2:06:03<1:07:30,  3.59s/it, lr: 1.0e-04 loss: 1.654e-01]mindexpander_qwen_v1:  62%|######2   | 1872/3000 [2:06:09<1:07:30,  3.59s/it, lr: 1.0e-04 loss: 6.263e-02]mindexpander_qwen_v1:  62%|######2   | 1872/3000 [2:06:09<1:07:30,  3.59s/it, lr: 1.0e-04 loss: 6.263e-02]mindexpander_qwen_v1:  62%|######2   | 1873/3000 [2:06:09<1:18:07,  4.16s/it, lr: 1.0e-04 loss: 6.263e-02]mindexpander_qwen_v1:  62%|######2   | 1873/3000 [2:06:09<1:18:07,  4.16s/it, lr: 1.0e-04 loss: 6.263e-02]mindexpander_qwen_v1:  62%|######2   | 1873/3000 [2:06:12<1:18:07,  4.16s/it, lr: 1.0e-04 loss: 4.538e-02]mindexpander_qwen_v1:  62%|######2   | 1873/3000 [2:06:12<1:18:07,  4.16s/it, lr: 1.0e-04 loss: 4.538e-02]mindexpander_qwen_v1:  62%|######2   | 1874/3000 [2:06:12<1:10:24,  3.75s/it, lr: 1.0e-04 loss: 4.538e-02]mindexpander_qwen_v1:  62%|######2   | 1874/3000 [2:06:12<1:10:24,  3.75s/it, lr: 1.0e-04 loss: 4.538e-02]mindexpander_qwen_v1:  62%|######2   | 1874/3000 [2:06:16<1:10:24,  3.75s/it, lr: 1.0e-04 loss: 6.727e-02]mindexpander_qwen_v1:  62%|######2   | 1874/3000 [2:06:16<1:10:24,  3.75s/it, lr: 1.0e-04 loss: 6.727e-02]mindexpander_qwen_v1:  62%|######2   | 1875/3000 [2:06:16<1:10:18,  3.75s/it, lr: 1.0e-04 loss: 6.727e-02]mindexpander_qwen_v1:  62%|######2   | 1875/3000 [2:06:16<1:10:18,  3.75s/it, lr: 1.0e-04 loss: 6.727e-02]mindexpander_qwen_v1:  62%|######2   | 1875/3000 [2:06:21<1:10:18,  3.75s/it, lr: 1.0e-04 loss: 1.144e-02]mindexpander_qwen_v1:  62%|######2   | 1875/3000 [2:06:21<1:10:18,  3.75s/it, lr: 1.0e-04 loss: 1.144e-02]mindexpander_qwen_v1:  63%|######2   | 1876/3000 [2:06:21<1:20:56,  4.32s/it, lr: 1.0e-04 loss: 1.144e-02]mindexpander_qwen_v1:  63%|######2   | 1876/3000 [2:06:21<1:20:56,  4.32s/it, lr: 1.0e-04 loss: 1.144e-02]mindexpander_qwen_v1:  63%|######2   | 1876/3000 [2:06:27<1:20:56,  4.32s/it, lr: 1.0e-04 loss: 2.202e-02]mindexpander_qwen_v1:  63%|######2   | 1876/3000 [2:06:27<1:20:56,  4.32s/it, lr: 1.0e-04 loss: 2.202e-02]mindexpander_qwen_v1:  63%|######2   | 1877/3000 [2:06:27<1:28:41,  4.74s/it, lr: 1.0e-04 loss: 2.202e-02]mindexpander_qwen_v1:  63%|######2   | 1877/3000 [2:06:27<1:28:41,  4.74s/it, lr: 1.0e-04 loss: 2.202e-02]mindexpander_qwen_v1:  63%|######2   | 1877/3000 [2:06:30<1:28:41,  4.74s/it, lr: 1.0e-04 loss: 2.975e-02]mindexpander_qwen_v1:  63%|######2   | 1877/3000 [2:06:30<1:28:41,  4.74s/it, lr: 1.0e-04 loss: 2.975e-02]mindexpander_qwen_v1:  63%|######2   | 1878/3000 [2:06:30<1:17:15,  4.13s/it, lr: 1.0e-04 loss: 2.975e-02]mindexpander_qwen_v1:  63%|######2   | 1878/3000 [2:06:30<1:17:15,  4.13s/it, lr: 1.0e-04 loss: 2.975e-02]mindexpander_qwen_v1:  63%|######2   | 1878/3000 [2:06:32<1:17:15,  4.13s/it, lr: 1.0e-04 loss: 5.174e-02]mindexpander_qwen_v1:  63%|######2   | 1878/3000 [2:06:32<1:17:15,  4.13s/it, lr: 1.0e-04 loss: 5.174e-02]mindexpander_qwen_v1:  63%|######2   | 1879/3000 [2:06:32<1:07:58,  3.64s/it, lr: 1.0e-04 loss: 5.174e-02]mindexpander_qwen_v1:  63%|######2   | 1879/3000 [2:06:32<1:07:58,  3.64s/it, lr: 1.0e-04 loss: 5.174e-02]mindexpander_qwen_v1:  63%|######2   | 1879/3000 [2:06:38<1:07:58,  3.64s/it, lr: 1.0e-04 loss: 8.513e-02]mindexpander_qwen_v1:  63%|######2   | 1879/3000 [2:06:38<1:07:58,  3.64s/it, lr: 1.0e-04 loss: 8.513e-02]mindexpander_qwen_v1:  63%|######2   | 1880/3000 [2:06:40<1:07:54,  3.64s/it, lr: 1.0e-04 loss: 4.614e-02]mindexpander_qwen_v1:  63%|######2   | 1880/3000 [2:06:40<1:07:54,  3.64s/it, lr: 1.0e-04 loss: 4.614e-02]mindexpander_qwen_v1:  63%|######2   | 1881/3000 [2:06:40<47:18,  2.54s/it, lr: 1.0e-04 loss: 4.614e-02]  mindexpander_qwen_v1:  63%|######2   | 1881/3000 [2:06:40<47:18,  2.54s/it, lr: 1.0e-04 loss: 4.614e-02]  mindexpander_qwen_v1:  63%|######2   | 1881/3000 [2:06:46<47:18,  2.54s/it, lr: 1.0e-04 loss: 1.797e-02]mindexpander_qwen_v1:  63%|######2   | 1881/3000 [2:06:46<47:18,  2.54s/it, lr: 1.0e-04 loss: 1.797e-02]mindexpander_qwen_v1:  63%|######2   | 1882/3000 [2:06:46<1:02:38,  3.36s/it, lr: 1.0e-04 loss: 1.797e-02]mindexpander_qwen_v1:  63%|######2   | 1882/3000 [2:06:46<1:02:38,  3.36s/it, lr: 1.0e-04 loss: 1.797e-02]mindexpander_qwen_v1:  63%|######2   | 1882/3000 [2:06:50<1:02:38,  3.36s/it, lr: 1.0e-04 loss: 5.861e-02]mindexpander_qwen_v1:  63%|######2   | 1882/3000 [2:06:50<1:02:38,  3.36s/it, lr: 1.0e-04 loss: 5.861e-02]mindexpander_qwen_v1:  63%|######2   | 1883/3000 [2:06:50<1:04:25,  3.46s/it, lr: 1.0e-04 loss: 5.861e-02]mindexpander_qwen_v1:  63%|######2   | 1883/3000 [2:06:50<1:04:25,  3.46s/it, lr: 1.0e-04 loss: 5.861e-02]mindexpander_qwen_v1:  63%|######2   | 1883/3000 [2:06:54<1:04:25,  3.46s/it, lr: 1.0e-04 loss: 1.614e-01]mindexpander_qwen_v1:  63%|######2   | 1883/3000 [2:06:54<1:04:25,  3.46s/it, lr: 1.0e-04 loss: 1.614e-01]mindexpander_qwen_v1:  63%|######2   | 1884/3000 [2:06:54<1:05:46,  3.54s/it, lr: 1.0e-04 loss: 1.614e-01]mindexpander_qwen_v1:  63%|######2   | 1884/3000 [2:06:54<1:05:46,  3.54s/it, lr: 1.0e-04 loss: 1.614e-01]mindexpander_qwen_v1:  63%|######2   | 1884/3000 [2:06:58<1:05:46,  3.54s/it, lr: 1.0e-04 loss: 2.868e-02]mindexpander_qwen_v1:  63%|######2   | 1884/3000 [2:06:58<1:05:46,  3.54s/it, lr: 1.0e-04 loss: 2.868e-02]mindexpander_qwen_v1:  63%|######2   | 1885/3000 [2:06:58<1:06:47,  3.59s/it, lr: 1.0e-04 loss: 2.868e-02]mindexpander_qwen_v1:  63%|######2   | 1885/3000 [2:06:58<1:06:47,  3.59s/it, lr: 1.0e-04 loss: 2.868e-02]mindexpander_qwen_v1:  63%|######2   | 1885/3000 [2:07:01<1:06:47,  3.59s/it, lr: 1.0e-04 loss: 7.252e-02]mindexpander_qwen_v1:  63%|######2   | 1885/3000 [2:07:01<1:06:47,  3.59s/it, lr: 1.0e-04 loss: 7.252e-02]mindexpander_qwen_v1:  63%|######2   | 1886/3000 [2:07:01<1:08:27,  3.69s/it, lr: 1.0e-04 loss: 7.252e-02]mindexpander_qwen_v1:  63%|######2   | 1886/3000 [2:07:01<1:08:27,  3.69s/it, lr: 1.0e-04 loss: 7.252e-02]mindexpander_qwen_v1:  63%|######2   | 1886/3000 [2:07:05<1:08:27,  3.69s/it, lr: 1.0e-04 loss: 1.212e-01]mindexpander_qwen_v1:  63%|######2   | 1886/3000 [2:07:05<1:08:27,  3.69s/it, lr: 1.0e-04 loss: 1.212e-01]mindexpander_qwen_v1:  63%|######2   | 1887/3000 [2:07:05<1:08:40,  3.70s/it, lr: 1.0e-04 loss: 1.212e-01]mindexpander_qwen_v1:  63%|######2   | 1887/3000 [2:07:05<1:08:40,  3.70s/it, lr: 1.0e-04 loss: 1.212e-01]mindexpander_qwen_v1:  63%|######2   | 1887/3000 [2:07:11<1:08:40,  3.70s/it, lr: 1.0e-04 loss: 1.284e-01]mindexpander_qwen_v1:  63%|######2   | 1887/3000 [2:07:11<1:08:40,  3.70s/it, lr: 1.0e-04 loss: 1.284e-01]mindexpander_qwen_v1:  63%|######2   | 1888/3000 [2:07:11<1:19:44,  4.30s/it, lr: 1.0e-04 loss: 1.284e-01]mindexpander_qwen_v1:  63%|######2   | 1888/3000 [2:07:11<1:19:44,  4.30s/it, lr: 1.0e-04 loss: 1.284e-01]mindexpander_qwen_v1:  63%|######2   | 1888/3000 [2:07:13<1:19:44,  4.30s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  63%|######2   | 1888/3000 [2:07:13<1:19:44,  4.30s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  63%|######2   | 1889/3000 [2:07:13<1:09:31,  3.75s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  63%|######2   | 1889/3000 [2:07:13<1:09:31,  3.75s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  63%|######2   | 1889/3000 [2:07:18<1:09:31,  3.75s/it, lr: 1.0e-04 loss: 5.676e-02]mindexpander_qwen_v1:  63%|######2   | 1889/3000 [2:07:18<1:09:31,  3.75s/it, lr: 1.0e-04 loss: 5.676e-02]mindexpander_qwen_v1:  63%|######3   | 1890/3000 [2:07:21<1:09:27,  3.75s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  63%|######3   | 1890/3000 [2:07:21<1:09:27,  3.75s/it, lr: 1.0e-04 loss: 1.747e-01]mindexpander_qwen_v1:  63%|######3   | 1891/3000 [2:07:21<53:29,  2.89s/it, lr: 1.0e-04 loss: 1.747e-01]  mindexpander_qwen_v1:  63%|######3   | 1891/3000 [2:07:21<53:29,  2.89s/it, lr: 1.0e-04 loss: 1.747e-01]  mindexpander_qwen_v1:  63%|######3   | 1891/3000 [2:07:27<53:29,  2.89s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:  63%|######3   | 1891/3000 [2:07:27<53:29,  2.89s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:  63%|######3   | 1892/3000 [2:07:27<1:06:31,  3.60s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:  63%|######3   | 1892/3000 [2:07:27<1:06:31,  3.60s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:  63%|######3   | 1892/3000 [2:07:31<1:06:31,  3.60s/it, lr: 1.0e-04 loss: 8.225e-02]mindexpander_qwen_v1:  63%|######3   | 1892/3000 [2:07:31<1:06:31,  3.60s/it, lr: 1.0e-04 loss: 8.225e-02]mindexpander_qwen_v1:  63%|######3   | 1893/3000 [2:07:31<1:07:08,  3.64s/it, lr: 1.0e-04 loss: 8.225e-02]mindexpander_qwen_v1:  63%|######3   | 1893/3000 [2:07:31<1:07:08,  3.64s/it, lr: 1.0e-04 loss: 8.225e-02]mindexpander_qwen_v1:  63%|######3   | 1893/3000 [2:07:34<1:07:08,  3.64s/it, lr: 1.0e-04 loss: 6.254e-02]mindexpander_qwen_v1:  63%|######3   | 1893/3000 [2:07:34<1:07:08,  3.64s/it, lr: 1.0e-04 loss: 6.254e-02]mindexpander_qwen_v1:  63%|######3   | 1894/3000 [2:07:34<1:02:13,  3.38s/it, lr: 1.0e-04 loss: 6.254e-02]mindexpander_qwen_v1:  63%|######3   | 1894/3000 [2:07:34<1:02:13,  3.38s/it, lr: 1.0e-04 loss: 6.254e-02]mindexpander_qwen_v1:  63%|######3   | 1894/3000 [2:07:36<1:02:13,  3.38s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  63%|######3   | 1894/3000 [2:07:36<1:02:13,  3.38s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  63%|######3   | 1895/3000 [2:07:36<57:25,  3.12s/it, lr: 1.0e-04 loss: 1.816e-01]  mindexpander_qwen_v1:  63%|######3   | 1895/3000 [2:07:36<57:25,  3.12s/it, lr: 1.0e-04 loss: 1.816e-01]  mindexpander_qwen_v1:  63%|######3   | 1895/3000 [2:07:42<57:25,  3.12s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  63%|######3   | 1895/3000 [2:07:42<57:25,  3.12s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  63%|######3   | 1896/3000 [2:07:42<1:11:13,  3.87s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  63%|######3   | 1896/3000 [2:07:42<1:11:13,  3.87s/it, lr: 1.0e-04 loss: 1.022e-01]mindexpander_qwen_v1:  63%|######3   | 1896/3000 [2:07:48<1:11:13,  3.87s/it, lr: 1.0e-04 loss: 1.438e-02]mindexpander_qwen_v1:  63%|######3   | 1896/3000 [2:07:48<1:11:13,  3.87s/it, lr: 1.0e-04 loss: 1.438e-02]mindexpander_qwen_v1:  63%|######3   | 1897/3000 [2:07:48<1:21:13,  4.42s/it, lr: 1.0e-04 loss: 1.438e-02]mindexpander_qwen_v1:  63%|######3   | 1897/3000 [2:07:48<1:21:13,  4.42s/it, lr: 1.0e-04 loss: 1.438e-02]mindexpander_qwen_v1:  63%|######3   | 1897/3000 [2:07:51<1:21:13,  4.42s/it, lr: 1.0e-04 loss: 2.783e-02]mindexpander_qwen_v1:  63%|######3   | 1897/3000 [2:07:51<1:21:13,  4.42s/it, lr: 1.0e-04 loss: 2.783e-02]mindexpander_qwen_v1:  63%|######3   | 1898/3000 [2:07:51<1:18:26,  4.27s/it, lr: 1.0e-04 loss: 2.783e-02]mindexpander_qwen_v1:  63%|######3   | 1898/3000 [2:07:51<1:18:26,  4.27s/it, lr: 1.0e-04 loss: 2.783e-02]mindexpander_qwen_v1:  63%|######3   | 1898/3000 [2:07:57<1:18:26,  4.27s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  63%|######3   | 1898/3000 [2:07:57<1:18:26,  4.27s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  63%|######3   | 1899/3000 [2:07:57<1:26:24,  4.71s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  63%|######3   | 1899/3000 [2:07:57<1:26:24,  4.71s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  63%|######3   | 1899/3000 [2:08:03<1:26:24,  4.71s/it, lr: 1.0e-04 loss: 1.314e-02]mindexpander_qwen_v1:  63%|######3   | 1899/3000 [2:08:03<1:26:24,  4.71s/it, lr: 1.0e-04 loss: 1.314e-02]mindexpander_qwen_v1:  63%|######3   | 1900/3000 [2:08:09<1:26:20,  4.71s/it, lr: 1.0e-04 loss: 1.615e-02]mindexpander_qwen_v1:  63%|######3   | 1900/3000 [2:08:09<1:26:20,  4.71s/it, lr: 1.0e-04 loss: 1.615e-02]mindexpander_qwen_v1:  63%|######3   | 1901/3000 [2:08:09<1:10:55,  3.87s/it, lr: 1.0e-04 loss: 1.615e-02]mindexpander_qwen_v1:  63%|######3   | 1901/3000 [2:08:09<1:10:55,  3.87s/it, lr: 1.0e-04 loss: 1.615e-02]mindexpander_qwen_v1:  63%|######3   | 1901/3000 [2:08:15<1:10:55,  3.87s/it, lr: 1.0e-04 loss: 7.912e-02]mindexpander_qwen_v1:  63%|######3   | 1901/3000 [2:08:15<1:10:55,  3.87s/it, lr: 1.0e-04 loss: 7.912e-02]mindexpander_qwen_v1:  63%|######3   | 1902/3000 [2:08:15<1:19:57,  4.37s/it, lr: 1.0e-04 loss: 7.912e-02]mindexpander_qwen_v1:  63%|######3   | 1902/3000 [2:08:15<1:19:57,  4.37s/it, lr: 1.0e-04 loss: 7.912e-02]mindexpander_qwen_v1:  63%|######3   | 1902/3000 [2:08:20<1:19:57,  4.37s/it, lr: 1.0e-04 loss: 1.115e-01]mindexpander_qwen_v1:  63%|######3   | 1902/3000 [2:08:20<1:19:57,  4.37s/it, lr: 1.0e-04 loss: 1.115e-01]mindexpander_qwen_v1:  63%|######3   | 1903/3000 [2:08:20<1:26:29,  4.73s/it, lr: 1.0e-04 loss: 1.115e-01]mindexpander_qwen_v1:  63%|######3   | 1903/3000 [2:08:20<1:26:29,  4.73s/it, lr: 1.0e-04 loss: 1.115e-01]mindexpander_qwen_v1:  63%|######3   | 1903/3000 [2:08:24<1:26:29,  4.73s/it, lr: 1.0e-04 loss: 1.092e-01]mindexpander_qwen_v1:  63%|######3   | 1903/3000 [2:08:24<1:26:29,  4.73s/it, lr: 1.0e-04 loss: 1.092e-01]mindexpander_qwen_v1:  63%|######3   | 1904/3000 [2:08:24<1:21:31,  4.46s/it, lr: 1.0e-04 loss: 1.092e-01]mindexpander_qwen_v1:  63%|######3   | 1904/3000 [2:08:24<1:21:31,  4.46s/it, lr: 1.0e-04 loss: 1.092e-01]mindexpander_qwen_v1:  63%|######3   | 1904/3000 [2:08:27<1:21:31,  4.46s/it, lr: 1.0e-04 loss: 8.397e-02]mindexpander_qwen_v1:  63%|######3   | 1904/3000 [2:08:27<1:21:31,  4.46s/it, lr: 1.0e-04 loss: 8.397e-02]mindexpander_qwen_v1:  64%|######3   | 1905/3000 [2:08:27<1:11:11,  3.90s/it, lr: 1.0e-04 loss: 8.397e-02]mindexpander_qwen_v1:  64%|######3   | 1905/3000 [2:08:27<1:11:11,  3.90s/it, lr: 1.0e-04 loss: 8.397e-02]mindexpander_qwen_v1:  64%|######3   | 1905/3000 [2:08:29<1:11:11,  3.90s/it, lr: 1.0e-04 loss: 1.265e-01]mindexpander_qwen_v1:  64%|######3   | 1905/3000 [2:08:29<1:11:11,  3.90s/it, lr: 1.0e-04 loss: 1.265e-01]mindexpander_qwen_v1:  64%|######3   | 1906/3000 [2:08:29<1:04:41,  3.55s/it, lr: 1.0e-04 loss: 1.265e-01]mindexpander_qwen_v1:  64%|######3   | 1906/3000 [2:08:29<1:04:41,  3.55s/it, lr: 1.0e-04 loss: 1.265e-01]mindexpander_qwen_v1:  64%|######3   | 1906/3000 [2:08:33<1:04:41,  3.55s/it, lr: 1.0e-04 loss: 7.092e-02]mindexpander_qwen_v1:  64%|######3   | 1906/3000 [2:08:33<1:04:41,  3.55s/it, lr: 1.0e-04 loss: 7.092e-02]mindexpander_qwen_v1:  64%|######3   | 1907/3000 [2:08:33<1:05:38,  3.60s/it, lr: 1.0e-04 loss: 7.092e-02]mindexpander_qwen_v1:  64%|######3   | 1907/3000 [2:08:33<1:05:38,  3.60s/it, lr: 1.0e-04 loss: 7.092e-02]mindexpander_qwen_v1:  64%|######3   | 1907/3000 [2:08:37<1:05:38,  3.60s/it, lr: 1.0e-04 loss: 2.163e-02]mindexpander_qwen_v1:  64%|######3   | 1907/3000 [2:08:37<1:05:38,  3.60s/it, lr: 1.0e-04 loss: 2.163e-02]mindexpander_qwen_v1:  64%|######3   | 1908/3000 [2:08:37<1:06:21,  3.65s/it, lr: 1.0e-04 loss: 2.163e-02]mindexpander_qwen_v1:  64%|######3   | 1908/3000 [2:08:37<1:06:21,  3.65s/it, lr: 1.0e-04 loss: 2.163e-02]mindexpander_qwen_v1:  64%|######3   | 1908/3000 [2:08:39<1:06:21,  3.65s/it, lr: 1.0e-04 loss: 7.828e-02]mindexpander_qwen_v1:  64%|######3   | 1908/3000 [2:08:39<1:06:21,  3.65s/it, lr: 1.0e-04 loss: 7.828e-02]mindexpander_qwen_v1:  64%|######3   | 1909/3000 [2:08:39<59:53,  3.29s/it, lr: 1.0e-04 loss: 7.828e-02]  mindexpander_qwen_v1:  64%|######3   | 1909/3000 [2:08:39<59:53,  3.29s/it, lr: 1.0e-04 loss: 7.828e-02]  mindexpander_qwen_v1:  64%|######3   | 1909/3000 [2:08:42<59:53,  3.29s/it, lr: 1.0e-04 loss: 1.840e-01]mindexpander_qwen_v1:  64%|######3   | 1909/3000 [2:08:42<59:53,  3.29s/it, lr: 1.0e-04 loss: 1.840e-01]mindexpander_qwen_v1:  64%|######3   | 1910/3000 [2:08:44<59:50,  3.29s/it, lr: 1.0e-04 loss: 5.130e-02]mindexpander_qwen_v1:  64%|######3   | 1910/3000 [2:08:44<59:50,  3.29s/it, lr: 1.0e-04 loss: 5.130e-02]mindexpander_qwen_v1:  64%|######3   | 1911/3000 [2:08:44<42:36,  2.35s/it, lr: 1.0e-04 loss: 5.130e-02]mindexpander_qwen_v1:  64%|######3   | 1911/3000 [2:08:44<42:36,  2.35s/it, lr: 1.0e-04 loss: 5.130e-02]mindexpander_qwen_v1:  64%|######3   | 1911/3000 [2:08:47<42:36,  2.35s/it, lr: 1.0e-04 loss: 8.980e-02]mindexpander_qwen_v1:  64%|######3   | 1911/3000 [2:08:47<42:36,  2.35s/it, lr: 1.0e-04 loss: 8.980e-02]mindexpander_qwen_v1:  64%|######3   | 1912/3000 [2:08:47<43:01,  2.37s/it, lr: 1.0e-04 loss: 8.980e-02]mindexpander_qwen_v1:  64%|######3   | 1912/3000 [2:08:47<43:01,  2.37s/it, lr: 1.0e-04 loss: 8.980e-02]mindexpander_qwen_v1:  64%|######3   | 1912/3000 [2:08:52<43:01,  2.37s/it, lr: 1.0e-04 loss: 1.081e-02]mindexpander_qwen_v1:  64%|######3   | 1912/3000 [2:08:52<43:01,  2.37s/it, lr: 1.0e-04 loss: 1.081e-02]mindexpander_qwen_v1:  64%|######3   | 1913/3000 [2:08:52<58:55,  3.25s/it, lr: 1.0e-04 loss: 1.081e-02]mindexpander_qwen_v1:  64%|######3   | 1913/3000 [2:08:52<58:55,  3.25s/it, lr: 1.0e-04 loss: 1.081e-02]mindexpander_qwen_v1:  64%|######3   | 1913/3000 [2:08:56<58:55,  3.25s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  64%|######3   | 1913/3000 [2:08:56<58:55,  3.25s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  64%|######3   | 1914/3000 [2:08:56<1:02:02,  3.43s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  64%|######3   | 1914/3000 [2:08:56<1:02:02,  3.43s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  64%|######3   | 1914/3000 [2:09:00<1:02:02,  3.43s/it, lr: 1.0e-04 loss: 4.196e-02]mindexpander_qwen_v1:  64%|######3   | 1914/3000 [2:09:00<1:02:02,  3.43s/it, lr: 1.0e-04 loss: 4.196e-02]mindexpander_qwen_v1:  64%|######3   | 1915/3000 [2:09:00<1:03:34,  3.52s/it, lr: 1.0e-04 loss: 4.196e-02]mindexpander_qwen_v1:  64%|######3   | 1915/3000 [2:09:00<1:03:34,  3.52s/it, lr: 1.0e-04 loss: 4.196e-02]mindexpander_qwen_v1:  64%|######3   | 1915/3000 [2:09:03<1:03:34,  3.52s/it, lr: 1.0e-04 loss: 9.634e-02]mindexpander_qwen_v1:  64%|######3   | 1915/3000 [2:09:03<1:03:34,  3.52s/it, lr: 1.0e-04 loss: 9.634e-02]mindexpander_qwen_v1:  64%|######3   | 1916/3000 [2:09:03<58:00,  3.21s/it, lr: 1.0e-04 loss: 9.634e-02]  mindexpander_qwen_v1:  64%|######3   | 1916/3000 [2:09:03<58:00,  3.21s/it, lr: 1.0e-04 loss: 9.634e-02]  mindexpander_qwen_v1:  64%|######3   | 1916/3000 [2:09:05<58:00,  3.21s/it, lr: 1.0e-04 loss: 4.289e-02]mindexpander_qwen_v1:  64%|######3   | 1916/3000 [2:09:05<58:00,  3.21s/it, lr: 1.0e-04 loss: 4.289e-02]mindexpander_qwen_v1:  64%|######3   | 1917/3000 [2:09:05<53:57,  2.99s/it, lr: 1.0e-04 loss: 4.289e-02]mindexpander_qwen_v1:  64%|######3   | 1917/3000 [2:09:05<53:57,  2.99s/it, lr: 1.0e-04 loss: 4.289e-02]mindexpander_qwen_v1:  64%|######3   | 1917/3000 [2:09:11<53:57,  2.99s/it, lr: 1.0e-04 loss: 3.309e-02]mindexpander_qwen_v1:  64%|######3   | 1917/3000 [2:09:11<53:57,  2.99s/it, lr: 1.0e-04 loss: 3.309e-02]mindexpander_qwen_v1:  64%|######3   | 1918/3000 [2:09:11<1:09:08,  3.83s/it, lr: 1.0e-04 loss: 3.309e-02]mindexpander_qwen_v1:  64%|######3   | 1918/3000 [2:09:11<1:09:08,  3.83s/it, lr: 1.0e-04 loss: 3.309e-02]mindexpander_qwen_v1:  64%|######3   | 1918/3000 [2:09:15<1:09:08,  3.83s/it, lr: 1.0e-04 loss: 3.764e-02]mindexpander_qwen_v1:  64%|######3   | 1918/3000 [2:09:15<1:09:08,  3.83s/it, lr: 1.0e-04 loss: 3.764e-02]mindexpander_qwen_v1:  64%|######3   | 1919/3000 [2:09:15<1:08:36,  3.81s/it, lr: 1.0e-04 loss: 3.764e-02]mindexpander_qwen_v1:  64%|######3   | 1919/3000 [2:09:15<1:08:36,  3.81s/it, lr: 1.0e-04 loss: 3.764e-02]mindexpander_qwen_v1:  64%|######3   | 1919/3000 [2:09:21<1:08:36,  3.81s/it, lr: 1.0e-04 loss: 1.561e-02]mindexpander_qwen_v1:  64%|######3   | 1919/3000 [2:09:21<1:08:36,  3.81s/it, lr: 1.0e-04 loss: 1.561e-02]mindexpander_qwen_v1:  64%|######4   | 1920/3000 [2:09:24<1:08:32,  3.81s/it, lr: 1.0e-04 loss: 3.729e-02]mindexpander_qwen_v1:  64%|######4   | 1920/3000 [2:09:24<1:08:32,  3.81s/it, lr: 1.0e-04 loss: 3.729e-02]mindexpander_qwen_v1:  64%|######4   | 1921/3000 [2:09:25<52:37,  2.93s/it, lr: 1.0e-04 loss: 3.729e-02]  mindexpander_qwen_v1:  64%|######4   | 1921/3000 [2:09:25<52:37,  2.93s/it, lr: 1.0e-04 loss: 3.729e-02]  mindexpander_qwen_v1:  64%|######4   | 1921/3000 [2:09:30<52:37,  2.93s/it, lr: 1.0e-04 loss: 9.006e-02]mindexpander_qwen_v1:  64%|######4   | 1921/3000 [2:09:30<52:37,  2.93s/it, lr: 1.0e-04 loss: 9.006e-02]mindexpander_qwen_v1:  64%|######4   | 1922/3000 [2:09:30<1:06:03,  3.68s/it, lr: 1.0e-04 loss: 9.006e-02]mindexpander_qwen_v1:  64%|######4   | 1922/3000 [2:09:30<1:06:03,  3.68s/it, lr: 1.0e-04 loss: 9.006e-02]mindexpander_qwen_v1:  64%|######4   | 1922/3000 [2:09:36<1:06:03,  3.68s/it, lr: 1.0e-04 loss: 1.349e-01]mindexpander_qwen_v1:  64%|######4   | 1922/3000 [2:09:36<1:06:03,  3.68s/it, lr: 1.0e-04 loss: 1.349e-01]mindexpander_qwen_v1:  64%|######4   | 1923/3000 [2:09:36<1:15:45,  4.22s/it, lr: 1.0e-04 loss: 1.349e-01]mindexpander_qwen_v1:  64%|######4   | 1923/3000 [2:09:36<1:15:45,  4.22s/it, lr: 1.0e-04 loss: 1.349e-01]mindexpander_qwen_v1:  64%|######4   | 1923/3000 [2:09:40<1:15:45,  4.22s/it, lr: 1.0e-04 loss: 9.050e-02]mindexpander_qwen_v1:  64%|######4   | 1923/3000 [2:09:40<1:15:45,  4.22s/it, lr: 1.0e-04 loss: 9.050e-02]mindexpander_qwen_v1:  64%|######4   | 1924/3000 [2:09:40<1:13:23,  4.09s/it, lr: 1.0e-04 loss: 9.050e-02]mindexpander_qwen_v1:  64%|######4   | 1924/3000 [2:09:40<1:13:23,  4.09s/it, lr: 1.0e-04 loss: 9.050e-02]mindexpander_qwen_v1:  64%|######4   | 1924/3000 [2:09:46<1:13:23,  4.09s/it, lr: 1.0e-04 loss: 1.345e-01]mindexpander_qwen_v1:  64%|######4   | 1924/3000 [2:09:46<1:13:23,  4.09s/it, lr: 1.0e-04 loss: 1.345e-01]mindexpander_qwen_v1:  64%|######4   | 1925/3000 [2:09:46<1:21:36,  4.56s/it, lr: 1.0e-04 loss: 1.345e-01]mindexpander_qwen_v1:  64%|######4   | 1925/3000 [2:09:46<1:21:36,  4.56s/it, lr: 1.0e-04 loss: 1.345e-01]mindexpander_qwen_v1:  64%|######4   | 1925/3000 [2:09:50<1:21:36,  4.56s/it, lr: 1.0e-04 loss: 1.893e-02]mindexpander_qwen_v1:  64%|######4   | 1925/3000 [2:09:50<1:21:36,  4.56s/it, lr: 1.0e-04 loss: 1.893e-02]mindexpander_qwen_v1:  64%|######4   | 1926/3000 [2:09:50<1:18:22,  4.38s/it, lr: 1.0e-04 loss: 1.893e-02]mindexpander_qwen_v1:  64%|######4   | 1926/3000 [2:09:50<1:18:22,  4.38s/it, lr: 1.0e-04 loss: 1.893e-02]mindexpander_qwen_v1:  64%|######4   | 1926/3000 [2:09:52<1:18:22,  4.38s/it, lr: 1.0e-04 loss: 1.397e-01]mindexpander_qwen_v1:  64%|######4   | 1926/3000 [2:09:52<1:18:22,  4.38s/it, lr: 1.0e-04 loss: 1.397e-01]mindexpander_qwen_v1:  64%|######4   | 1927/3000 [2:09:52<1:08:25,  3.83s/it, lr: 1.0e-04 loss: 1.397e-01]mindexpander_qwen_v1:  64%|######4   | 1927/3000 [2:09:52<1:08:25,  3.83s/it, lr: 1.0e-04 loss: 1.397e-01]mindexpander_qwen_v1:  64%|######4   | 1927/3000 [2:09:55<1:08:25,  3.83s/it, lr: 1.0e-04 loss: 1.175e-01]mindexpander_qwen_v1:  64%|######4   | 1927/3000 [2:09:55<1:08:25,  3.83s/it, lr: 1.0e-04 loss: 1.175e-01]mindexpander_qwen_v1:  64%|######4   | 1928/3000 [2:09:55<1:01:15,  3.43s/it, lr: 1.0e-04 loss: 1.175e-01]mindexpander_qwen_v1:  64%|######4   | 1928/3000 [2:09:55<1:01:15,  3.43s/it, lr: 1.0e-04 loss: 1.175e-01]mindexpander_qwen_v1:  64%|######4   | 1928/3000 [2:09:57<1:01:15,  3.43s/it, lr: 1.0e-04 loss: 1.025e-03]mindexpander_qwen_v1:  64%|######4   | 1928/3000 [2:09:57<1:01:15,  3.43s/it, lr: 1.0e-04 loss: 1.025e-03]mindexpander_qwen_v1:  64%|######4   | 1929/3000 [2:09:57<56:04,  3.14s/it, lr: 1.0e-04 loss: 1.025e-03]  mindexpander_qwen_v1:  64%|######4   | 1929/3000 [2:09:57<56:04,  3.14s/it, lr: 1.0e-04 loss: 1.025e-03]  mindexpander_qwen_v1:  64%|######4   | 1929/3000 [2:10:03<56:04,  3.14s/it, lr: 1.0e-04 loss: 6.204e-02]mindexpander_qwen_v1:  64%|######4   | 1929/3000 [2:10:03<56:04,  3.14s/it, lr: 1.0e-04 loss: 6.204e-02]mindexpander_qwen_v1:  64%|######4   | 1930/3000 [2:10:09<56:01,  3.14s/it, lr: 1.0e-04 loss: 1.339e-02]mindexpander_qwen_v1:  64%|######4   | 1930/3000 [2:10:09<56:01,  3.14s/it, lr: 1.0e-04 loss: 1.339e-02]mindexpander_qwen_v1:  64%|######4   | 1931/3000 [2:10:09<53:52,  3.02s/it, lr: 1.0e-04 loss: 1.339e-02]mindexpander_qwen_v1:  64%|######4   | 1931/3000 [2:10:09<53:52,  3.02s/it, lr: 1.0e-04 loss: 1.339e-02]mindexpander_qwen_v1:  64%|######4   | 1931/3000 [2:10:11<53:52,  3.02s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  64%|######4   | 1931/3000 [2:10:11<53:52,  3.02s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  64%|######4   | 1932/3000 [2:10:11<51:24,  2.89s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  64%|######4   | 1932/3000 [2:10:11<51:24,  2.89s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  64%|######4   | 1932/3000 [2:10:14<51:24,  2.89s/it, lr: 1.0e-04 loss: 9.824e-02]mindexpander_qwen_v1:  64%|######4   | 1932/3000 [2:10:14<51:24,  2.89s/it, lr: 1.0e-04 loss: 9.824e-02]mindexpander_qwen_v1:  64%|######4   | 1933/3000 [2:10:14<49:26,  2.78s/it, lr: 1.0e-04 loss: 9.824e-02]mindexpander_qwen_v1:  64%|######4   | 1933/3000 [2:10:14<49:26,  2.78s/it, lr: 1.0e-04 loss: 9.824e-02]mindexpander_qwen_v1:  64%|######4   | 1933/3000 [2:10:18<49:26,  2.78s/it, lr: 1.0e-04 loss: 2.358e-02]mindexpander_qwen_v1:  64%|######4   | 1933/3000 [2:10:18<49:26,  2.78s/it, lr: 1.0e-04 loss: 2.358e-02]mindexpander_qwen_v1:  64%|######4   | 1934/3000 [2:10:18<55:01,  3.10s/it, lr: 1.0e-04 loss: 2.358e-02]mindexpander_qwen_v1:  64%|######4   | 1934/3000 [2:10:18<55:01,  3.10s/it, lr: 1.0e-04 loss: 2.358e-02]mindexpander_qwen_v1:  64%|######4   | 1934/3000 [2:10:21<55:01,  3.10s/it, lr: 1.0e-04 loss: 4.712e-02]mindexpander_qwen_v1:  64%|######4   | 1934/3000 [2:10:21<55:01,  3.10s/it, lr: 1.0e-04 loss: 4.712e-02]mindexpander_qwen_v1:  64%|######4   | 1935/3000 [2:10:21<58:11,  3.28s/it, lr: 1.0e-04 loss: 4.712e-02]mindexpander_qwen_v1:  64%|######4   | 1935/3000 [2:10:21<58:11,  3.28s/it, lr: 1.0e-04 loss: 4.712e-02]mindexpander_qwen_v1:  64%|######4   | 1935/3000 [2:10:25<58:11,  3.28s/it, lr: 1.0e-04 loss: 1.772e-01]mindexpander_qwen_v1:  64%|######4   | 1935/3000 [2:10:25<58:11,  3.28s/it, lr: 1.0e-04 loss: 1.772e-01]mindexpander_qwen_v1:  65%|######4   | 1936/3000 [2:10:25<1:00:28,  3.41s/it, lr: 1.0e-04 loss: 1.772e-01]mindexpander_qwen_v1:  65%|######4   | 1936/3000 [2:10:25<1:00:28,  3.41s/it, lr: 1.0e-04 loss: 1.772e-01]mindexpander_qwen_v1:  65%|######4   | 1936/3000 [2:10:31<1:00:28,  3.41s/it, lr: 1.0e-04 loss: 1.160e-02]mindexpander_qwen_v1:  65%|######4   | 1936/3000 [2:10:31<1:00:28,  3.41s/it, lr: 1.0e-04 loss: 1.160e-02]mindexpander_qwen_v1:  65%|######4   | 1937/3000 [2:10:31<1:12:26,  4.09s/it, lr: 1.0e-04 loss: 1.160e-02]mindexpander_qwen_v1:  65%|######4   | 1937/3000 [2:10:31<1:12:26,  4.09s/it, lr: 1.0e-04 loss: 1.160e-02]mindexpander_qwen_v1:  65%|######4   | 1937/3000 [2:10:37<1:12:26,  4.09s/it, lr: 1.0e-04 loss: 1.095e-02]mindexpander_qwen_v1:  65%|######4   | 1937/3000 [2:10:37<1:12:26,  4.09s/it, lr: 1.0e-04 loss: 1.095e-02]mindexpander_qwen_v1:  65%|######4   | 1938/3000 [2:10:37<1:21:44,  4.62s/it, lr: 1.0e-04 loss: 1.095e-02]mindexpander_qwen_v1:  65%|######4   | 1938/3000 [2:10:37<1:21:44,  4.62s/it, lr: 1.0e-04 loss: 1.095e-02]mindexpander_qwen_v1:  65%|######4   | 1938/3000 [2:10:43<1:21:44,  4.62s/it, lr: 1.0e-04 loss: 1.294e-02]mindexpander_qwen_v1:  65%|######4   | 1938/3000 [2:10:43<1:21:44,  4.62s/it, lr: 1.0e-04 loss: 1.294e-02]mindexpander_qwen_v1:  65%|######4   | 1939/3000 [2:10:43<1:27:36,  4.95s/it, lr: 1.0e-04 loss: 1.294e-02]mindexpander_qwen_v1:  65%|######4   | 1939/3000 [2:10:43<1:27:36,  4.95s/it, lr: 1.0e-04 loss: 1.294e-02]mindexpander_qwen_v1:  65%|######4   | 1939/3000 [2:10:45<1:27:36,  4.95s/it, lr: 1.0e-04 loss: 1.452e-02]mindexpander_qwen_v1:  65%|######4   | 1939/3000 [2:10:45<1:27:36,  4.95s/it, lr: 1.0e-04 loss: 1.452e-02]mindexpander_qwen_v1:  65%|######4   | 1940/3000 [2:10:49<1:27:31,  4.95s/it, lr: 1.0e-04 loss: 1.500e-01]mindexpander_qwen_v1:  65%|######4   | 1940/3000 [2:10:49<1:27:31,  4.95s/it, lr: 1.0e-04 loss: 1.500e-01]mindexpander_qwen_v1:  65%|######4   | 1941/3000 [2:10:49<1:02:34,  3.55s/it, lr: 1.0e-04 loss: 1.500e-01]mindexpander_qwen_v1:  65%|######4   | 1941/3000 [2:10:49<1:02:34,  3.55s/it, lr: 1.0e-04 loss: 1.500e-01]mindexpander_qwen_v1:  65%|######4   | 1941/3000 [2:10:53<1:02:34,  3.55s/it, lr: 1.0e-04 loss: 2.258e-02]mindexpander_qwen_v1:  65%|######4   | 1941/3000 [2:10:53<1:02:34,  3.55s/it, lr: 1.0e-04 loss: 2.258e-02]mindexpander_qwen_v1:  65%|######4   | 1942/3000 [2:10:53<1:04:11,  3.64s/it, lr: 1.0e-04 loss: 2.258e-02]mindexpander_qwen_v1:  65%|######4   | 1942/3000 [2:10:53<1:04:11,  3.64s/it, lr: 1.0e-04 loss: 2.258e-02]mindexpander_qwen_v1:  65%|######4   | 1942/3000 [2:10:56<1:04:11,  3.64s/it, lr: 1.0e-04 loss: 2.916e-02]mindexpander_qwen_v1:  65%|######4   | 1942/3000 [2:10:56<1:04:11,  3.64s/it, lr: 1.0e-04 loss: 2.916e-02]mindexpander_qwen_v1:  65%|######4   | 1943/3000 [2:10:56<1:04:38,  3.67s/it, lr: 1.0e-04 loss: 2.916e-02]mindexpander_qwen_v1:  65%|######4   | 1943/3000 [2:10:56<1:04:38,  3.67s/it, lr: 1.0e-04 loss: 2.916e-02]mindexpander_qwen_v1:  65%|######4   | 1943/3000 [2:11:02<1:04:38,  3.67s/it, lr: 1.0e-04 loss: 1.766e-01]mindexpander_qwen_v1:  65%|######4   | 1943/3000 [2:11:02<1:04:38,  3.67s/it, lr: 1.0e-04 loss: 1.766e-01]mindexpander_qwen_v1:  65%|######4   | 1944/3000 [2:11:02<1:14:33,  4.24s/it, lr: 1.0e-04 loss: 1.766e-01]mindexpander_qwen_v1:  65%|######4   | 1944/3000 [2:11:02<1:14:33,  4.24s/it, lr: 1.0e-04 loss: 1.766e-01]mindexpander_qwen_v1:  65%|######4   | 1944/3000 [2:11:05<1:14:33,  4.24s/it, lr: 1.0e-04 loss: 1.430e-01]mindexpander_qwen_v1:  65%|######4   | 1944/3000 [2:11:05<1:14:33,  4.24s/it, lr: 1.0e-04 loss: 1.430e-01]mindexpander_qwen_v1:  65%|######4   | 1945/3000 [2:11:05<1:05:43,  3.74s/it, lr: 1.0e-04 loss: 1.430e-01]mindexpander_qwen_v1:  65%|######4   | 1945/3000 [2:11:05<1:05:43,  3.74s/it, lr: 1.0e-04 loss: 1.430e-01]mindexpander_qwen_v1:  65%|######4   | 1945/3000 [2:11:07<1:05:43,  3.74s/it, lr: 1.0e-04 loss: 5.307e-02]mindexpander_qwen_v1:  65%|######4   | 1945/3000 [2:11:07<1:05:43,  3.74s/it, lr: 1.0e-04 loss: 5.307e-02]mindexpander_qwen_v1:  65%|######4   | 1946/3000 [2:11:07<1:00:13,  3.43s/it, lr: 1.0e-04 loss: 5.307e-02]mindexpander_qwen_v1:  65%|######4   | 1946/3000 [2:11:07<1:00:13,  3.43s/it, lr: 1.0e-04 loss: 5.307e-02]mindexpander_qwen_v1:  65%|######4   | 1946/3000 [2:11:10<1:00:13,  3.43s/it, lr: 1.0e-04 loss: 1.835e-01]mindexpander_qwen_v1:  65%|######4   | 1946/3000 [2:11:10<1:00:13,  3.43s/it, lr: 1.0e-04 loss: 1.835e-01]mindexpander_qwen_v1:  65%|######4   | 1947/3000 [2:11:10<55:12,  3.15s/it, lr: 1.0e-04 loss: 1.835e-01]  mindexpander_qwen_v1:  65%|######4   | 1947/3000 [2:11:10<55:12,  3.15s/it, lr: 1.0e-04 loss: 1.835e-01]  mindexpander_qwen_v1:  65%|######4   | 1947/3000 [2:11:12<55:12,  3.15s/it, lr: 1.0e-04 loss: 8.489e-02]mindexpander_qwen_v1:  65%|######4   | 1947/3000 [2:11:12<55:12,  3.15s/it, lr: 1.0e-04 loss: 8.489e-02]mindexpander_qwen_v1:  65%|######4   | 1948/3000 [2:11:12<51:33,  2.94s/it, lr: 1.0e-04 loss: 8.489e-02]mindexpander_qwen_v1:  65%|######4   | 1948/3000 [2:11:12<51:33,  2.94s/it, lr: 1.0e-04 loss: 8.489e-02]mindexpander_qwen_v1:  65%|######4   | 1948/3000 [2:11:16<51:33,  2.94s/it, lr: 1.0e-04 loss: 6.562e-03]mindexpander_qwen_v1:  65%|######4   | 1948/3000 [2:11:16<51:33,  2.94s/it, lr: 1.0e-04 loss: 6.562e-03]mindexpander_qwen_v1:  65%|######4   | 1949/3000 [2:11:16<55:41,  3.18s/it, lr: 1.0e-04 loss: 6.562e-03]mindexpander_qwen_v1:  65%|######4   | 1949/3000 [2:11:16<55:41,  3.18s/it, lr: 1.0e-04 loss: 6.562e-03]mindexpander_qwen_v1:  65%|######4   | 1949/3000 [2:11:22<55:41,  3.18s/it, lr: 1.0e-04 loss: 6.468e-02]mindexpander_qwen_v1:  65%|######4   | 1949/3000 [2:11:22<55:41,  3.18s/it, lr: 1.0e-04 loss: 6.468e-02]mindexpander_qwen_v1:  65%|######5   | 1950/3000 [2:11:25<55:37,  3.18s/it, lr: 1.0e-04 loss: 1.844e-01]mindexpander_qwen_v1:  65%|######5   | 1950/3000 [2:11:25<55:37,  3.18s/it, lr: 1.0e-04 loss: 1.844e-01]mindexpander_qwen_v1:  65%|######5   | 1951/3000 [2:11:25<40:04,  2.29s/it, lr: 1.0e-04 loss: 1.844e-01]mindexpander_qwen_v1:  65%|######5   | 1951/3000 [2:11:25<40:04,  2.29s/it, lr: 1.0e-04 loss: 1.844e-01]mindexpander_qwen_v1:  65%|######5   | 1951/3000 [2:11:29<40:04,  2.29s/it, lr: 1.0e-04 loss: 2.637e-02]mindexpander_qwen_v1:  65%|######5   | 1951/3000 [2:11:29<40:04,  2.29s/it, lr: 1.0e-04 loss: 2.637e-02]mindexpander_qwen_v1:  65%|######5   | 1952/3000 [2:11:29<46:15,  2.65s/it, lr: 1.0e-04 loss: 2.637e-02]mindexpander_qwen_v1:  65%|######5   | 1952/3000 [2:11:29<46:15,  2.65s/it, lr: 1.0e-04 loss: 2.637e-02]mindexpander_qwen_v1:  65%|######5   | 1952/3000 [2:11:32<46:15,  2.65s/it, lr: 1.0e-04 loss: 9.345e-02]mindexpander_qwen_v1:  65%|######5   | 1952/3000 [2:11:32<46:15,  2.65s/it, lr: 1.0e-04 loss: 9.345e-02]mindexpander_qwen_v1:  65%|######5   | 1953/3000 [2:11:32<51:11,  2.93s/it, lr: 1.0e-04 loss: 9.345e-02]mindexpander_qwen_v1:  65%|######5   | 1953/3000 [2:11:32<51:11,  2.93s/it, lr: 1.0e-04 loss: 9.345e-02]mindexpander_qwen_v1:  65%|######5   | 1953/3000 [2:11:35<51:11,  2.93s/it, lr: 1.0e-04 loss: 8.444e-02]mindexpander_qwen_v1:  65%|######5   | 1953/3000 [2:11:35<51:11,  2.93s/it, lr: 1.0e-04 loss: 8.444e-02]mindexpander_qwen_v1:  65%|######5   | 1954/3000 [2:11:35<49:50,  2.86s/it, lr: 1.0e-04 loss: 8.444e-02]mindexpander_qwen_v1:  65%|######5   | 1954/3000 [2:11:35<49:50,  2.86s/it, lr: 1.0e-04 loss: 8.444e-02]mindexpander_qwen_v1:  65%|######5   | 1954/3000 [2:11:37<49:50,  2.86s/it, lr: 1.0e-04 loss: 5.693e-02]mindexpander_qwen_v1:  65%|######5   | 1954/3000 [2:11:37<49:50,  2.86s/it, lr: 1.0e-04 loss: 5.693e-02]mindexpander_qwen_v1:  65%|######5   | 1955/3000 [2:11:37<47:49,  2.75s/it, lr: 1.0e-04 loss: 5.693e-02]mindexpander_qwen_v1:  65%|######5   | 1955/3000 [2:11:37<47:49,  2.75s/it, lr: 1.0e-04 loss: 5.693e-02]mindexpander_qwen_v1:  65%|######5   | 1955/3000 [2:11:40<47:49,  2.75s/it, lr: 1.0e-04 loss: 2.627e-02]mindexpander_qwen_v1:  65%|######5   | 1955/3000 [2:11:40<47:49,  2.75s/it, lr: 1.0e-04 loss: 2.627e-02]mindexpander_qwen_v1:  65%|######5   | 1956/3000 [2:11:40<46:22,  2.67s/it, lr: 1.0e-04 loss: 2.627e-02]mindexpander_qwen_v1:  65%|######5   | 1956/3000 [2:11:40<46:22,  2.67s/it, lr: 1.0e-04 loss: 2.627e-02]mindexpander_qwen_v1:  65%|######5   | 1956/3000 [2:11:46<46:22,  2.67s/it, lr: 1.0e-04 loss: 8.406e-03]mindexpander_qwen_v1:  65%|######5   | 1956/3000 [2:11:46<46:22,  2.67s/it, lr: 1.0e-04 loss: 8.406e-03]mindexpander_qwen_v1:  65%|######5   | 1957/3000 [2:11:46<1:01:52,  3.56s/it, lr: 1.0e-04 loss: 8.406e-03]mindexpander_qwen_v1:  65%|######5   | 1957/3000 [2:11:46<1:01:52,  3.56s/it, lr: 1.0e-04 loss: 8.406e-03]mindexpander_qwen_v1:  65%|######5   | 1957/3000 [2:11:48<1:01:52,  3.56s/it, lr: 1.0e-04 loss: 1.052e-02]mindexpander_qwen_v1:  65%|######5   | 1957/3000 [2:11:48<1:01:52,  3.56s/it, lr: 1.0e-04 loss: 1.052e-02]mindexpander_qwen_v1:  65%|######5   | 1958/3000 [2:11:48<57:15,  3.30s/it, lr: 1.0e-04 loss: 1.052e-02]  mindexpander_qwen_v1:  65%|######5   | 1958/3000 [2:11:48<57:15,  3.30s/it, lr: 1.0e-04 loss: 1.052e-02]  mindexpander_qwen_v1:  65%|######5   | 1958/3000 [2:11:52<57:15,  3.30s/it, lr: 1.0e-04 loss: 9.491e-02]mindexpander_qwen_v1:  65%|######5   | 1958/3000 [2:11:52<57:15,  3.30s/it, lr: 1.0e-04 loss: 9.491e-02]mindexpander_qwen_v1:  65%|######5   | 1959/3000 [2:11:52<59:28,  3.43s/it, lr: 1.0e-04 loss: 9.491e-02]mindexpander_qwen_v1:  65%|######5   | 1959/3000 [2:11:52<59:28,  3.43s/it, lr: 1.0e-04 loss: 9.491e-02]mindexpander_qwen_v1:  65%|######5   | 1959/3000 [2:11:56<59:28,  3.43s/it, lr: 1.0e-04 loss: 8.836e-02]mindexpander_qwen_v1:  65%|######5   | 1959/3000 [2:11:56<59:28,  3.43s/it, lr: 1.0e-04 loss: 8.836e-02]mindexpander_qwen_v1:  65%|######5   | 1960/3000 [2:12:02<59:25,  3.43s/it, lr: 1.0e-04 loss: 4.211e-03]mindexpander_qwen_v1:  65%|######5   | 1960/3000 [2:12:02<59:25,  3.43s/it, lr: 1.0e-04 loss: 4.211e-03]mindexpander_qwen_v1:  65%|######5   | 1961/3000 [2:12:02<55:01,  3.18s/it, lr: 1.0e-04 loss: 4.211e-03]mindexpander_qwen_v1:  65%|######5   | 1961/3000 [2:12:02<55:01,  3.18s/it, lr: 1.0e-04 loss: 4.211e-03]mindexpander_qwen_v1:  65%|######5   | 1961/3000 [2:12:04<55:01,  3.18s/it, lr: 1.0e-04 loss: 1.957e-01]mindexpander_qwen_v1:  65%|######5   | 1961/3000 [2:12:04<55:01,  3.18s/it, lr: 1.0e-04 loss: 1.957e-01]mindexpander_qwen_v1:  65%|######5   | 1962/3000 [2:12:04<52:44,  3.05s/it, lr: 1.0e-04 loss: 1.957e-01]mindexpander_qwen_v1:  65%|######5   | 1962/3000 [2:12:04<52:44,  3.05s/it, lr: 1.0e-04 loss: 1.957e-01]mindexpander_qwen_v1:  65%|######5   | 1962/3000 [2:12:08<52:44,  3.05s/it, lr: 1.0e-04 loss: 1.642e-01]mindexpander_qwen_v1:  65%|######5   | 1962/3000 [2:12:08<52:44,  3.05s/it, lr: 1.0e-04 loss: 1.642e-01]mindexpander_qwen_v1:  65%|######5   | 1963/3000 [2:12:08<55:49,  3.23s/it, lr: 1.0e-04 loss: 1.642e-01]mindexpander_qwen_v1:  65%|######5   | 1963/3000 [2:12:08<55:49,  3.23s/it, lr: 1.0e-04 loss: 1.642e-01]mindexpander_qwen_v1:  65%|######5   | 1963/3000 [2:12:14<55:49,  3.23s/it, lr: 1.0e-04 loss: 2.707e-02]mindexpander_qwen_v1:  65%|######5   | 1963/3000 [2:12:14<55:49,  3.23s/it, lr: 1.0e-04 loss: 2.707e-02]mindexpander_qwen_v1:  65%|######5   | 1964/3000 [2:12:14<1:07:36,  3.92s/it, lr: 1.0e-04 loss: 2.707e-02]mindexpander_qwen_v1:  65%|######5   | 1964/3000 [2:12:14<1:07:36,  3.92s/it, lr: 1.0e-04 loss: 2.707e-02]mindexpander_qwen_v1:  65%|######5   | 1964/3000 [2:12:19<1:07:36,  3.92s/it, lr: 1.0e-04 loss: 2.517e-02]mindexpander_qwen_v1:  65%|######5   | 1964/3000 [2:12:19<1:07:36,  3.92s/it, lr: 1.0e-04 loss: 2.517e-02]mindexpander_qwen_v1:  66%|######5   | 1965/3000 [2:12:19<1:16:24,  4.43s/it, lr: 1.0e-04 loss: 2.517e-02]mindexpander_qwen_v1:  66%|######5   | 1965/3000 [2:12:19<1:16:24,  4.43s/it, lr: 1.0e-04 loss: 2.517e-02]mindexpander_qwen_v1:  66%|######5   | 1965/3000 [2:12:23<1:16:24,  4.43s/it, lr: 1.0e-04 loss: 1.299e-01]mindexpander_qwen_v1:  66%|######5   | 1965/3000 [2:12:23<1:16:24,  4.43s/it, lr: 1.0e-04 loss: 1.299e-01]mindexpander_qwen_v1:  66%|######5   | 1966/3000 [2:12:23<1:13:48,  4.28s/it, lr: 1.0e-04 loss: 1.299e-01]mindexpander_qwen_v1:  66%|######5   | 1966/3000 [2:12:23<1:13:48,  4.28s/it, lr: 1.0e-04 loss: 1.299e-01]mindexpander_qwen_v1:  66%|######5   | 1966/3000 [2:12:27<1:13:48,  4.28s/it, lr: 1.0e-04 loss: 4.357e-02]mindexpander_qwen_v1:  66%|######5   | 1966/3000 [2:12:27<1:13:48,  4.28s/it, lr: 1.0e-04 loss: 4.357e-02]mindexpander_qwen_v1:  66%|######5   | 1967/3000 [2:12:27<1:11:04,  4.13s/it, lr: 1.0e-04 loss: 4.357e-02]mindexpander_qwen_v1:  66%|######5   | 1967/3000 [2:12:27<1:11:04,  4.13s/it, lr: 1.0e-04 loss: 4.357e-02]mindexpander_qwen_v1:  66%|######5   | 1967/3000 [2:12:30<1:11:04,  4.13s/it, lr: 1.0e-04 loss: 1.685e-01]mindexpander_qwen_v1:  66%|######5   | 1967/3000 [2:12:30<1:11:04,  4.13s/it, lr: 1.0e-04 loss: 1.685e-01]mindexpander_qwen_v1:  66%|######5   | 1968/3000 [2:12:30<1:02:34,  3.64s/it, lr: 1.0e-04 loss: 1.685e-01]mindexpander_qwen_v1:  66%|######5   | 1968/3000 [2:12:30<1:02:34,  3.64s/it, lr: 1.0e-04 loss: 1.685e-01]mindexpander_qwen_v1:  66%|######5   | 1968/3000 [2:12:35<1:02:34,  3.64s/it, lr: 1.0e-04 loss: 8.451e-02]mindexpander_qwen_v1:  66%|######5   | 1968/3000 [2:12:35<1:02:34,  3.64s/it, lr: 1.0e-04 loss: 8.451e-02]mindexpander_qwen_v1:  66%|######5   | 1969/3000 [2:12:35<1:13:17,  4.27s/it, lr: 1.0e-04 loss: 8.451e-02]mindexpander_qwen_v1:  66%|######5   | 1969/3000 [2:12:35<1:13:17,  4.27s/it, lr: 1.0e-04 loss: 8.451e-02]mindexpander_qwen_v1:  66%|######5   | 1969/3000 [2:12:38<1:13:17,  4.27s/it, lr: 1.0e-04 loss: 1.597e-01]mindexpander_qwen_v1:  66%|######5   | 1969/3000 [2:12:38<1:13:17,  4.27s/it, lr: 1.0e-04 loss: 1.597e-01]mindexpander_qwen_v1:  66%|######5   | 1970/3000 [2:12:40<1:13:13,  4.27s/it, lr: 1.0e-04 loss: 1.714e-01]mindexpander_qwen_v1:  66%|######5   | 1970/3000 [2:12:40<1:13:13,  4.27s/it, lr: 1.0e-04 loss: 1.714e-01]mindexpander_qwen_v1:  66%|######5   | 1971/3000 [2:12:40<49:18,  2.88s/it, lr: 1.0e-04 loss: 1.714e-01]  mindexpander_qwen_v1:  66%|######5   | 1971/3000 [2:12:40<49:18,  2.88s/it, lr: 1.0e-04 loss: 1.714e-01]  mindexpander_qwen_v1:  66%|######5   | 1971/3000 [2:12:46<49:18,  2.88s/it, lr: 1.0e-04 loss: 2.116e-02]mindexpander_qwen_v1:  66%|######5   | 1971/3000 [2:12:46<49:18,  2.88s/it, lr: 1.0e-04 loss: 2.116e-02]mindexpander_qwen_v1:  66%|######5   | 1972/3000 [2:12:46<1:01:27,  3.59s/it, lr: 1.0e-04 loss: 2.116e-02]mindexpander_qwen_v1:  66%|######5   | 1972/3000 [2:12:46<1:01:27,  3.59s/it, lr: 1.0e-04 loss: 2.116e-02]mindexpander_qwen_v1:  66%|######5   | 1972/3000 [2:12:50<1:01:27,  3.59s/it, lr: 1.0e-04 loss: 2.943e-02]mindexpander_qwen_v1:  66%|######5   | 1972/3000 [2:12:50<1:01:27,  3.59s/it, lr: 1.0e-04 loss: 2.943e-02]mindexpander_qwen_v1:  66%|######5   | 1973/3000 [2:12:50<1:02:07,  3.63s/it, lr: 1.0e-04 loss: 2.943e-02]mindexpander_qwen_v1:  66%|######5   | 1973/3000 [2:12:50<1:02:07,  3.63s/it, lr: 1.0e-04 loss: 2.943e-02]mindexpander_qwen_v1:  66%|######5   | 1973/3000 [2:12:53<1:02:07,  3.63s/it, lr: 1.0e-04 loss: 1.353e-01]mindexpander_qwen_v1:  66%|######5   | 1973/3000 [2:12:53<1:02:07,  3.63s/it, lr: 1.0e-04 loss: 1.353e-01]mindexpander_qwen_v1:  66%|######5   | 1974/3000 [2:12:53<57:30,  3.36s/it, lr: 1.0e-04 loss: 1.353e-01]  mindexpander_qwen_v1:  66%|######5   | 1974/3000 [2:12:53<57:30,  3.36s/it, lr: 1.0e-04 loss: 1.353e-01]  mindexpander_qwen_v1:  66%|######5   | 1974/3000 [2:12:56<57:30,  3.36s/it, lr: 1.0e-04 loss: 6.810e-02]mindexpander_qwen_v1:  66%|######5   | 1974/3000 [2:12:56<57:30,  3.36s/it, lr: 1.0e-04 loss: 6.810e-02]mindexpander_qwen_v1:  66%|######5   | 1975/3000 [2:12:56<59:20,  3.47s/it, lr: 1.0e-04 loss: 6.810e-02]mindexpander_qwen_v1:  66%|######5   | 1975/3000 [2:12:56<59:20,  3.47s/it, lr: 1.0e-04 loss: 6.810e-02]mindexpander_qwen_v1:  66%|######5   | 1975/3000 [2:13:02<59:20,  3.47s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  66%|######5   | 1975/3000 [2:13:02<59:20,  3.47s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  66%|######5   | 1976/3000 [2:13:02<1:10:29,  4.13s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  66%|######5   | 1976/3000 [2:13:02<1:10:29,  4.13s/it, lr: 1.0e-04 loss: 1.839e-01]mindexpander_qwen_v1:  66%|######5   | 1976/3000 [2:13:08<1:10:29,  4.13s/it, lr: 1.0e-04 loss: 1.309e-01]mindexpander_qwen_v1:  66%|######5   | 1976/3000 [2:13:08<1:10:29,  4.13s/it, lr: 1.0e-04 loss: 1.309e-01]mindexpander_qwen_v1:  66%|######5   | 1977/3000 [2:13:08<1:18:28,  4.60s/it, lr: 1.0e-04 loss: 1.309e-01]mindexpander_qwen_v1:  66%|######5   | 1977/3000 [2:13:08<1:18:28,  4.60s/it, lr: 1.0e-04 loss: 1.309e-01]mindexpander_qwen_v1:  66%|######5   | 1977/3000 [2:13:12<1:18:28,  4.60s/it, lr: 1.0e-04 loss: 1.379e-01]mindexpander_qwen_v1:  66%|######5   | 1977/3000 [2:13:12<1:18:28,  4.60s/it, lr: 1.0e-04 loss: 1.379e-01]mindexpander_qwen_v1:  66%|######5   | 1978/3000 [2:13:12<1:14:53,  4.40s/it, lr: 1.0e-04 loss: 1.379e-01]mindexpander_qwen_v1:  66%|######5   | 1978/3000 [2:13:12<1:14:53,  4.40s/it, lr: 1.0e-04 loss: 1.379e-01]mindexpander_qwen_v1:  66%|######5   | 1978/3000 [2:13:18<1:14:53,  4.40s/it, lr: 1.0e-04 loss: 2.947e-02]mindexpander_qwen_v1:  66%|######5   | 1978/3000 [2:13:18<1:14:53,  4.40s/it, lr: 1.0e-04 loss: 2.947e-02]mindexpander_qwen_v1:  66%|######5   | 1979/3000 [2:13:18<1:21:38,  4.80s/it, lr: 1.0e-04 loss: 2.947e-02]mindexpander_qwen_v1:  66%|######5   | 1979/3000 [2:13:18<1:21:38,  4.80s/it, lr: 1.0e-04 loss: 2.947e-02]mindexpander_qwen_v1:  66%|######5   | 1979/3000 [2:13:22<1:21:38,  4.80s/it, lr: 1.0e-04 loss: 5.859e-02]mindexpander_qwen_v1:  66%|######5   | 1979/3000 [2:13:22<1:21:38,  4.80s/it, lr: 1.0e-04 loss: 5.859e-02]mindexpander_qwen_v1:  66%|######6   | 1980/3000 [2:13:24<1:21:33,  4.80s/it, lr: 1.0e-04 loss: 1.795e-01]mindexpander_qwen_v1:  66%|######6   | 1980/3000 [2:13:24<1:21:33,  4.80s/it, lr: 1.0e-04 loss: 1.795e-01]mindexpander_qwen_v1:  66%|######6   | 1981/3000 [2:13:24<53:48,  3.17s/it, lr: 1.0e-04 loss: 1.795e-01]  mindexpander_qwen_v1:  66%|######6   | 1981/3000 [2:13:24<53:48,  3.17s/it, lr: 1.0e-04 loss: 1.795e-01]  mindexpander_qwen_v1:  66%|######6   | 1981/3000 [2:13:28<53:48,  3.17s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  66%|######6   | 1981/3000 [2:13:28<53:48,  3.17s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  66%|######6   | 1982/3000 [2:13:28<57:14,  3.37s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  66%|######6   | 1982/3000 [2:13:28<57:14,  3.37s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  66%|######6   | 1982/3000 [2:13:34<57:14,  3.37s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:  66%|######6   | 1982/3000 [2:13:34<57:14,  3.37s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:  66%|######6   | 1983/3000 [2:13:34<1:07:45,  4.00s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:  66%|######6   | 1983/3000 [2:13:34<1:07:45,  4.00s/it, lr: 1.0e-04 loss: 1.687e-01]mindexpander_qwen_v1:  66%|######6   | 1983/3000 [2:13:36<1:07:45,  4.00s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  66%|######6   | 1983/3000 [2:13:36<1:07:45,  4.00s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  66%|######6   | 1984/3000 [2:13:36<1:00:36,  3.58s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  66%|######6   | 1984/3000 [2:13:36<1:00:36,  3.58s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  66%|######6   | 1984/3000 [2:13:42<1:00:36,  3.58s/it, lr: 1.0e-04 loss: 6.177e-02]mindexpander_qwen_v1:  66%|######6   | 1984/3000 [2:13:42<1:00:36,  3.58s/it, lr: 1.0e-04 loss: 6.177e-02]mindexpander_qwen_v1:  66%|######6   | 1985/3000 [2:13:42<1:10:51,  4.19s/it, lr: 1.0e-04 loss: 6.177e-02]mindexpander_qwen_v1:  66%|######6   | 1985/3000 [2:13:42<1:10:51,  4.19s/it, lr: 1.0e-04 loss: 6.177e-02]mindexpander_qwen_v1:  66%|######6   | 1985/3000 [2:13:45<1:10:51,  4.19s/it, lr: 1.0e-04 loss: 2.102e-02]mindexpander_qwen_v1:  66%|######6   | 1985/3000 [2:13:45<1:10:51,  4.19s/it, lr: 1.0e-04 loss: 2.102e-02]mindexpander_qwen_v1:  66%|######6   | 1986/3000 [2:13:45<1:03:32,  3.76s/it, lr: 1.0e-04 loss: 2.102e-02]mindexpander_qwen_v1:  66%|######6   | 1986/3000 [2:13:45<1:03:32,  3.76s/it, lr: 1.0e-04 loss: 2.102e-02]mindexpander_qwen_v1:  66%|######6   | 1986/3000 [2:13:49<1:03:32,  3.76s/it, lr: 1.0e-04 loss: 4.321e-02]mindexpander_qwen_v1:  66%|######6   | 1986/3000 [2:13:49<1:03:32,  3.76s/it, lr: 1.0e-04 loss: 4.321e-02]mindexpander_qwen_v1:  66%|######6   | 1987/3000 [2:13:49<1:03:24,  3.76s/it, lr: 1.0e-04 loss: 4.321e-02]mindexpander_qwen_v1:  66%|######6   | 1987/3000 [2:13:49<1:03:24,  3.76s/it, lr: 1.0e-04 loss: 4.321e-02]mindexpander_qwen_v1:  66%|######6   | 1987/3000 [2:13:52<1:03:24,  3.76s/it, lr: 1.0e-04 loss: 7.199e-02]mindexpander_qwen_v1:  66%|######6   | 1987/3000 [2:13:52<1:03:24,  3.76s/it, lr: 1.0e-04 loss: 7.199e-02]mindexpander_qwen_v1:  66%|######6   | 1988/3000 [2:13:52<1:03:20,  3.76s/it, lr: 1.0e-04 loss: 7.199e-02]mindexpander_qwen_v1:  66%|######6   | 1988/3000 [2:13:52<1:03:20,  3.76s/it, lr: 1.0e-04 loss: 7.199e-02]mindexpander_qwen_v1:  66%|######6   | 1988/3000 [2:13:58<1:03:20,  3.76s/it, lr: 1.0e-04 loss: 1.432e-02]mindexpander_qwen_v1:  66%|######6   | 1988/3000 [2:13:58<1:03:20,  3.76s/it, lr: 1.0e-04 loss: 1.432e-02]mindexpander_qwen_v1:  66%|######6   | 1989/3000 [2:13:58<1:13:16,  4.35s/it, lr: 1.0e-04 loss: 1.432e-02]mindexpander_qwen_v1:  66%|######6   | 1989/3000 [2:13:58<1:13:16,  4.35s/it, lr: 1.0e-04 loss: 1.432e-02]mindexpander_qwen_v1:  66%|######6   | 1989/3000 [2:14:02<1:13:16,  4.35s/it, lr: 1.0e-04 loss: 1.276e-01]mindexpander_qwen_v1:  66%|######6   | 1989/3000 [2:14:02<1:13:16,  4.35s/it, lr: 1.0e-04 loss: 1.276e-01]mindexpander_qwen_v1:  66%|######6   | 1990/3000 [2:14:08<1:13:12,  4.35s/it, lr: 1.0e-04 loss: 3.453e-02]mindexpander_qwen_v1:  66%|######6   | 1990/3000 [2:14:08<1:13:12,  4.35s/it, lr: 1.0e-04 loss: 3.453e-02]mindexpander_qwen_v1:  66%|######6   | 1991/3000 [2:14:08<1:01:51,  3.68s/it, lr: 1.0e-04 loss: 3.453e-02]mindexpander_qwen_v1:  66%|######6   | 1991/3000 [2:14:08<1:01:51,  3.68s/it, lr: 1.0e-04 loss: 3.453e-02]mindexpander_qwen_v1:  66%|######6   | 1991/3000 [2:14:14<1:01:51,  3.68s/it, lr: 1.0e-04 loss: 5.539e-03]mindexpander_qwen_v1:  66%|######6   | 1991/3000 [2:14:14<1:01:51,  3.68s/it, lr: 1.0e-04 loss: 5.539e-03]mindexpander_qwen_v1:  66%|######6   | 1992/3000 [2:14:14<1:10:25,  4.19s/it, lr: 1.0e-04 loss: 5.539e-03]mindexpander_qwen_v1:  66%|######6   | 1992/3000 [2:14:14<1:10:25,  4.19s/it, lr: 1.0e-04 loss: 5.539e-03]mindexpander_qwen_v1:  66%|######6   | 1992/3000 [2:14:19<1:10:25,  4.19s/it, lr: 1.0e-04 loss: 1.270e-02]mindexpander_qwen_v1:  66%|######6   | 1992/3000 [2:14:19<1:10:25,  4.19s/it, lr: 1.0e-04 loss: 1.270e-02]mindexpander_qwen_v1:  66%|######6   | 1993/3000 [2:14:19<1:17:12,  4.60s/it, lr: 1.0e-04 loss: 1.270e-02]mindexpander_qwen_v1:  66%|######6   | 1993/3000 [2:14:19<1:17:12,  4.60s/it, lr: 1.0e-04 loss: 1.270e-02]mindexpander_qwen_v1:  66%|######6   | 1993/3000 [2:14:23<1:17:12,  4.60s/it, lr: 1.0e-04 loss: 7.411e-02]mindexpander_qwen_v1:  66%|######6   | 1993/3000 [2:14:23<1:17:12,  4.60s/it, lr: 1.0e-04 loss: 7.411e-02]mindexpander_qwen_v1:  66%|######6   | 1994/3000 [2:14:23<1:14:07,  4.42s/it, lr: 1.0e-04 loss: 7.411e-02]mindexpander_qwen_v1:  66%|######6   | 1994/3000 [2:14:23<1:14:07,  4.42s/it, lr: 1.0e-04 loss: 7.411e-02]mindexpander_qwen_v1:  66%|######6   | 1994/3000 [2:14:26<1:14:07,  4.42s/it, lr: 1.0e-04 loss: 7.540e-02]mindexpander_qwen_v1:  66%|######6   | 1994/3000 [2:14:26<1:14:07,  4.42s/it, lr: 1.0e-04 loss: 7.540e-02]mindexpander_qwen_v1:  66%|######6   | 1995/3000 [2:14:26<1:04:51,  3.87s/it, lr: 1.0e-04 loss: 7.540e-02]mindexpander_qwen_v1:  66%|######6   | 1995/3000 [2:14:26<1:04:51,  3.87s/it, lr: 1.0e-04 loss: 7.540e-02]mindexpander_qwen_v1:  66%|######6   | 1995/3000 [2:14:31<1:04:51,  3.87s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  66%|######6   | 1995/3000 [2:14:31<1:04:51,  3.87s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  67%|######6   | 1996/3000 [2:14:31<1:13:48,  4.41s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  67%|######6   | 1996/3000 [2:14:31<1:13:48,  4.41s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  67%|######6   | 1996/3000 [2:14:34<1:13:48,  4.41s/it, lr: 1.0e-04 loss: 1.346e-01]mindexpander_qwen_v1:  67%|######6   | 1996/3000 [2:14:34<1:13:48,  4.41s/it, lr: 1.0e-04 loss: 1.346e-01]mindexpander_qwen_v1:  67%|######6   | 1997/3000 [2:14:34<1:04:17,  3.85s/it, lr: 1.0e-04 loss: 1.346e-01]mindexpander_qwen_v1:  67%|######6   | 1997/3000 [2:14:34<1:04:17,  3.85s/it, lr: 1.0e-04 loss: 1.346e-01]mindexpander_qwen_v1:  67%|######6   | 1997/3000 [2:14:40<1:04:17,  3.85s/it, lr: 1.0e-04 loss: 1.413e-01]mindexpander_qwen_v1:  67%|######6   | 1997/3000 [2:14:40<1:04:17,  3.85s/it, lr: 1.0e-04 loss: 1.413e-01]mindexpander_qwen_v1:  67%|######6   | 1998/3000 [2:14:40<1:14:19,  4.45s/it, lr: 1.0e-04 loss: 1.413e-01]mindexpander_qwen_v1:  67%|######6   | 1998/3000 [2:14:40<1:14:19,  4.45s/it, lr: 1.0e-04 loss: 1.413e-01]mindexpander_qwen_v1:  67%|######6   | 1998/3000 [2:14:44<1:14:19,  4.45s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:  67%|######6   | 1998/3000 [2:14:44<1:14:19,  4.45s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:  67%|######6   | 1999/3000 [2:14:44<1:10:46,  4.24s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:  67%|######6   | 1999/3000 [2:14:44<1:10:46,  4.24s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:  67%|######6   | 1999/3000 [2:14:46<1:10:46,  4.24s/it, lr: 1.0e-04 loss: 1.750e-01]mindexpander_qwen_v1:  67%|######6   | 1999/3000 [2:14:46<1:10:46,  4.24s/it, lr: 1.0e-04 loss: 1.750e-01]
+Saving at step 2000
+Saved checkpoint to /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000002000.safetensors
+Saved optimizer to /app/ai-toolkit/output/mindexpander_qwen_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000001000.safetensors
+
+
+Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:   0%|          | 0/2 [00:00<?, ?it/s][A[A
+
+Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.85s/it]Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.85s/it][A[A
+
+Generating Images: 100%|##########| 2/2 [02:55<00:00, 88.02s/it]Generating Images: 100%|##########| 2/2 [02:55<00:00, 88.02s/it][A[A
+
+                                                                                                                                [A[Amindexpander_qwen_v1:  67%|######6   | 2000/3000 [2:14:50<1:10:41,  4.24s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:  67%|######6   | 2000/3000 [2:14:50<1:10:41,  4.24s/it, lr: 1.0e-04 loss: 1.572e-01]mindexpander_qwen_v1:  67%|######6   | 2001/3000 [2:14:50<53:23,  3.21s/it, lr: 1.0e-04 loss: 1.572e-01]  mindexpander_qwen_v1:  67%|######6   | 2001/3000 [2:14:50<53:23,  3.21s/it, lr: 1.0e-04 loss: 1.572e-01]  mindexpander_qwen_v1:  67%|######6   | 2001/3000 [2:14:52<53:23,  3.21s/it, lr: 1.0e-04 loss: 1.634e-01]mindexpander_qwen_v1:  67%|######6   | 2001/3000 [2:14:52<53:23,  3.21s/it, lr: 1.0e-04 loss: 1.634e-01]mindexpander_qwen_v1:  67%|######6   | 2002/3000 [2:14:52<50:13,  3.02s/it, lr: 1.0e-04 loss: 1.634e-01]mindexpander_qwen_v1:  67%|######6   | 2002/3000 [2:14:52<50:13,  3.02s/it, lr: 1.0e-04 loss: 1.634e-01]mindexpander_qwen_v1:  67%|######6   | 2002/3000 [2:14:55<50:13,  3.02s/it, lr: 1.0e-04 loss: 2.498e-02]mindexpander_qwen_v1:  67%|######6   | 2002/3000 [2:14:55<50:13,  3.02s/it, lr: 1.0e-04 loss: 2.498e-02]mindexpander_qwen_v1:  67%|######6   | 2003/3000 [2:14:55<47:43,  2.87s/it, lr: 1.0e-04 loss: 2.498e-02]mindexpander_qwen_v1:  67%|######6   | 2003/3000 [2:14:55<47:43,  2.87s/it, lr: 1.0e-04 loss: 2.498e-02]mindexpander_qwen_v1:  67%|######6   | 2003/3000 [2:14:58<47:43,  2.87s/it, lr: 1.0e-04 loss: 1.786e-01]mindexpander_qwen_v1:  67%|######6   | 2003/3000 [2:14:58<47:43,  2.87s/it, lr: 1.0e-04 loss: 1.786e-01]mindexpander_qwen_v1:  67%|######6   | 2004/3000 [2:14:58<46:43,  2.81s/it, lr: 1.0e-04 loss: 1.786e-01]mindexpander_qwen_v1:  67%|######6   | 2004/3000 [2:14:58<46:43,  2.81s/it, lr: 1.0e-04 loss: 1.786e-01]mindexpander_qwen_v1:  67%|######6   | 2004/3000 [2:15:03<46:43,  2.81s/it, lr: 1.0e-04 loss: 4.554e-03]mindexpander_qwen_v1:  67%|######6   | 2004/3000 [2:15:03<46:43,  2.81s/it, lr: 1.0e-04 loss: 4.554e-03]mindexpander_qwen_v1:  67%|######6   | 2005/3000 [2:15:03<1:00:19,  3.64s/it, lr: 1.0e-04 loss: 4.554e-03]mindexpander_qwen_v1:  67%|######6   | 2005/3000 [2:15:03<1:00:19,  3.64s/it, lr: 1.0e-04 loss: 4.554e-03]mindexpander_qwen_v1:  67%|######6   | 2005/3000 [2:15:06<1:00:19,  3.64s/it, lr: 1.0e-04 loss: 1.696e-01]mindexpander_qwen_v1:  67%|######6   | 2005/3000 [2:15:06<1:00:19,  3.64s/it, lr: 1.0e-04 loss: 1.696e-01]mindexpander_qwen_v1:  67%|######6   | 2006/3000 [2:15:06<54:38,  3.30s/it, lr: 1.0e-04 loss: 1.696e-01]  mindexpander_qwen_v1:  67%|######6   | 2006/3000 [2:15:06<54:38,  3.30s/it, lr: 1.0e-04 loss: 1.696e-01]  mindexpander_qwen_v1:  67%|######6   | 2006/3000 [2:15:09<54:38,  3.30s/it, lr: 1.0e-04 loss: 1.118e-01]mindexpander_qwen_v1:  67%|######6   | 2006/3000 [2:15:09<54:38,  3.30s/it, lr: 1.0e-04 loss: 1.118e-01]mindexpander_qwen_v1:  67%|######6   | 2007/3000 [2:15:09<56:44,  3.43s/it, lr: 1.0e-04 loss: 1.118e-01]mindexpander_qwen_v1:  67%|######6   | 2007/3000 [2:15:09<56:44,  3.43s/it, lr: 1.0e-04 loss: 1.118e-01]mindexpander_qwen_v1:  67%|######6   | 2007/3000 [2:15:15<56:44,  3.43s/it, lr: 1.0e-04 loss: 6.608e-03]mindexpander_qwen_v1:  67%|######6   | 2007/3000 [2:15:15<56:44,  3.43s/it, lr: 1.0e-04 loss: 6.608e-03]mindexpander_qwen_v1:  67%|######6   | 2008/3000 [2:15:15<1:08:38,  4.15s/it, lr: 1.0e-04 loss: 6.608e-03]mindexpander_qwen_v1:  67%|######6   | 2008/3000 [2:15:15<1:08:38,  4.15s/it, lr: 1.0e-04 loss: 6.608e-03]mindexpander_qwen_v1:  67%|######6   | 2008/3000 [2:15:19<1:08:38,  4.15s/it, lr: 1.0e-04 loss: 1.796e-01]mindexpander_qwen_v1:  67%|######6   | 2008/3000 [2:15:19<1:08:38,  4.15s/it, lr: 1.0e-04 loss: 1.796e-01]mindexpander_qwen_v1:  67%|######6   | 2009/3000 [2:15:19<1:06:29,  4.03s/it, lr: 1.0e-04 loss: 1.796e-01]mindexpander_qwen_v1:  67%|######6   | 2009/3000 [2:15:19<1:06:29,  4.03s/it, lr: 1.0e-04 loss: 1.796e-01]mindexpander_qwen_v1:  67%|######6   | 2009/3000 [2:15:23<1:06:29,  4.03s/it, lr: 1.0e-04 loss: 9.229e-04]mindexpander_qwen_v1:  67%|######6   | 2009/3000 [2:15:23<1:06:29,  4.03s/it, lr: 1.0e-04 loss: 9.229e-04]mindexpander_qwen_v1:  67%|######7   | 2010/3000 [2:15:26<1:06:25,  4.03s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  67%|######7   | 2010/3000 [2:15:26<1:06:25,  4.03s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  67%|######7   | 2011/3000 [2:15:26<45:12,  2.74s/it, lr: 1.0e-04 loss: 0.000e+00]  mindexpander_qwen_v1:  67%|######7   | 2011/3000 [2:15:26<45:12,  2.74s/it, lr: 1.0e-04 loss: 0.000e+00]  mindexpander_qwen_v1:  67%|######7   | 2011/3000 [2:15:32<45:12,  2.74s/it, lr: 1.0e-04 loss: 1.089e-02]mindexpander_qwen_v1:  67%|######7   | 2011/3000 [2:15:32<45:12,  2.74s/it, lr: 1.0e-04 loss: 1.089e-02]mindexpander_qwen_v1:  67%|######7   | 2012/3000 [2:15:32<58:08,  3.53s/it, lr: 1.0e-04 loss: 1.089e-02]mindexpander_qwen_v1:  67%|######7   | 2012/3000 [2:15:32<58:08,  3.53s/it, lr: 1.0e-04 loss: 1.089e-02]mindexpander_qwen_v1:  67%|######7   | 2012/3000 [2:15:34<58:08,  3.53s/it, lr: 1.0e-04 loss: 6.159e-02]mindexpander_qwen_v1:  67%|######7   | 2012/3000 [2:15:34<58:08,  3.53s/it, lr: 1.0e-04 loss: 6.159e-02]mindexpander_qwen_v1:  67%|######7   | 2013/3000 [2:15:34<53:30,  3.25s/it, lr: 1.0e-04 loss: 6.159e-02]mindexpander_qwen_v1:  67%|######7   | 2013/3000 [2:15:34<53:30,  3.25s/it, lr: 1.0e-04 loss: 6.159e-02]mindexpander_qwen_v1:  67%|######7   | 2013/3000 [2:15:38<53:30,  3.25s/it, lr: 1.0e-04 loss: 1.781e-02]mindexpander_qwen_v1:  67%|######7   | 2013/3000 [2:15:38<53:30,  3.25s/it, lr: 1.0e-04 loss: 1.781e-02]mindexpander_qwen_v1:  67%|######7   | 2014/3000 [2:15:38<55:40,  3.39s/it, lr: 1.0e-04 loss: 1.781e-02]mindexpander_qwen_v1:  67%|######7   | 2014/3000 [2:15:38<55:40,  3.39s/it, lr: 1.0e-04 loss: 1.781e-02]mindexpander_qwen_v1:  67%|######7   | 2014/3000 [2:15:44<55:40,  3.39s/it, lr: 1.0e-04 loss: 9.730e-02]mindexpander_qwen_v1:  67%|######7   | 2014/3000 [2:15:44<55:40,  3.39s/it, lr: 1.0e-04 loss: 9.730e-02]mindexpander_qwen_v1:  67%|######7   | 2015/3000 [2:15:44<1:06:28,  4.05s/it, lr: 1.0e-04 loss: 9.730e-02]mindexpander_qwen_v1:  67%|######7   | 2015/3000 [2:15:44<1:06:28,  4.05s/it, lr: 1.0e-04 loss: 9.730e-02]mindexpander_qwen_v1:  67%|######7   | 2015/3000 [2:15:46<1:06:28,  4.05s/it, lr: 1.0e-04 loss: 3.531e-03]mindexpander_qwen_v1:  67%|######7   | 2015/3000 [2:15:46<1:06:28,  4.05s/it, lr: 1.0e-04 loss: 3.531e-03]mindexpander_qwen_v1:  67%|######7   | 2016/3000 [2:15:46<59:52,  3.65s/it, lr: 1.0e-04 loss: 3.531e-03]  mindexpander_qwen_v1:  67%|######7   | 2016/3000 [2:15:46<59:52,  3.65s/it, lr: 1.0e-04 loss: 3.531e-03]  mindexpander_qwen_v1:  67%|######7   | 2016/3000 [2:15:50<59:52,  3.65s/it, lr: 1.0e-04 loss: 1.674e-02]mindexpander_qwen_v1:  67%|######7   | 2016/3000 [2:15:50<59:52,  3.65s/it, lr: 1.0e-04 loss: 1.674e-02]mindexpander_qwen_v1:  67%|######7   | 2017/3000 [2:15:50<1:00:13,  3.68s/it, lr: 1.0e-04 loss: 1.674e-02]mindexpander_qwen_v1:  67%|######7   | 2017/3000 [2:15:50<1:00:13,  3.68s/it, lr: 1.0e-04 loss: 1.674e-02]mindexpander_qwen_v1:  67%|######7   | 2017/3000 [2:15:52<1:00:13,  3.68s/it, lr: 1.0e-04 loss: 9.766e-02]mindexpander_qwen_v1:  67%|######7   | 2017/3000 [2:15:52<1:00:13,  3.68s/it, lr: 1.0e-04 loss: 9.766e-02]mindexpander_qwen_v1:  67%|######7   | 2018/3000 [2:15:52<54:17,  3.32s/it, lr: 1.0e-04 loss: 9.766e-02]  mindexpander_qwen_v1:  67%|######7   | 2018/3000 [2:15:52<54:17,  3.32s/it, lr: 1.0e-04 loss: 9.766e-02]  mindexpander_qwen_v1:  67%|######7   | 2018/3000 [2:15:56<54:17,  3.32s/it, lr: 1.0e-04 loss: 3.102e-02]mindexpander_qwen_v1:  67%|######7   | 2018/3000 [2:15:56<54:17,  3.32s/it, lr: 1.0e-04 loss: 3.102e-02]mindexpander_qwen_v1:  67%|######7   | 2019/3000 [2:15:56<56:27,  3.45s/it, lr: 1.0e-04 loss: 3.102e-02]mindexpander_qwen_v1:  67%|######7   | 2019/3000 [2:15:56<56:27,  3.45s/it, lr: 1.0e-04 loss: 3.102e-02]mindexpander_qwen_v1:  67%|######7   | 2019/3000 [2:16:02<56:27,  3.45s/it, lr: 1.0e-04 loss: 1.507e-01]mindexpander_qwen_v1:  67%|######7   | 2019/3000 [2:16:02<56:27,  3.45s/it, lr: 1.0e-04 loss: 1.507e-01]mindexpander_qwen_v1:  67%|######7   | 2020/3000 [2:16:05<56:23,  3.45s/it, lr: 1.0e-04 loss: 2.929e-02]mindexpander_qwen_v1:  67%|######7   | 2020/3000 [2:16:05<56:23,  3.45s/it, lr: 1.0e-04 loss: 2.929e-02]mindexpander_qwen_v1:  67%|######7   | 2021/3000 [2:16:05<39:42,  2.43s/it, lr: 1.0e-04 loss: 2.929e-02]mindexpander_qwen_v1:  67%|######7   | 2021/3000 [2:16:05<39:42,  2.43s/it, lr: 1.0e-04 loss: 2.929e-02]mindexpander_qwen_v1:  67%|######7   | 2021/3000 [2:16:07<39:42,  2.43s/it, lr: 1.0e-04 loss: 3.444e-02]mindexpander_qwen_v1:  67%|######7   | 2021/3000 [2:16:07<39:42,  2.43s/it, lr: 1.0e-04 loss: 3.444e-02]mindexpander_qwen_v1:  67%|######7   | 2022/3000 [2:16:07<39:45,  2.44s/it, lr: 1.0e-04 loss: 3.444e-02]mindexpander_qwen_v1:  67%|######7   | 2022/3000 [2:16:07<39:45,  2.44s/it, lr: 1.0e-04 loss: 3.444e-02]mindexpander_qwen_v1:  67%|######7   | 2022/3000 [2:16:11<39:45,  2.44s/it, lr: 1.0e-04 loss: 2.843e-02]mindexpander_qwen_v1:  67%|######7   | 2022/3000 [2:16:11<39:45,  2.44s/it, lr: 1.0e-04 loss: 2.843e-02]mindexpander_qwen_v1:  67%|######7   | 2023/3000 [2:16:11<45:15,  2.78s/it, lr: 1.0e-04 loss: 2.843e-02]mindexpander_qwen_v1:  67%|######7   | 2023/3000 [2:16:11<45:15,  2.78s/it, lr: 1.0e-04 loss: 2.843e-02]mindexpander_qwen_v1:  67%|######7   | 2023/3000 [2:16:17<45:15,  2.78s/it, lr: 1.0e-04 loss: 1.351e-01]mindexpander_qwen_v1:  67%|######7   | 2023/3000 [2:16:17<45:15,  2.78s/it, lr: 1.0e-04 loss: 1.351e-01]mindexpander_qwen_v1:  67%|######7   | 2024/3000 [2:16:17<58:48,  3.61s/it, lr: 1.0e-04 loss: 1.351e-01]mindexpander_qwen_v1:  67%|######7   | 2024/3000 [2:16:17<58:48,  3.61s/it, lr: 1.0e-04 loss: 1.351e-01]mindexpander_qwen_v1:  67%|######7   | 2024/3000 [2:16:19<58:48,  3.61s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  67%|######7   | 2024/3000 [2:16:19<58:48,  3.61s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  68%|######7   | 2025/3000 [2:16:19<53:28,  3.29s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  68%|######7   | 2025/3000 [2:16:19<53:28,  3.29s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  68%|######7   | 2025/3000 [2:16:22<53:28,  3.29s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  68%|######7   | 2025/3000 [2:16:22<53:28,  3.29s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  68%|######7   | 2026/3000 [2:16:22<49:32,  3.05s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  68%|######7   | 2026/3000 [2:16:22<49:32,  3.05s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  68%|######7   | 2026/3000 [2:16:27<49:32,  3.05s/it, lr: 1.0e-04 loss: 1.810e-02]mindexpander_qwen_v1:  68%|######7   | 2026/3000 [2:16:27<49:32,  3.05s/it, lr: 1.0e-04 loss: 1.810e-02]mindexpander_qwen_v1:  68%|######7   | 2027/3000 [2:16:27<1:02:13,  3.84s/it, lr: 1.0e-04 loss: 1.810e-02]mindexpander_qwen_v1:  68%|######7   | 2027/3000 [2:16:27<1:02:13,  3.84s/it, lr: 1.0e-04 loss: 1.810e-02]mindexpander_qwen_v1:  68%|######7   | 2027/3000 [2:16:31<1:02:13,  3.84s/it, lr: 1.0e-04 loss: 1.272e-01]mindexpander_qwen_v1:  68%|######7   | 2027/3000 [2:16:31<1:02:13,  3.84s/it, lr: 1.0e-04 loss: 1.272e-01]mindexpander_qwen_v1:  68%|######7   | 2028/3000 [2:16:31<1:02:27,  3.86s/it, lr: 1.0e-04 loss: 1.272e-01]mindexpander_qwen_v1:  68%|######7   | 2028/3000 [2:16:31<1:02:27,  3.86s/it, lr: 1.0e-04 loss: 1.272e-01]mindexpander_qwen_v1:  68%|######7   | 2028/3000 [2:16:37<1:02:27,  3.86s/it, lr: 1.0e-04 loss: 1.121e-01]mindexpander_qwen_v1:  68%|######7   | 2028/3000 [2:16:37<1:02:27,  3.86s/it, lr: 1.0e-04 loss: 1.121e-01]mindexpander_qwen_v1:  68%|######7   | 2029/3000 [2:16:37<1:11:29,  4.42s/it, lr: 1.0e-04 loss: 1.121e-01]mindexpander_qwen_v1:  68%|######7   | 2029/3000 [2:16:37<1:11:29,  4.42s/it, lr: 1.0e-04 loss: 1.121e-01]mindexpander_qwen_v1:  68%|######7   | 2029/3000 [2:16:39<1:11:29,  4.42s/it, lr: 1.0e-04 loss: 7.940e-02]mindexpander_qwen_v1:  68%|######7   | 2029/3000 [2:16:39<1:11:29,  4.42s/it, lr: 1.0e-04 loss: 7.940e-02]mindexpander_qwen_v1:  68%|######7   | 2030/3000 [2:16:43<1:11:24,  4.42s/it, lr: 1.0e-04 loss: 1.488e-01]mindexpander_qwen_v1:  68%|######7   | 2030/3000 [2:16:43<1:11:24,  4.42s/it, lr: 1.0e-04 loss: 1.488e-01]mindexpander_qwen_v1:  68%|######7   | 2031/3000 [2:16:43<52:33,  3.25s/it, lr: 1.0e-04 loss: 1.488e-01]  mindexpander_qwen_v1:  68%|######7   | 2031/3000 [2:16:43<52:33,  3.25s/it, lr: 1.0e-04 loss: 1.488e-01]  mindexpander_qwen_v1:  68%|######7   | 2031/3000 [2:16:47<52:33,  3.25s/it, lr: 1.0e-04 loss: 7.061e-02]mindexpander_qwen_v1:  68%|######7   | 2031/3000 [2:16:47<52:33,  3.25s/it, lr: 1.0e-04 loss: 7.061e-02]mindexpander_qwen_v1:  68%|######7   | 2032/3000 [2:16:47<55:01,  3.41s/it, lr: 1.0e-04 loss: 7.061e-02]mindexpander_qwen_v1:  68%|######7   | 2032/3000 [2:16:47<55:01,  3.41s/it, lr: 1.0e-04 loss: 7.061e-02]mindexpander_qwen_v1:  68%|######7   | 2032/3000 [2:16:51<55:01,  3.41s/it, lr: 1.0e-04 loss: 3.853e-02]mindexpander_qwen_v1:  68%|######7   | 2032/3000 [2:16:51<55:01,  3.41s/it, lr: 1.0e-04 loss: 3.853e-02]mindexpander_qwen_v1:  68%|######7   | 2033/3000 [2:16:51<56:24,  3.50s/it, lr: 1.0e-04 loss: 3.853e-02]mindexpander_qwen_v1:  68%|######7   | 2033/3000 [2:16:51<56:24,  3.50s/it, lr: 1.0e-04 loss: 3.853e-02]mindexpander_qwen_v1:  68%|######7   | 2033/3000 [2:16:57<56:24,  3.50s/it, lr: 1.0e-04 loss: 1.679e-01]mindexpander_qwen_v1:  68%|######7   | 2033/3000 [2:16:57<56:24,  3.50s/it, lr: 1.0e-04 loss: 1.679e-01]mindexpander_qwen_v1:  68%|######7   | 2034/3000 [2:16:57<1:06:10,  4.11s/it, lr: 1.0e-04 loss: 1.679e-01]mindexpander_qwen_v1:  68%|######7   | 2034/3000 [2:16:57<1:06:10,  4.11s/it, lr: 1.0e-04 loss: 1.679e-01]mindexpander_qwen_v1:  68%|######7   | 2034/3000 [2:17:02<1:06:10,  4.11s/it, lr: 1.0e-04 loss: 1.529e-01]mindexpander_qwen_v1:  68%|######7   | 2034/3000 [2:17:02<1:06:10,  4.11s/it, lr: 1.0e-04 loss: 1.529e-01]mindexpander_qwen_v1:  68%|######7   | 2035/3000 [2:17:02<1:13:34,  4.57s/it, lr: 1.0e-04 loss: 1.529e-01]mindexpander_qwen_v1:  68%|######7   | 2035/3000 [2:17:02<1:13:34,  4.57s/it, lr: 1.0e-04 loss: 1.529e-01]mindexpander_qwen_v1:  68%|######7   | 2035/3000 [2:17:08<1:13:34,  4.57s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  68%|######7   | 2035/3000 [2:17:08<1:13:34,  4.57s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  68%|######7   | 2036/3000 [2:17:08<1:19:41,  4.96s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  68%|######7   | 2036/3000 [2:17:08<1:19:41,  4.96s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  68%|######7   | 2036/3000 [2:17:11<1:19:41,  4.96s/it, lr: 1.0e-04 loss: 3.377e-02]mindexpander_qwen_v1:  68%|######7   | 2036/3000 [2:17:11<1:19:41,  4.96s/it, lr: 1.0e-04 loss: 3.377e-02]mindexpander_qwen_v1:  68%|######7   | 2037/3000 [2:17:11<1:07:57,  4.23s/it, lr: 1.0e-04 loss: 3.377e-02]mindexpander_qwen_v1:  68%|######7   | 2037/3000 [2:17:11<1:07:57,  4.23s/it, lr: 1.0e-04 loss: 3.377e-02]mindexpander_qwen_v1:  68%|######7   | 2037/3000 [2:17:14<1:07:57,  4.23s/it, lr: 1.0e-04 loss: 5.631e-02]mindexpander_qwen_v1:  68%|######7   | 2037/3000 [2:17:14<1:07:57,  4.23s/it, lr: 1.0e-04 loss: 5.631e-02]mindexpander_qwen_v1:  68%|######7   | 2038/3000 [2:17:14<1:05:34,  4.09s/it, lr: 1.0e-04 loss: 5.631e-02]mindexpander_qwen_v1:  68%|######7   | 2038/3000 [2:17:14<1:05:34,  4.09s/it, lr: 1.0e-04 loss: 5.631e-02]mindexpander_qwen_v1:  68%|######7   | 2038/3000 [2:17:20<1:05:34,  4.09s/it, lr: 1.0e-04 loss: 1.149e-01]mindexpander_qwen_v1:  68%|######7   | 2038/3000 [2:17:20<1:05:34,  4.09s/it, lr: 1.0e-04 loss: 1.149e-01]mindexpander_qwen_v1:  68%|######7   | 2039/3000 [2:17:20<1:13:25,  4.58s/it, lr: 1.0e-04 loss: 1.149e-01]mindexpander_qwen_v1:  68%|######7   | 2039/3000 [2:17:20<1:13:25,  4.58s/it, lr: 1.0e-04 loss: 1.149e-01]mindexpander_qwen_v1:  68%|######7   | 2039/3000 [2:17:25<1:13:25,  4.58s/it, lr: 1.0e-04 loss: 1.508e-01]mindexpander_qwen_v1:  68%|######7   | 2039/3000 [2:17:25<1:13:25,  4.58s/it, lr: 1.0e-04 loss: 1.508e-01]mindexpander_qwen_v1:  68%|######8   | 2040/3000 [2:17:30<1:13:20,  4.58s/it, lr: 1.0e-04 loss: 7.144e-02]mindexpander_qwen_v1:  68%|######8   | 2040/3000 [2:17:30<1:13:20,  4.58s/it, lr: 1.0e-04 loss: 7.144e-02]mindexpander_qwen_v1:  68%|######8   | 2041/3000 [2:17:30<1:00:50,  3.81s/it, lr: 1.0e-04 loss: 7.144e-02]mindexpander_qwen_v1:  68%|######8   | 2041/3000 [2:17:30<1:00:50,  3.81s/it, lr: 1.0e-04 loss: 7.144e-02]mindexpander_qwen_v1:  68%|######8   | 2041/3000 [2:17:33<1:00:50,  3.81s/it, lr: 1.0e-04 loss: 1.230e-01]mindexpander_qwen_v1:  68%|######8   | 2041/3000 [2:17:33<1:00:50,  3.81s/it, lr: 1.0e-04 loss: 1.230e-01]mindexpander_qwen_v1:  68%|######8   | 2042/3000 [2:17:33<55:26,  3.47s/it, lr: 1.0e-04 loss: 1.230e-01]  mindexpander_qwen_v1:  68%|######8   | 2042/3000 [2:17:33<55:26,  3.47s/it, lr: 1.0e-04 loss: 1.230e-01]  mindexpander_qwen_v1:  68%|######8   | 2042/3000 [2:17:35<55:26,  3.47s/it, lr: 1.0e-04 loss: 1.642e-01]mindexpander_qwen_v1:  68%|######8   | 2042/3000 [2:17:35<55:26,  3.47s/it, lr: 1.0e-04 loss: 1.642e-01]mindexpander_qwen_v1:  68%|######8   | 2043/3000 [2:17:35<51:07,  3.21s/it, lr: 1.0e-04 loss: 1.642e-01]mindexpander_qwen_v1:  68%|######8   | 2043/3000 [2:17:35<51:07,  3.21s/it, lr: 1.0e-04 loss: 1.642e-01]mindexpander_qwen_v1:  68%|######8   | 2043/3000 [2:17:41<51:07,  3.21s/it, lr: 1.0e-04 loss: 2.640e-02]mindexpander_qwen_v1:  68%|######8   | 2043/3000 [2:17:41<51:07,  3.21s/it, lr: 1.0e-04 loss: 2.640e-02]mindexpander_qwen_v1:  68%|######8   | 2044/3000 [2:17:41<1:02:33,  3.93s/it, lr: 1.0e-04 loss: 2.640e-02]mindexpander_qwen_v1:  68%|######8   | 2044/3000 [2:17:41<1:02:33,  3.93s/it, lr: 1.0e-04 loss: 2.640e-02]mindexpander_qwen_v1:  68%|######8   | 2044/3000 [2:17:44<1:02:33,  3.93s/it, lr: 1.0e-04 loss: 4.381e-02]mindexpander_qwen_v1:  68%|######8   | 2044/3000 [2:17:44<1:02:33,  3.93s/it, lr: 1.0e-04 loss: 4.381e-02]mindexpander_qwen_v1:  68%|######8   | 2045/3000 [2:17:44<55:55,  3.51s/it, lr: 1.0e-04 loss: 4.381e-02]  mindexpander_qwen_v1:  68%|######8   | 2045/3000 [2:17:44<55:55,  3.51s/it, lr: 1.0e-04 loss: 4.381e-02]  mindexpander_qwen_v1:  68%|######8   | 2045/3000 [2:17:49<55:55,  3.51s/it, lr: 1.0e-04 loss: 3.260e-02]mindexpander_qwen_v1:  68%|######8   | 2045/3000 [2:17:49<55:55,  3.51s/it, lr: 1.0e-04 loss: 3.260e-02]mindexpander_qwen_v1:  68%|######8   | 2046/3000 [2:17:49<1:06:07,  4.16s/it, lr: 1.0e-04 loss: 3.260e-02]mindexpander_qwen_v1:  68%|######8   | 2046/3000 [2:17:49<1:06:07,  4.16s/it, lr: 1.0e-04 loss: 3.260e-02]mindexpander_qwen_v1:  68%|######8   | 2046/3000 [2:17:53<1:06:07,  4.16s/it, lr: 1.0e-04 loss: 1.347e-02]mindexpander_qwen_v1:  68%|######8   | 2046/3000 [2:17:53<1:06:07,  4.16s/it, lr: 1.0e-04 loss: 1.347e-02]mindexpander_qwen_v1:  68%|######8   | 2047/3000 [2:17:53<1:04:54,  4.09s/it, lr: 1.0e-04 loss: 1.347e-02]mindexpander_qwen_v1:  68%|######8   | 2047/3000 [2:17:53<1:04:54,  4.09s/it, lr: 1.0e-04 loss: 1.347e-02]mindexpander_qwen_v1:  68%|######8   | 2047/3000 [2:17:56<1:04:54,  4.09s/it, lr: 1.0e-04 loss: 8.666e-02]mindexpander_qwen_v1:  68%|######8   | 2047/3000 [2:17:56<1:04:54,  4.09s/it, lr: 1.0e-04 loss: 8.666e-02]mindexpander_qwen_v1:  68%|######8   | 2048/3000 [2:17:56<57:14,  3.61s/it, lr: 1.0e-04 loss: 8.666e-02]  mindexpander_qwen_v1:  68%|######8   | 2048/3000 [2:17:56<57:14,  3.61s/it, lr: 1.0e-04 loss: 8.666e-02]  mindexpander_qwen_v1:  68%|######8   | 2048/3000 [2:18:01<57:14,  3.61s/it, lr: 1.0e-04 loss: 1.285e-03]mindexpander_qwen_v1:  68%|######8   | 2048/3000 [2:18:01<57:14,  3.61s/it, lr: 1.0e-04 loss: 1.285e-03]mindexpander_qwen_v1:  68%|######8   | 2049/3000 [2:18:01<1:07:12,  4.24s/it, lr: 1.0e-04 loss: 1.285e-03]mindexpander_qwen_v1:  68%|######8   | 2049/3000 [2:18:01<1:07:12,  4.24s/it, lr: 1.0e-04 loss: 1.285e-03]mindexpander_qwen_v1:  68%|######8   | 2049/3000 [2:18:07<1:07:12,  4.24s/it, lr: 1.0e-04 loss: 1.272e-01]mindexpander_qwen_v1:  68%|######8   | 2049/3000 [2:18:07<1:07:12,  4.24s/it, lr: 1.0e-04 loss: 1.272e-01]mindexpander_qwen_v1:  68%|######8   | 2050/3000 [2:18:11<1:07:08,  4.24s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  68%|######8   | 2050/3000 [2:18:11<1:07:08,  4.24s/it, lr: 1.0e-04 loss: 1.558e-01]mindexpander_qwen_v1:  68%|######8   | 2051/3000 [2:18:11<49:58,  3.16s/it, lr: 1.0e-04 loss: 1.558e-01]  mindexpander_qwen_v1:  68%|######8   | 2051/3000 [2:18:11<49:58,  3.16s/it, lr: 1.0e-04 loss: 1.558e-01]  mindexpander_qwen_v1:  68%|######8   | 2051/3000 [2:18:15<49:58,  3.16s/it, lr: 1.0e-04 loss: 1.180e-01]mindexpander_qwen_v1:  68%|######8   | 2051/3000 [2:18:15<49:58,  3.16s/it, lr: 1.0e-04 loss: 1.180e-01]mindexpander_qwen_v1:  68%|######8   | 2052/3000 [2:18:15<52:58,  3.35s/it, lr: 1.0e-04 loss: 1.180e-01]mindexpander_qwen_v1:  68%|######8   | 2052/3000 [2:18:15<52:58,  3.35s/it, lr: 1.0e-04 loss: 1.180e-01]mindexpander_qwen_v1:  68%|######8   | 2052/3000 [2:18:19<52:58,  3.35s/it, lr: 1.0e-04 loss: 1.381e-02]mindexpander_qwen_v1:  68%|######8   | 2052/3000 [2:18:19<52:58,  3.35s/it, lr: 1.0e-04 loss: 1.381e-02]mindexpander_qwen_v1:  68%|######8   | 2053/3000 [2:18:19<54:31,  3.45s/it, lr: 1.0e-04 loss: 1.381e-02]mindexpander_qwen_v1:  68%|######8   | 2053/3000 [2:18:19<54:31,  3.45s/it, lr: 1.0e-04 loss: 1.381e-02]mindexpander_qwen_v1:  68%|######8   | 2053/3000 [2:18:22<54:31,  3.45s/it, lr: 1.0e-04 loss: 5.080e-02]mindexpander_qwen_v1:  68%|######8   | 2053/3000 [2:18:22<54:31,  3.45s/it, lr: 1.0e-04 loss: 5.080e-02]mindexpander_qwen_v1:  68%|######8   | 2054/3000 [2:18:22<55:41,  3.53s/it, lr: 1.0e-04 loss: 5.080e-02]mindexpander_qwen_v1:  68%|######8   | 2054/3000 [2:18:22<55:41,  3.53s/it, lr: 1.0e-04 loss: 5.080e-02]mindexpander_qwen_v1:  68%|######8   | 2054/3000 [2:18:28<55:41,  3.53s/it, lr: 1.0e-04 loss: 8.625e-02]mindexpander_qwen_v1:  68%|######8   | 2054/3000 [2:18:28<55:41,  3.53s/it, lr: 1.0e-04 loss: 8.625e-02]mindexpander_qwen_v1:  68%|######8   | 2055/3000 [2:18:28<1:06:03,  4.19s/it, lr: 1.0e-04 loss: 8.625e-02]mindexpander_qwen_v1:  68%|######8   | 2055/3000 [2:18:28<1:06:03,  4.19s/it, lr: 1.0e-04 loss: 8.625e-02]mindexpander_qwen_v1:  68%|######8   | 2055/3000 [2:18:31<1:06:03,  4.19s/it, lr: 1.0e-04 loss: 2.186e-02]mindexpander_qwen_v1:  68%|######8   | 2055/3000 [2:18:31<1:06:03,  4.19s/it, lr: 1.0e-04 loss: 2.186e-02]mindexpander_qwen_v1:  69%|######8   | 2056/3000 [2:18:31<58:10,  3.70s/it, lr: 1.0e-04 loss: 2.186e-02]  mindexpander_qwen_v1:  69%|######8   | 2056/3000 [2:18:31<58:10,  3.70s/it, lr: 1.0e-04 loss: 2.186e-02]  mindexpander_qwen_v1:  69%|######8   | 2056/3000 [2:18:33<58:10,  3.70s/it, lr: 1.0e-04 loss: 8.894e-02]mindexpander_qwen_v1:  69%|######8   | 2056/3000 [2:18:33<58:10,  3.70s/it, lr: 1.0e-04 loss: 8.894e-02]mindexpander_qwen_v1:  69%|######8   | 2057/3000 [2:18:33<52:25,  3.34s/it, lr: 1.0e-04 loss: 8.894e-02]mindexpander_qwen_v1:  69%|######8   | 2057/3000 [2:18:33<52:25,  3.34s/it, lr: 1.0e-04 loss: 8.894e-02]mindexpander_qwen_v1:  69%|######8   | 2057/3000 [2:18:36<52:25,  3.34s/it, lr: 1.0e-04 loss: 1.652e-01]mindexpander_qwen_v1:  69%|######8   | 2057/3000 [2:18:36<52:25,  3.34s/it, lr: 1.0e-04 loss: 1.652e-01]mindexpander_qwen_v1:  69%|######8   | 2058/3000 [2:18:36<48:16,  3.07s/it, lr: 1.0e-04 loss: 1.652e-01]mindexpander_qwen_v1:  69%|######8   | 2058/3000 [2:18:36<48:16,  3.07s/it, lr: 1.0e-04 loss: 1.652e-01]mindexpander_qwen_v1:  69%|######8   | 2058/3000 [2:18:40<48:16,  3.07s/it, lr: 1.0e-04 loss: 1.440e-02]mindexpander_qwen_v1:  69%|######8   | 2058/3000 [2:18:40<48:16,  3.07s/it, lr: 1.0e-04 loss: 1.440e-02]mindexpander_qwen_v1:  69%|######8   | 2059/3000 [2:18:40<52:08,  3.33s/it, lr: 1.0e-04 loss: 1.440e-02]mindexpander_qwen_v1:  69%|######8   | 2059/3000 [2:18:40<52:08,  3.33s/it, lr: 1.0e-04 loss: 1.440e-02]mindexpander_qwen_v1:  69%|######8   | 2059/3000 [2:18:43<52:08,  3.33s/it, lr: 1.0e-04 loss: 1.150e-01]mindexpander_qwen_v1:  69%|######8   | 2059/3000 [2:18:43<52:08,  3.33s/it, lr: 1.0e-04 loss: 1.150e-01]mindexpander_qwen_v1:  69%|######8   | 2060/3000 [2:18:49<52:05,  3.33s/it, lr: 1.0e-04 loss: 3.992e-02]mindexpander_qwen_v1:  69%|######8   | 2060/3000 [2:18:49<52:05,  3.33s/it, lr: 1.0e-04 loss: 3.992e-02]mindexpander_qwen_v1:  69%|######8   | 2061/3000 [2:18:49<48:51,  3.12s/it, lr: 1.0e-04 loss: 3.992e-02]mindexpander_qwen_v1:  69%|######8   | 2061/3000 [2:18:49<48:51,  3.12s/it, lr: 1.0e-04 loss: 3.992e-02]mindexpander_qwen_v1:  69%|######8   | 2061/3000 [2:18:53<48:51,  3.12s/it, lr: 1.0e-04 loss: 1.178e-02]mindexpander_qwen_v1:  69%|######8   | 2061/3000 [2:18:53<48:51,  3.12s/it, lr: 1.0e-04 loss: 1.178e-02]mindexpander_qwen_v1:  69%|######8   | 2062/3000 [2:18:53<51:12,  3.28s/it, lr: 1.0e-04 loss: 1.178e-02]mindexpander_qwen_v1:  69%|######8   | 2062/3000 [2:18:53<51:12,  3.28s/it, lr: 1.0e-04 loss: 1.178e-02]mindexpander_qwen_v1:  69%|######8   | 2062/3000 [2:18:59<51:12,  3.28s/it, lr: 1.0e-04 loss: 5.972e-02]mindexpander_qwen_v1:  69%|######8   | 2062/3000 [2:18:59<51:12,  3.28s/it, lr: 1.0e-04 loss: 5.972e-02]mindexpander_qwen_v1:  69%|######8   | 2063/3000 [2:18:59<1:01:44,  3.95s/it, lr: 1.0e-04 loss: 5.972e-02]mindexpander_qwen_v1:  69%|######8   | 2063/3000 [2:18:59<1:01:44,  3.95s/it, lr: 1.0e-04 loss: 5.972e-02]mindexpander_qwen_v1:  69%|######8   | 2063/3000 [2:19:01<1:01:44,  3.95s/it, lr: 1.0e-04 loss: 1.763e-02]mindexpander_qwen_v1:  69%|######8   | 2063/3000 [2:19:01<1:01:44,  3.95s/it, lr: 1.0e-04 loss: 1.763e-02]mindexpander_qwen_v1:  69%|######8   | 2064/3000 [2:19:01<55:17,  3.54s/it, lr: 1.0e-04 loss: 1.763e-02]  mindexpander_qwen_v1:  69%|######8   | 2064/3000 [2:19:01<55:17,  3.54s/it, lr: 1.0e-04 loss: 1.763e-02]  mindexpander_qwen_v1:  69%|######8   | 2064/3000 [2:19:07<55:17,  3.54s/it, lr: 1.0e-04 loss: 5.404e-02]mindexpander_qwen_v1:  69%|######8   | 2064/3000 [2:19:07<55:17,  3.54s/it, lr: 1.0e-04 loss: 5.404e-02]mindexpander_qwen_v1:  69%|######8   | 2065/3000 [2:19:07<1:04:51,  4.16s/it, lr: 1.0e-04 loss: 5.404e-02]mindexpander_qwen_v1:  69%|######8   | 2065/3000 [2:19:07<1:04:51,  4.16s/it, lr: 1.0e-04 loss: 5.404e-02]mindexpander_qwen_v1:  69%|######8   | 2065/3000 [2:19:09<1:04:51,  4.16s/it, lr: 1.0e-04 loss: 5.291e-02]mindexpander_qwen_v1:  69%|######8   | 2065/3000 [2:19:09<1:04:51,  4.16s/it, lr: 1.0e-04 loss: 5.291e-02]mindexpander_qwen_v1:  69%|######8   | 2066/3000 [2:19:09<57:11,  3.67s/it, lr: 1.0e-04 loss: 5.291e-02]  mindexpander_qwen_v1:  69%|######8   | 2066/3000 [2:19:09<57:11,  3.67s/it, lr: 1.0e-04 loss: 5.291e-02]  mindexpander_qwen_v1:  69%|######8   | 2066/3000 [2:19:15<57:11,  3.67s/it, lr: 1.0e-04 loss: 1.579e-01]mindexpander_qwen_v1:  69%|######8   | 2066/3000 [2:19:15<57:11,  3.67s/it, lr: 1.0e-04 loss: 1.579e-01]mindexpander_qwen_v1:  69%|######8   | 2067/3000 [2:19:15<1:07:05,  4.32s/it, lr: 1.0e-04 loss: 1.579e-01]mindexpander_qwen_v1:  69%|######8   | 2067/3000 [2:19:15<1:07:05,  4.32s/it, lr: 1.0e-04 loss: 1.579e-01]mindexpander_qwen_v1:  69%|######8   | 2067/3000 [2:19:18<1:07:05,  4.32s/it, lr: 1.0e-04 loss: 6.758e-02]mindexpander_qwen_v1:  69%|######8   | 2067/3000 [2:19:18<1:07:05,  4.32s/it, lr: 1.0e-04 loss: 6.758e-02]mindexpander_qwen_v1:  69%|######8   | 2068/3000 [2:19:18<58:35,  3.77s/it, lr: 1.0e-04 loss: 6.758e-02]  mindexpander_qwen_v1:  69%|######8   | 2068/3000 [2:19:18<58:35,  3.77s/it, lr: 1.0e-04 loss: 6.758e-02]  mindexpander_qwen_v1:  69%|######8   | 2068/3000 [2:19:21<58:35,  3.77s/it, lr: 1.0e-04 loss: 2.869e-02]mindexpander_qwen_v1:  69%|######8   | 2068/3000 [2:19:21<58:35,  3.77s/it, lr: 1.0e-04 loss: 2.869e-02]mindexpander_qwen_v1:  69%|######8   | 2069/3000 [2:19:21<58:26,  3.77s/it, lr: 1.0e-04 loss: 2.869e-02]mindexpander_qwen_v1:  69%|######8   | 2069/3000 [2:19:21<58:26,  3.77s/it, lr: 1.0e-04 loss: 2.869e-02]mindexpander_qwen_v1:  69%|######8   | 2069/3000 [2:19:27<58:26,  3.77s/it, lr: 1.0e-04 loss: 3.708e-02]mindexpander_qwen_v1:  69%|######8   | 2069/3000 [2:19:27<58:26,  3.77s/it, lr: 1.0e-04 loss: 3.708e-02]mindexpander_qwen_v1:  69%|######9   | 2070/3000 [2:19:33<58:22,  3.77s/it, lr: 1.0e-04 loss: 3.731e-02]mindexpander_qwen_v1:  69%|######9   | 2070/3000 [2:19:33<58:22,  3.77s/it, lr: 1.0e-04 loss: 3.731e-02]mindexpander_qwen_v1:  69%|######9   | 2071/3000 [2:19:33<52:49,  3.41s/it, lr: 1.0e-04 loss: 3.731e-02]mindexpander_qwen_v1:  69%|######9   | 2071/3000 [2:19:33<52:49,  3.41s/it, lr: 1.0e-04 loss: 3.731e-02]mindexpander_qwen_v1:  69%|######9   | 2071/3000 [2:19:39<52:49,  3.41s/it, lr: 1.0e-04 loss: 1.391e-01]mindexpander_qwen_v1:  69%|######9   | 2071/3000 [2:19:39<52:49,  3.41s/it, lr: 1.0e-04 loss: 1.391e-01]mindexpander_qwen_v1:  69%|######9   | 2072/3000 [2:19:39<1:01:42,  3.99s/it, lr: 1.0e-04 loss: 1.391e-01]mindexpander_qwen_v1:  69%|######9   | 2072/3000 [2:19:39<1:01:42,  3.99s/it, lr: 1.0e-04 loss: 1.391e-01]mindexpander_qwen_v1:  69%|######9   | 2072/3000 [2:19:45<1:01:42,  3.99s/it, lr: 1.0e-04 loss: 8.078e-02]mindexpander_qwen_v1:  69%|######9   | 2072/3000 [2:19:45<1:01:42,  3.99s/it, lr: 1.0e-04 loss: 8.078e-02]mindexpander_qwen_v1:  69%|######9   | 2073/3000 [2:19:45<1:08:46,  4.45s/it, lr: 1.0e-04 loss: 8.078e-02]mindexpander_qwen_v1:  69%|######9   | 2073/3000 [2:19:45<1:08:46,  4.45s/it, lr: 1.0e-04 loss: 8.078e-02]mindexpander_qwen_v1:  69%|######9   | 2073/3000 [2:19:47<1:08:46,  4.45s/it, lr: 1.0e-04 loss: 2.146e-02]mindexpander_qwen_v1:  69%|######9   | 2073/3000 [2:19:47<1:08:46,  4.45s/it, lr: 1.0e-04 loss: 2.146e-02]mindexpander_qwen_v1:  69%|######9   | 2074/3000 [2:19:47<1:00:22,  3.91s/it, lr: 1.0e-04 loss: 2.146e-02]mindexpander_qwen_v1:  69%|######9   | 2074/3000 [2:19:47<1:00:22,  3.91s/it, lr: 1.0e-04 loss: 2.146e-02]mindexpander_qwen_v1:  69%|######9   | 2074/3000 [2:19:53<1:00:22,  3.91s/it, lr: 1.0e-04 loss: 3.301e-02]mindexpander_qwen_v1:  69%|######9   | 2074/3000 [2:19:53<1:00:22,  3.91s/it, lr: 1.0e-04 loss: 3.301e-02]mindexpander_qwen_v1:  69%|######9   | 2075/3000 [2:19:53<1:08:56,  4.47s/it, lr: 1.0e-04 loss: 3.301e-02]mindexpander_qwen_v1:  69%|######9   | 2075/3000 [2:19:53<1:08:56,  4.47s/it, lr: 1.0e-04 loss: 3.301e-02]mindexpander_qwen_v1:  69%|######9   | 2075/3000 [2:19:57<1:08:56,  4.47s/it, lr: 1.0e-04 loss: 1.037e-01]mindexpander_qwen_v1:  69%|######9   | 2075/3000 [2:19:57<1:08:56,  4.47s/it, lr: 1.0e-04 loss: 1.037e-01]mindexpander_qwen_v1:  69%|######9   | 2076/3000 [2:19:57<1:05:46,  4.27s/it, lr: 1.0e-04 loss: 1.037e-01]mindexpander_qwen_v1:  69%|######9   | 2076/3000 [2:19:57<1:05:46,  4.27s/it, lr: 1.0e-04 loss: 1.037e-01]mindexpander_qwen_v1:  69%|######9   | 2076/3000 [2:20:01<1:05:46,  4.27s/it, lr: 1.0e-04 loss: 1.808e-01]mindexpander_qwen_v1:  69%|######9   | 2076/3000 [2:20:01<1:05:46,  4.27s/it, lr: 1.0e-04 loss: 1.808e-01]mindexpander_qwen_v1:  69%|######9   | 2077/3000 [2:20:01<1:03:22,  4.12s/it, lr: 1.0e-04 loss: 1.808e-01]mindexpander_qwen_v1:  69%|######9   | 2077/3000 [2:20:01<1:03:22,  4.12s/it, lr: 1.0e-04 loss: 1.808e-01]mindexpander_qwen_v1:  69%|######9   | 2077/3000 [2:20:05<1:03:22,  4.12s/it, lr: 1.0e-04 loss: 1.846e-01]mindexpander_qwen_v1:  69%|######9   | 2077/3000 [2:20:05<1:03:22,  4.12s/it, lr: 1.0e-04 loss: 1.846e-01]mindexpander_qwen_v1:  69%|######9   | 2078/3000 [2:20:05<1:01:38,  4.01s/it, lr: 1.0e-04 loss: 1.846e-01]mindexpander_qwen_v1:  69%|######9   | 2078/3000 [2:20:05<1:01:38,  4.01s/it, lr: 1.0e-04 loss: 1.846e-01]mindexpander_qwen_v1:  69%|######9   | 2078/3000 [2:20:07<1:01:38,  4.01s/it, lr: 1.0e-04 loss: 1.003e-01]mindexpander_qwen_v1:  69%|######9   | 2078/3000 [2:20:07<1:01:38,  4.01s/it, lr: 1.0e-04 loss: 1.003e-01]mindexpander_qwen_v1:  69%|######9   | 2079/3000 [2:20:07<55:27,  3.61s/it, lr: 1.0e-04 loss: 1.003e-01]  mindexpander_qwen_v1:  69%|######9   | 2079/3000 [2:20:07<55:27,  3.61s/it, lr: 1.0e-04 loss: 1.003e-01]  mindexpander_qwen_v1:  69%|######9   | 2079/3000 [2:20:10<55:27,  3.61s/it, lr: 1.0e-04 loss: 8.217e-02]mindexpander_qwen_v1:  69%|######9   | 2079/3000 [2:20:10<55:27,  3.61s/it, lr: 1.0e-04 loss: 8.217e-02]mindexpander_qwen_v1:  69%|######9   | 2080/3000 [2:20:12<55:23,  3.61s/it, lr: 1.0e-04 loss: 1.493e-01]mindexpander_qwen_v1:  69%|######9   | 2080/3000 [2:20:12<55:23,  3.61s/it, lr: 1.0e-04 loss: 1.493e-01]mindexpander_qwen_v1:  69%|######9   | 2081/3000 [2:20:12<38:37,  2.52s/it, lr: 1.0e-04 loss: 1.493e-01]mindexpander_qwen_v1:  69%|######9   | 2081/3000 [2:20:12<38:37,  2.52s/it, lr: 1.0e-04 loss: 1.493e-01]mindexpander_qwen_v1:  69%|######9   | 2081/3000 [2:20:15<38:37,  2.52s/it, lr: 1.0e-04 loss: 1.032e-02]mindexpander_qwen_v1:  69%|######9   | 2081/3000 [2:20:15<38:37,  2.52s/it, lr: 1.0e-04 loss: 1.032e-02]mindexpander_qwen_v1:  69%|######9   | 2082/3000 [2:20:15<38:18,  2.50s/it, lr: 1.0e-04 loss: 1.032e-02]mindexpander_qwen_v1:  69%|######9   | 2082/3000 [2:20:15<38:18,  2.50s/it, lr: 1.0e-04 loss: 1.032e-02]mindexpander_qwen_v1:  69%|######9   | 2082/3000 [2:20:18<38:18,  2.50s/it, lr: 1.0e-04 loss: 6.667e-02]mindexpander_qwen_v1:  69%|######9   | 2082/3000 [2:20:18<38:18,  2.50s/it, lr: 1.0e-04 loss: 6.667e-02]mindexpander_qwen_v1:  69%|######9   | 2083/3000 [2:20:18<43:10,  2.83s/it, lr: 1.0e-04 loss: 6.667e-02]mindexpander_qwen_v1:  69%|######9   | 2083/3000 [2:20:18<43:10,  2.83s/it, lr: 1.0e-04 loss: 6.667e-02]mindexpander_qwen_v1:  69%|######9   | 2083/3000 [2:20:21<43:10,  2.83s/it, lr: 1.0e-04 loss: 6.525e-02]mindexpander_qwen_v1:  69%|######9   | 2083/3000 [2:20:21<43:10,  2.83s/it, lr: 1.0e-04 loss: 6.525e-02]mindexpander_qwen_v1:  69%|######9   | 2084/3000 [2:20:21<42:28,  2.78s/it, lr: 1.0e-04 loss: 6.525e-02]mindexpander_qwen_v1:  69%|######9   | 2084/3000 [2:20:21<42:28,  2.78s/it, lr: 1.0e-04 loss: 6.525e-02]mindexpander_qwen_v1:  69%|######9   | 2084/3000 [2:20:27<42:28,  2.78s/it, lr: 1.0e-04 loss: 6.119e-02]mindexpander_qwen_v1:  69%|######9   | 2084/3000 [2:20:27<42:28,  2.78s/it, lr: 1.0e-04 loss: 6.119e-02]mindexpander_qwen_v1:  70%|######9   | 2085/3000 [2:20:27<55:05,  3.61s/it, lr: 1.0e-04 loss: 6.119e-02]mindexpander_qwen_v1:  70%|######9   | 2085/3000 [2:20:27<55:05,  3.61s/it, lr: 1.0e-04 loss: 6.119e-02]mindexpander_qwen_v1:  70%|######9   | 2085/3000 [2:20:31<55:05,  3.61s/it, lr: 1.0e-04 loss: 5.627e-02]mindexpander_qwen_v1:  70%|######9   | 2085/3000 [2:20:31<55:05,  3.61s/it, lr: 1.0e-04 loss: 5.627e-02]mindexpander_qwen_v1:  70%|######9   | 2086/3000 [2:20:31<55:38,  3.65s/it, lr: 1.0e-04 loss: 5.627e-02]mindexpander_qwen_v1:  70%|######9   | 2086/3000 [2:20:31<55:38,  3.65s/it, lr: 1.0e-04 loss: 5.627e-02]mindexpander_qwen_v1:  70%|######9   | 2086/3000 [2:20:33<55:38,  3.65s/it, lr: 1.0e-04 loss: 2.714e-02]mindexpander_qwen_v1:  70%|######9   | 2086/3000 [2:20:33<55:38,  3.65s/it, lr: 1.0e-04 loss: 2.714e-02]mindexpander_qwen_v1:  70%|######9   | 2087/3000 [2:20:33<50:17,  3.31s/it, lr: 1.0e-04 loss: 2.714e-02]mindexpander_qwen_v1:  70%|######9   | 2087/3000 [2:20:33<50:17,  3.31s/it, lr: 1.0e-04 loss: 2.714e-02]mindexpander_qwen_v1:  70%|######9   | 2087/3000 [2:20:37<50:17,  3.31s/it, lr: 1.0e-04 loss: 5.651e-02]mindexpander_qwen_v1:  70%|######9   | 2087/3000 [2:20:37<50:17,  3.31s/it, lr: 1.0e-04 loss: 5.651e-02]mindexpander_qwen_v1:  70%|######9   | 2088/3000 [2:20:37<52:53,  3.48s/it, lr: 1.0e-04 loss: 5.651e-02]mindexpander_qwen_v1:  70%|######9   | 2088/3000 [2:20:37<52:53,  3.48s/it, lr: 1.0e-04 loss: 5.651e-02]mindexpander_qwen_v1:  70%|######9   | 2088/3000 [2:20:39<52:53,  3.48s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  70%|######9   | 2088/3000 [2:20:39<52:53,  3.48s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  70%|######9   | 2089/3000 [2:20:39<48:15,  3.18s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  70%|######9   | 2089/3000 [2:20:39<48:15,  3.18s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  70%|######9   | 2089/3000 [2:20:42<48:15,  3.18s/it, lr: 1.0e-04 loss: 3.601e-02]mindexpander_qwen_v1:  70%|######9   | 2089/3000 [2:20:42<48:15,  3.18s/it, lr: 1.0e-04 loss: 3.601e-02]mindexpander_qwen_v1:  70%|######9   | 2090/3000 [2:20:46<48:11,  3.18s/it, lr: 1.0e-04 loss: 7.432e-02]mindexpander_qwen_v1:  70%|######9   | 2090/3000 [2:20:46<48:11,  3.18s/it, lr: 1.0e-04 loss: 7.432e-02]mindexpander_qwen_v1:  70%|######9   | 2091/3000 [2:20:46<39:42,  2.62s/it, lr: 1.0e-04 loss: 7.432e-02]mindexpander_qwen_v1:  70%|######9   | 2091/3000 [2:20:46<39:42,  2.62s/it, lr: 1.0e-04 loss: 7.432e-02]mindexpander_qwen_v1:  70%|######9   | 2091/3000 [2:20:49<39:42,  2.62s/it, lr: 1.0e-04 loss: 3.930e-02]mindexpander_qwen_v1:  70%|######9   | 2091/3000 [2:20:49<39:42,  2.62s/it, lr: 1.0e-04 loss: 3.930e-02]mindexpander_qwen_v1:  70%|######9   | 2092/3000 [2:20:49<43:51,  2.90s/it, lr: 1.0e-04 loss: 3.930e-02]mindexpander_qwen_v1:  70%|######9   | 2092/3000 [2:20:49<43:51,  2.90s/it, lr: 1.0e-04 loss: 3.930e-02]mindexpander_qwen_v1:  70%|######9   | 2092/3000 [2:20:53<43:51,  2.90s/it, lr: 1.0e-04 loss: 8.066e-02]mindexpander_qwen_v1:  70%|######9   | 2092/3000 [2:20:53<43:51,  2.90s/it, lr: 1.0e-04 loss: 8.066e-02]mindexpander_qwen_v1:  70%|######9   | 2093/3000 [2:20:53<47:06,  3.12s/it, lr: 1.0e-04 loss: 8.066e-02]mindexpander_qwen_v1:  70%|######9   | 2093/3000 [2:20:53<47:06,  3.12s/it, lr: 1.0e-04 loss: 8.066e-02]mindexpander_qwen_v1:  70%|######9   | 2093/3000 [2:20:57<47:06,  3.12s/it, lr: 1.0e-04 loss: 6.347e-03]mindexpander_qwen_v1:  70%|######9   | 2093/3000 [2:20:57<47:06,  3.12s/it, lr: 1.0e-04 loss: 6.347e-03]mindexpander_qwen_v1:  70%|######9   | 2094/3000 [2:20:57<49:36,  3.29s/it, lr: 1.0e-04 loss: 6.347e-03]mindexpander_qwen_v1:  70%|######9   | 2094/3000 [2:20:57<49:36,  3.29s/it, lr: 1.0e-04 loss: 6.347e-03]mindexpander_qwen_v1:  70%|######9   | 2094/3000 [2:21:03<49:36,  3.29s/it, lr: 1.0e-04 loss: 5.653e-02]mindexpander_qwen_v1:  70%|######9   | 2094/3000 [2:21:03<49:36,  3.29s/it, lr: 1.0e-04 loss: 5.653e-02]mindexpander_qwen_v1:  70%|######9   | 2095/3000 [2:21:03<1:00:37,  4.02s/it, lr: 1.0e-04 loss: 5.653e-02]mindexpander_qwen_v1:  70%|######9   | 2095/3000 [2:21:03<1:00:37,  4.02s/it, lr: 1.0e-04 loss: 5.653e-02]mindexpander_qwen_v1:  70%|######9   | 2095/3000 [2:21:09<1:00:37,  4.02s/it, lr: 1.0e-04 loss: 1.230e-02]mindexpander_qwen_v1:  70%|######9   | 2095/3000 [2:21:09<1:00:37,  4.02s/it, lr: 1.0e-04 loss: 1.230e-02]mindexpander_qwen_v1:  70%|######9   | 2096/3000 [2:21:09<1:08:01,  4.51s/it, lr: 1.0e-04 loss: 1.230e-02]mindexpander_qwen_v1:  70%|######9   | 2096/3000 [2:21:09<1:08:01,  4.51s/it, lr: 1.0e-04 loss: 1.230e-02]mindexpander_qwen_v1:  70%|######9   | 2096/3000 [2:21:11<1:08:01,  4.51s/it, lr: 1.0e-04 loss: 1.225e-01]mindexpander_qwen_v1:  70%|######9   | 2096/3000 [2:21:11<1:08:01,  4.51s/it, lr: 1.0e-04 loss: 1.225e-01]mindexpander_qwen_v1:  70%|######9   | 2097/3000 [2:21:11<58:57,  3.92s/it, lr: 1.0e-04 loss: 1.225e-01]  mindexpander_qwen_v1:  70%|######9   | 2097/3000 [2:21:11<58:57,  3.92s/it, lr: 1.0e-04 loss: 1.225e-01]  mindexpander_qwen_v1:  70%|######9   | 2097/3000 [2:21:17<58:57,  3.92s/it, lr: 1.0e-04 loss: 1.247e-01]mindexpander_qwen_v1:  70%|######9   | 2097/3000 [2:21:17<58:57,  3.92s/it, lr: 1.0e-04 loss: 1.247e-01]mindexpander_qwen_v1:  70%|######9   | 2098/3000 [2:21:17<1:06:59,  4.46s/it, lr: 1.0e-04 loss: 1.247e-01]mindexpander_qwen_v1:  70%|######9   | 2098/3000 [2:21:17<1:06:59,  4.46s/it, lr: 1.0e-04 loss: 1.247e-01]mindexpander_qwen_v1:  70%|######9   | 2098/3000 [2:21:23<1:06:59,  4.46s/it, lr: 1.0e-04 loss: 8.372e-03]mindexpander_qwen_v1:  70%|######9   | 2098/3000 [2:21:23<1:06:59,  4.46s/it, lr: 1.0e-04 loss: 8.372e-03]mindexpander_qwen_v1:  70%|######9   | 2099/3000 [2:21:23<1:12:44,  4.84s/it, lr: 1.0e-04 loss: 8.372e-03]mindexpander_qwen_v1:  70%|######9   | 2099/3000 [2:21:23<1:12:44,  4.84s/it, lr: 1.0e-04 loss: 8.372e-03]mindexpander_qwen_v1:  70%|######9   | 2099/3000 [2:21:26<1:12:44,  4.84s/it, lr: 1.0e-04 loss: 7.333e-03]mindexpander_qwen_v1:  70%|######9   | 2099/3000 [2:21:26<1:12:44,  4.84s/it, lr: 1.0e-04 loss: 7.333e-03]mindexpander_qwen_v1:  70%|#######   | 2100/3000 [2:21:31<1:12:39,  4.84s/it, lr: 1.0e-04 loss: 1.075e-02]mindexpander_qwen_v1:  70%|#######   | 2100/3000 [2:21:31<1:12:39,  4.84s/it, lr: 1.0e-04 loss: 1.075e-02]mindexpander_qwen_v1:  70%|#######   | 2101/3000 [2:21:31<59:10,  3.95s/it, lr: 1.0e-04 loss: 1.075e-02]  mindexpander_qwen_v1:  70%|#######   | 2101/3000 [2:21:31<59:10,  3.95s/it, lr: 1.0e-04 loss: 1.075e-02]  mindexpander_qwen_v1:  70%|#######   | 2101/3000 [2:21:37<59:10,  3.95s/it, lr: 1.0e-04 loss: 9.174e-02]mindexpander_qwen_v1:  70%|#######   | 2101/3000 [2:21:37<59:10,  3.95s/it, lr: 1.0e-04 loss: 9.174e-02]mindexpander_qwen_v1:  70%|#######   | 2102/3000 [2:21:37<1:05:47,  4.40s/it, lr: 1.0e-04 loss: 9.174e-02]mindexpander_qwen_v1:  70%|#######   | 2102/3000 [2:21:37<1:05:47,  4.40s/it, lr: 1.0e-04 loss: 9.174e-02]mindexpander_qwen_v1:  70%|#######   | 2102/3000 [2:21:43<1:05:47,  4.40s/it, lr: 1.0e-04 loss: 1.394e-01]mindexpander_qwen_v1:  70%|#######   | 2102/3000 [2:21:43<1:05:47,  4.40s/it, lr: 1.0e-04 loss: 1.394e-01]mindexpander_qwen_v1:  70%|#######   | 2103/3000 [2:21:43<1:11:36,  4.79s/it, lr: 1.0e-04 loss: 1.394e-01]mindexpander_qwen_v1:  70%|#######   | 2103/3000 [2:21:43<1:11:36,  4.79s/it, lr: 1.0e-04 loss: 1.394e-01]mindexpander_qwen_v1:  70%|#######   | 2103/3000 [2:21:47<1:11:36,  4.79s/it, lr: 1.0e-04 loss: 1.613e-01]mindexpander_qwen_v1:  70%|#######   | 2103/3000 [2:21:47<1:11:36,  4.79s/it, lr: 1.0e-04 loss: 1.613e-01]mindexpander_qwen_v1:  70%|#######   | 2104/3000 [2:21:47<1:07:18,  4.51s/it, lr: 1.0e-04 loss: 1.613e-01]mindexpander_qwen_v1:  70%|#######   | 2104/3000 [2:21:47<1:07:18,  4.51s/it, lr: 1.0e-04 loss: 1.613e-01]mindexpander_qwen_v1:  70%|#######   | 2104/3000 [2:21:51<1:07:18,  4.51s/it, lr: 1.0e-04 loss: 1.926e-01]mindexpander_qwen_v1:  70%|#######   | 2104/3000 [2:21:51<1:07:18,  4.51s/it, lr: 1.0e-04 loss: 1.926e-01]mindexpander_qwen_v1:  70%|#######   | 2105/3000 [2:21:51<1:04:03,  4.29s/it, lr: 1.0e-04 loss: 1.926e-01]mindexpander_qwen_v1:  70%|#######   | 2105/3000 [2:21:51<1:04:03,  4.29s/it, lr: 1.0e-04 loss: 1.926e-01]mindexpander_qwen_v1:  70%|#######   | 2105/3000 [2:21:56<1:04:03,  4.29s/it, lr: 1.0e-04 loss: 5.025e-02]mindexpander_qwen_v1:  70%|#######   | 2105/3000 [2:21:56<1:04:03,  4.29s/it, lr: 1.0e-04 loss: 5.025e-02]mindexpander_qwen_v1:  70%|#######   | 2106/3000 [2:21:56<1:10:13,  4.71s/it, lr: 1.0e-04 loss: 5.025e-02]mindexpander_qwen_v1:  70%|#######   | 2106/3000 [2:21:56<1:10:13,  4.71s/it, lr: 1.0e-04 loss: 5.025e-02]mindexpander_qwen_v1:  70%|#######   | 2106/3000 [2:22:02<1:10:13,  4.71s/it, lr: 1.0e-04 loss: 4.517e-02]mindexpander_qwen_v1:  70%|#######   | 2106/3000 [2:22:02<1:10:13,  4.71s/it, lr: 1.0e-04 loss: 4.517e-02]mindexpander_qwen_v1:  70%|#######   | 2107/3000 [2:22:02<1:15:21,  5.06s/it, lr: 1.0e-04 loss: 4.517e-02]mindexpander_qwen_v1:  70%|#######   | 2107/3000 [2:22:02<1:15:21,  5.06s/it, lr: 1.0e-04 loss: 4.517e-02]mindexpander_qwen_v1:  70%|#######   | 2107/3000 [2:22:06<1:15:21,  5.06s/it, lr: 1.0e-04 loss: 2.796e-02]mindexpander_qwen_v1:  70%|#######   | 2107/3000 [2:22:06<1:15:21,  5.06s/it, lr: 1.0e-04 loss: 2.796e-02]mindexpander_qwen_v1:  70%|#######   | 2108/3000 [2:22:06<1:09:29,  4.67s/it, lr: 1.0e-04 loss: 2.796e-02]mindexpander_qwen_v1:  70%|#######   | 2108/3000 [2:22:06<1:09:29,  4.67s/it, lr: 1.0e-04 loss: 2.796e-02]mindexpander_qwen_v1:  70%|#######   | 2108/3000 [2:22:10<1:09:29,  4.67s/it, lr: 1.0e-04 loss: 1.480e-01]mindexpander_qwen_v1:  70%|#######   | 2108/3000 [2:22:10<1:09:29,  4.67s/it, lr: 1.0e-04 loss: 1.480e-01]mindexpander_qwen_v1:  70%|#######   | 2109/3000 [2:22:10<1:05:21,  4.40s/it, lr: 1.0e-04 loss: 1.480e-01]mindexpander_qwen_v1:  70%|#######   | 2109/3000 [2:22:10<1:05:21,  4.40s/it, lr: 1.0e-04 loss: 1.480e-01]mindexpander_qwen_v1:  70%|#######   | 2109/3000 [2:22:14<1:05:21,  4.40s/it, lr: 1.0e-04 loss: 4.035e-02]mindexpander_qwen_v1:  70%|#######   | 2109/3000 [2:22:14<1:05:21,  4.40s/it, lr: 1.0e-04 loss: 4.035e-02]mindexpander_qwen_v1:  70%|#######   | 2110/3000 [2:22:16<1:05:16,  4.40s/it, lr: 1.0e-04 loss: 1.005e-01]mindexpander_qwen_v1:  70%|#######   | 2110/3000 [2:22:16<1:05:16,  4.40s/it, lr: 1.0e-04 loss: 1.005e-01]mindexpander_qwen_v1:  70%|#######   | 2111/3000 [2:22:16<43:42,  2.95s/it, lr: 1.0e-04 loss: 1.005e-01]  mindexpander_qwen_v1:  70%|#######   | 2111/3000 [2:22:16<43:42,  2.95s/it, lr: 1.0e-04 loss: 1.005e-01]  mindexpander_qwen_v1:  70%|#######   | 2111/3000 [2:22:20<43:42,  2.95s/it, lr: 1.0e-04 loss: 5.148e-03]mindexpander_qwen_v1:  70%|#######   | 2111/3000 [2:22:20<43:42,  2.95s/it, lr: 1.0e-04 loss: 5.148e-03]mindexpander_qwen_v1:  70%|#######   | 2112/3000 [2:22:20<47:19,  3.20s/it, lr: 1.0e-04 loss: 5.148e-03]mindexpander_qwen_v1:  70%|#######   | 2112/3000 [2:22:20<47:19,  3.20s/it, lr: 1.0e-04 loss: 5.148e-03]mindexpander_qwen_v1:  70%|#######   | 2112/3000 [2:22:22<47:19,  3.20s/it, lr: 1.0e-04 loss: 1.609e-01]mindexpander_qwen_v1:  70%|#######   | 2112/3000 [2:22:22<47:19,  3.20s/it, lr: 1.0e-04 loss: 1.609e-01]mindexpander_qwen_v1:  70%|#######   | 2113/3000 [2:22:22<44:24,  3.00s/it, lr: 1.0e-04 loss: 1.609e-01]mindexpander_qwen_v1:  70%|#######   | 2113/3000 [2:22:22<44:24,  3.00s/it, lr: 1.0e-04 loss: 1.609e-01]mindexpander_qwen_v1:  70%|#######   | 2113/3000 [2:22:25<44:24,  3.00s/it, lr: 1.0e-04 loss: 1.517e-01]mindexpander_qwen_v1:  70%|#######   | 2113/3000 [2:22:25<44:24,  3.00s/it, lr: 1.0e-04 loss: 1.517e-01]mindexpander_qwen_v1:  70%|#######   | 2114/3000 [2:22:25<42:10,  2.86s/it, lr: 1.0e-04 loss: 1.517e-01]mindexpander_qwen_v1:  70%|#######   | 2114/3000 [2:22:25<42:10,  2.86s/it, lr: 1.0e-04 loss: 1.517e-01]mindexpander_qwen_v1:  70%|#######   | 2114/3000 [2:22:31<42:10,  2.86s/it, lr: 1.0e-04 loss: 4.159e-02]mindexpander_qwen_v1:  70%|#######   | 2114/3000 [2:22:31<42:10,  2.86s/it, lr: 1.0e-04 loss: 4.159e-02]mindexpander_qwen_v1:  70%|#######   | 2115/3000 [2:22:31<54:03,  3.66s/it, lr: 1.0e-04 loss: 4.159e-02]mindexpander_qwen_v1:  70%|#######   | 2115/3000 [2:22:31<54:03,  3.66s/it, lr: 1.0e-04 loss: 4.159e-02]mindexpander_qwen_v1:  70%|#######   | 2115/3000 [2:22:35<54:03,  3.66s/it, lr: 1.0e-04 loss: 4.106e-02]mindexpander_qwen_v1:  70%|#######   | 2115/3000 [2:22:35<54:03,  3.66s/it, lr: 1.0e-04 loss: 4.106e-02]mindexpander_qwen_v1:  71%|#######   | 2116/3000 [2:22:35<55:05,  3.74s/it, lr: 1.0e-04 loss: 4.106e-02]mindexpander_qwen_v1:  71%|#######   | 2116/3000 [2:22:35<55:05,  3.74s/it, lr: 1.0e-04 loss: 4.106e-02]mindexpander_qwen_v1:  71%|#######   | 2116/3000 [2:22:38<55:05,  3.74s/it, lr: 1.0e-04 loss: 1.479e-02]mindexpander_qwen_v1:  71%|#######   | 2116/3000 [2:22:38<55:05,  3.74s/it, lr: 1.0e-04 loss: 1.479e-02]mindexpander_qwen_v1:  71%|#######   | 2117/3000 [2:22:38<55:07,  3.75s/it, lr: 1.0e-04 loss: 1.479e-02]mindexpander_qwen_v1:  71%|#######   | 2117/3000 [2:22:38<55:07,  3.75s/it, lr: 1.0e-04 loss: 1.479e-02]mindexpander_qwen_v1:  71%|#######   | 2117/3000 [2:22:41<55:07,  3.75s/it, lr: 1.0e-04 loss: 1.521e-02]mindexpander_qwen_v1:  71%|#######   | 2117/3000 [2:22:41<55:07,  3.75s/it, lr: 1.0e-04 loss: 1.521e-02]mindexpander_qwen_v1:  71%|#######   | 2118/3000 [2:22:41<49:30,  3.37s/it, lr: 1.0e-04 loss: 1.521e-02]mindexpander_qwen_v1:  71%|#######   | 2118/3000 [2:22:41<49:30,  3.37s/it, lr: 1.0e-04 loss: 1.521e-02]mindexpander_qwen_v1:  71%|#######   | 2118/3000 [2:22:43<49:30,  3.37s/it, lr: 1.0e-04 loss: 4.728e-02]mindexpander_qwen_v1:  71%|#######   | 2118/3000 [2:22:43<49:30,  3.37s/it, lr: 1.0e-04 loss: 4.728e-02]mindexpander_qwen_v1:  71%|#######   | 2119/3000 [2:22:43<46:22,  3.16s/it, lr: 1.0e-04 loss: 4.728e-02]mindexpander_qwen_v1:  71%|#######   | 2119/3000 [2:22:43<46:22,  3.16s/it, lr: 1.0e-04 loss: 4.728e-02]mindexpander_qwen_v1:  71%|#######   | 2119/3000 [2:22:46<46:22,  3.16s/it, lr: 1.0e-04 loss: 2.999e-02]mindexpander_qwen_v1:  71%|#######   | 2119/3000 [2:22:46<46:22,  3.16s/it, lr: 1.0e-04 loss: 2.999e-02]mindexpander_qwen_v1:  71%|#######   | 2120/3000 [2:22:52<46:19,  3.16s/it, lr: 1.0e-04 loss: 1.391e-03]mindexpander_qwen_v1:  71%|#######   | 2120/3000 [2:22:52<46:19,  3.16s/it, lr: 1.0e-04 loss: 1.391e-03]mindexpander_qwen_v1:  71%|#######   | 2121/3000 [2:22:52<44:24,  3.03s/it, lr: 1.0e-04 loss: 1.391e-03]mindexpander_qwen_v1:  71%|#######   | 2121/3000 [2:22:52<44:24,  3.03s/it, lr: 1.0e-04 loss: 1.391e-03]mindexpander_qwen_v1:  71%|#######   | 2121/3000 [2:22:54<44:24,  3.03s/it, lr: 1.0e-04 loss: 1.633e-01]mindexpander_qwen_v1:  71%|#######   | 2121/3000 [2:22:54<44:24,  3.03s/it, lr: 1.0e-04 loss: 1.633e-01]mindexpander_qwen_v1:  71%|#######   | 2122/3000 [2:22:54<42:15,  2.89s/it, lr: 1.0e-04 loss: 1.633e-01]mindexpander_qwen_v1:  71%|#######   | 2122/3000 [2:22:54<42:15,  2.89s/it, lr: 1.0e-04 loss: 1.633e-01]mindexpander_qwen_v1:  71%|#######   | 2122/3000 [2:22:58<42:15,  2.89s/it, lr: 1.0e-04 loss: 2.298e-02]mindexpander_qwen_v1:  71%|#######   | 2122/3000 [2:22:58<42:15,  2.89s/it, lr: 1.0e-04 loss: 2.298e-02]mindexpander_qwen_v1:  71%|#######   | 2123/3000 [2:22:58<46:13,  3.16s/it, lr: 1.0e-04 loss: 2.298e-02]mindexpander_qwen_v1:  71%|#######   | 2123/3000 [2:22:58<46:13,  3.16s/it, lr: 1.0e-04 loss: 2.298e-02]mindexpander_qwen_v1:  71%|#######   | 2123/3000 [2:23:02<46:13,  3.16s/it, lr: 1.0e-04 loss: 4.028e-02]mindexpander_qwen_v1:  71%|#######   | 2123/3000 [2:23:02<46:13,  3.16s/it, lr: 1.0e-04 loss: 4.028e-02]mindexpander_qwen_v1:  71%|#######   | 2124/3000 [2:23:02<48:30,  3.32s/it, lr: 1.0e-04 loss: 4.028e-02]mindexpander_qwen_v1:  71%|#######   | 2124/3000 [2:23:02<48:30,  3.32s/it, lr: 1.0e-04 loss: 4.028e-02]mindexpander_qwen_v1:  71%|#######   | 2124/3000 [2:23:04<48:30,  3.32s/it, lr: 1.0e-04 loss: 5.187e-02]mindexpander_qwen_v1:  71%|#######   | 2124/3000 [2:23:04<48:30,  3.32s/it, lr: 1.0e-04 loss: 5.187e-02]mindexpander_qwen_v1:  71%|#######   | 2125/3000 [2:23:04<44:53,  3.08s/it, lr: 1.0e-04 loss: 5.187e-02]mindexpander_qwen_v1:  71%|#######   | 2125/3000 [2:23:04<44:53,  3.08s/it, lr: 1.0e-04 loss: 5.187e-02]mindexpander_qwen_v1:  71%|#######   | 2125/3000 [2:23:10<44:53,  3.08s/it, lr: 1.0e-04 loss: 1.795e-01]mindexpander_qwen_v1:  71%|#######   | 2125/3000 [2:23:10<44:53,  3.08s/it, lr: 1.0e-04 loss: 1.795e-01]mindexpander_qwen_v1:  71%|#######   | 2126/3000 [2:23:10<55:56,  3.84s/it, lr: 1.0e-04 loss: 1.795e-01]mindexpander_qwen_v1:  71%|#######   | 2126/3000 [2:23:10<55:56,  3.84s/it, lr: 1.0e-04 loss: 1.795e-01]mindexpander_qwen_v1:  71%|#######   | 2126/3000 [2:23:16<55:56,  3.84s/it, lr: 1.0e-04 loss: 1.744e-01]mindexpander_qwen_v1:  71%|#######   | 2126/3000 [2:23:16<55:56,  3.84s/it, lr: 1.0e-04 loss: 1.744e-01]mindexpander_qwen_v1:  71%|#######   | 2127/3000 [2:23:16<1:03:57,  4.40s/it, lr: 1.0e-04 loss: 1.744e-01]mindexpander_qwen_v1:  71%|#######   | 2127/3000 [2:23:16<1:03:57,  4.40s/it, lr: 1.0e-04 loss: 1.744e-01]mindexpander_qwen_v1:  71%|#######   | 2127/3000 [2:23:18<1:03:57,  4.40s/it, lr: 1.0e-04 loss: 1.267e-01]mindexpander_qwen_v1:  71%|#######   | 2127/3000 [2:23:18<1:03:57,  4.40s/it, lr: 1.0e-04 loss: 1.267e-01]mindexpander_qwen_v1:  71%|#######   | 2128/3000 [2:23:18<56:30,  3.89s/it, lr: 1.0e-04 loss: 1.267e-01]  mindexpander_qwen_v1:  71%|#######   | 2128/3000 [2:23:18<56:30,  3.89s/it, lr: 1.0e-04 loss: 1.267e-01]  mindexpander_qwen_v1:  71%|#######   | 2128/3000 [2:23:24<56:30,  3.89s/it, lr: 1.0e-04 loss: 1.289e-01]mindexpander_qwen_v1:  71%|#######   | 2128/3000 [2:23:24<56:30,  3.89s/it, lr: 1.0e-04 loss: 1.289e-01]mindexpander_qwen_v1:  71%|#######   | 2129/3000 [2:23:24<1:04:28,  4.44s/it, lr: 1.0e-04 loss: 1.289e-01]mindexpander_qwen_v1:  71%|#######   | 2129/3000 [2:23:24<1:04:28,  4.44s/it, lr: 1.0e-04 loss: 1.289e-01]mindexpander_qwen_v1:  71%|#######   | 2129/3000 [2:23:27<1:04:28,  4.44s/it, lr: 1.0e-04 loss: 1.133e-01]mindexpander_qwen_v1:  71%|#######   | 2129/3000 [2:23:27<1:04:28,  4.44s/it, lr: 1.0e-04 loss: 1.133e-01]mindexpander_qwen_v1:  71%|#######1  | 2130/3000 [2:23:31<1:04:24,  4.44s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  71%|#######1  | 2130/3000 [2:23:31<1:04:24,  4.44s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  71%|#######1  | 2131/3000 [2:23:31<48:10,  3.33s/it, lr: 1.0e-04 loss: 1.777e-01]  mindexpander_qwen_v1:  71%|#######1  | 2131/3000 [2:23:31<48:10,  3.33s/it, lr: 1.0e-04 loss: 1.777e-01]  mindexpander_qwen_v1:  71%|#######1  | 2131/3000 [2:23:33<48:10,  3.33s/it, lr: 1.0e-04 loss: 3.862e-02]mindexpander_qwen_v1:  71%|#######1  | 2131/3000 [2:23:33<48:10,  3.33s/it, lr: 1.0e-04 loss: 3.862e-02]mindexpander_qwen_v1:  71%|#######1  | 2132/3000 [2:23:33<45:01,  3.11s/it, lr: 1.0e-04 loss: 3.862e-02]mindexpander_qwen_v1:  71%|#######1  | 2132/3000 [2:23:33<45:01,  3.11s/it, lr: 1.0e-04 loss: 3.862e-02]mindexpander_qwen_v1:  71%|#######1  | 2132/3000 [2:23:37<45:01,  3.11s/it, lr: 1.0e-04 loss: 1.196e-03]mindexpander_qwen_v1:  71%|#######1  | 2132/3000 [2:23:37<45:01,  3.11s/it, lr: 1.0e-04 loss: 1.196e-03]mindexpander_qwen_v1:  71%|#######1  | 2133/3000 [2:23:37<47:21,  3.28s/it, lr: 1.0e-04 loss: 1.196e-03]mindexpander_qwen_v1:  71%|#######1  | 2133/3000 [2:23:37<47:21,  3.28s/it, lr: 1.0e-04 loss: 1.196e-03]mindexpander_qwen_v1:  71%|#######1  | 2133/3000 [2:23:41<47:21,  3.28s/it, lr: 1.0e-04 loss: 1.782e-01]mindexpander_qwen_v1:  71%|#######1  | 2133/3000 [2:23:41<47:21,  3.28s/it, lr: 1.0e-04 loss: 1.782e-01]mindexpander_qwen_v1:  71%|#######1  | 2134/3000 [2:23:41<49:08,  3.40s/it, lr: 1.0e-04 loss: 1.782e-01]mindexpander_qwen_v1:  71%|#######1  | 2134/3000 [2:23:41<49:08,  3.40s/it, lr: 1.0e-04 loss: 1.782e-01]mindexpander_qwen_v1:  71%|#######1  | 2134/3000 [2:23:45<49:08,  3.40s/it, lr: 1.0e-04 loss: 2.496e-02]mindexpander_qwen_v1:  71%|#######1  | 2134/3000 [2:23:45<49:08,  3.40s/it, lr: 1.0e-04 loss: 2.496e-02]mindexpander_qwen_v1:  71%|#######1  | 2135/3000 [2:23:45<51:10,  3.55s/it, lr: 1.0e-04 loss: 2.496e-02]mindexpander_qwen_v1:  71%|#######1  | 2135/3000 [2:23:45<51:10,  3.55s/it, lr: 1.0e-04 loss: 2.496e-02]mindexpander_qwen_v1:  71%|#######1  | 2135/3000 [2:23:49<51:10,  3.55s/it, lr: 1.0e-04 loss: 1.063e-01]mindexpander_qwen_v1:  71%|#######1  | 2135/3000 [2:23:49<51:10,  3.55s/it, lr: 1.0e-04 loss: 1.063e-01]mindexpander_qwen_v1:  71%|#######1  | 2136/3000 [2:23:49<51:52,  3.60s/it, lr: 1.0e-04 loss: 1.063e-01]mindexpander_qwen_v1:  71%|#######1  | 2136/3000 [2:23:49<51:52,  3.60s/it, lr: 1.0e-04 loss: 1.063e-01]mindexpander_qwen_v1:  71%|#######1  | 2136/3000 [2:23:51<51:52,  3.60s/it, lr: 1.0e-04 loss: 3.909e-02]mindexpander_qwen_v1:  71%|#######1  | 2136/3000 [2:23:51<51:52,  3.60s/it, lr: 1.0e-04 loss: 3.909e-02]mindexpander_qwen_v1:  71%|#######1  | 2137/3000 [2:23:51<46:58,  3.27s/it, lr: 1.0e-04 loss: 3.909e-02]mindexpander_qwen_v1:  71%|#######1  | 2137/3000 [2:23:51<46:58,  3.27s/it, lr: 1.0e-04 loss: 3.909e-02]mindexpander_qwen_v1:  71%|#######1  | 2137/3000 [2:23:57<46:58,  3.27s/it, lr: 1.0e-04 loss: 2.942e-02]mindexpander_qwen_v1:  71%|#######1  | 2137/3000 [2:23:57<46:58,  3.27s/it, lr: 1.0e-04 loss: 2.942e-02]mindexpander_qwen_v1:  71%|#######1  | 2138/3000 [2:23:57<57:28,  4.00s/it, lr: 1.0e-04 loss: 2.942e-02]mindexpander_qwen_v1:  71%|#######1  | 2138/3000 [2:23:57<57:28,  4.00s/it, lr: 1.0e-04 loss: 2.942e-02]mindexpander_qwen_v1:  71%|#######1  | 2138/3000 [2:23:59<57:28,  4.00s/it, lr: 1.0e-04 loss: 2.652e-02]mindexpander_qwen_v1:  71%|#######1  | 2138/3000 [2:23:59<57:28,  4.00s/it, lr: 1.0e-04 loss: 2.652e-02]mindexpander_qwen_v1:  71%|#######1  | 2139/3000 [2:23:59<50:52,  3.55s/it, lr: 1.0e-04 loss: 2.652e-02]mindexpander_qwen_v1:  71%|#######1  | 2139/3000 [2:23:59<50:52,  3.55s/it, lr: 1.0e-04 loss: 2.652e-02]mindexpander_qwen_v1:  71%|#######1  | 2139/3000 [2:24:05<50:52,  3.55s/it, lr: 1.0e-04 loss: 1.565e-02]mindexpander_qwen_v1:  71%|#######1  | 2139/3000 [2:24:05<50:52,  3.55s/it, lr: 1.0e-04 loss: 1.565e-02]mindexpander_qwen_v1:  71%|#######1  | 2140/3000 [2:24:08<50:48,  3.55s/it, lr: 1.0e-04 loss: 1.985e-01]mindexpander_qwen_v1:  71%|#######1  | 2140/3000 [2:24:08<50:48,  3.55s/it, lr: 1.0e-04 loss: 1.985e-01]mindexpander_qwen_v1:  71%|#######1  | 2141/3000 [2:24:08<35:33,  2.48s/it, lr: 1.0e-04 loss: 1.985e-01]mindexpander_qwen_v1:  71%|#######1  | 2141/3000 [2:24:08<35:33,  2.48s/it, lr: 1.0e-04 loss: 1.985e-01]mindexpander_qwen_v1:  71%|#######1  | 2141/3000 [2:24:13<35:33,  2.48s/it, lr: 1.0e-04 loss: 2.557e-04]mindexpander_qwen_v1:  71%|#######1  | 2141/3000 [2:24:13<35:33,  2.48s/it, lr: 1.0e-04 loss: 2.557e-04]mindexpander_qwen_v1:  71%|#######1  | 2142/3000 [2:24:13<47:02,  3.29s/it, lr: 1.0e-04 loss: 2.557e-04]mindexpander_qwen_v1:  71%|#######1  | 2142/3000 [2:24:13<47:02,  3.29s/it, lr: 1.0e-04 loss: 2.557e-04]mindexpander_qwen_v1:  71%|#######1  | 2142/3000 [2:24:17<47:02,  3.29s/it, lr: 1.0e-04 loss: 8.886e-03]mindexpander_qwen_v1:  71%|#######1  | 2142/3000 [2:24:17<47:02,  3.29s/it, lr: 1.0e-04 loss: 8.886e-03]mindexpander_qwen_v1:  71%|#######1  | 2143/3000 [2:24:17<48:39,  3.41s/it, lr: 1.0e-04 loss: 8.886e-03]mindexpander_qwen_v1:  71%|#######1  | 2143/3000 [2:24:17<48:39,  3.41s/it, lr: 1.0e-04 loss: 8.886e-03]mindexpander_qwen_v1:  71%|#######1  | 2143/3000 [2:24:21<48:39,  3.41s/it, lr: 1.0e-04 loss: 1.091e-02]mindexpander_qwen_v1:  71%|#######1  | 2143/3000 [2:24:21<48:39,  3.41s/it, lr: 1.0e-04 loss: 1.091e-02]mindexpander_qwen_v1:  71%|#######1  | 2144/3000 [2:24:21<50:36,  3.55s/it, lr: 1.0e-04 loss: 1.091e-02]mindexpander_qwen_v1:  71%|#######1  | 2144/3000 [2:24:21<50:36,  3.55s/it, lr: 1.0e-04 loss: 1.091e-02]mindexpander_qwen_v1:  71%|#######1  | 2144/3000 [2:24:23<50:36,  3.55s/it, lr: 1.0e-04 loss: 2.283e-02]mindexpander_qwen_v1:  71%|#######1  | 2144/3000 [2:24:23<50:36,  3.55s/it, lr: 1.0e-04 loss: 2.283e-02]mindexpander_qwen_v1:  72%|#######1  | 2145/3000 [2:24:23<46:09,  3.24s/it, lr: 1.0e-04 loss: 2.283e-02]mindexpander_qwen_v1:  72%|#######1  | 2145/3000 [2:24:23<46:09,  3.24s/it, lr: 1.0e-04 loss: 2.283e-02]mindexpander_qwen_v1:  72%|#######1  | 2145/3000 [2:24:29<46:09,  3.24s/it, lr: 1.0e-04 loss: 3.754e-02]mindexpander_qwen_v1:  72%|#######1  | 2145/3000 [2:24:29<46:09,  3.24s/it, lr: 1.0e-04 loss: 3.754e-02]mindexpander_qwen_v1:  72%|#######1  | 2146/3000 [2:24:29<56:18,  3.96s/it, lr: 1.0e-04 loss: 3.754e-02]mindexpander_qwen_v1:  72%|#######1  | 2146/3000 [2:24:29<56:18,  3.96s/it, lr: 1.0e-04 loss: 3.754e-02]mindexpander_qwen_v1:  72%|#######1  | 2146/3000 [2:24:33<56:18,  3.96s/it, lr: 1.0e-04 loss: 2.735e-02]mindexpander_qwen_v1:  72%|#######1  | 2146/3000 [2:24:33<56:18,  3.96s/it, lr: 1.0e-04 loss: 2.735e-02]mindexpander_qwen_v1:  72%|#######1  | 2147/3000 [2:24:33<56:01,  3.94s/it, lr: 1.0e-04 loss: 2.735e-02]mindexpander_qwen_v1:  72%|#######1  | 2147/3000 [2:24:33<56:01,  3.94s/it, lr: 1.0e-04 loss: 2.735e-02]mindexpander_qwen_v1:  72%|#######1  | 2147/3000 [2:24:39<56:01,  3.94s/it, lr: 1.0e-04 loss: 6.080e-02]mindexpander_qwen_v1:  72%|#######1  | 2147/3000 [2:24:39<56:01,  3.94s/it, lr: 1.0e-04 loss: 6.080e-02]mindexpander_qwen_v1:  72%|#######1  | 2148/3000 [2:24:39<1:03:30,  4.47s/it, lr: 1.0e-04 loss: 6.080e-02]mindexpander_qwen_v1:  72%|#######1  | 2148/3000 [2:24:39<1:03:30,  4.47s/it, lr: 1.0e-04 loss: 6.080e-02]mindexpander_qwen_v1:  72%|#######1  | 2148/3000 [2:24:45<1:03:30,  4.47s/it, lr: 1.0e-04 loss: 8.970e-02]mindexpander_qwen_v1:  72%|#######1  | 2148/3000 [2:24:45<1:03:30,  4.47s/it, lr: 1.0e-04 loss: 8.970e-02]mindexpander_qwen_v1:  72%|#######1  | 2149/3000 [2:24:45<1:08:49,  4.85s/it, lr: 1.0e-04 loss: 8.970e-02]mindexpander_qwen_v1:  72%|#######1  | 2149/3000 [2:24:45<1:08:49,  4.85s/it, lr: 1.0e-04 loss: 8.970e-02]mindexpander_qwen_v1:  72%|#######1  | 2149/3000 [2:24:50<1:08:49,  4.85s/it, lr: 1.0e-04 loss: 9.084e-02]mindexpander_qwen_v1:  72%|#######1  | 2149/3000 [2:24:50<1:08:49,  4.85s/it, lr: 1.0e-04 loss: 9.084e-02]mindexpander_qwen_v1:  72%|#######1  | 2150/3000 [2:24:56<1:08:44,  4.85s/it, lr: 1.0e-04 loss: 1.756e-01]mindexpander_qwen_v1:  72%|#######1  | 2150/3000 [2:24:56<1:08:44,  4.85s/it, lr: 1.0e-04 loss: 1.756e-01]mindexpander_qwen_v1:  72%|#######1  | 2151/3000 [2:24:56<56:21,  3.98s/it, lr: 1.0e-04 loss: 1.756e-01]  mindexpander_qwen_v1:  72%|#######1  | 2151/3000 [2:24:56<56:21,  3.98s/it, lr: 1.0e-04 loss: 1.756e-01]  mindexpander_qwen_v1:  72%|#######1  | 2151/3000 [2:25:02<56:21,  3.98s/it, lr: 1.0e-04 loss: 5.177e-02]mindexpander_qwen_v1:  72%|#######1  | 2151/3000 [2:25:02<56:21,  3.98s/it, lr: 1.0e-04 loss: 5.177e-02]mindexpander_qwen_v1:  72%|#######1  | 2152/3000 [2:25:02<1:02:31,  4.42s/it, lr: 1.0e-04 loss: 5.177e-02]mindexpander_qwen_v1:  72%|#######1  | 2152/3000 [2:25:02<1:02:31,  4.42s/it, lr: 1.0e-04 loss: 5.177e-02]mindexpander_qwen_v1:  72%|#######1  | 2152/3000 [2:25:04<1:02:31,  4.42s/it, lr: 1.0e-04 loss: 7.625e-02]mindexpander_qwen_v1:  72%|#######1  | 2152/3000 [2:25:04<1:02:31,  4.42s/it, lr: 1.0e-04 loss: 7.625e-02]mindexpander_qwen_v1:  72%|#######1  | 2153/3000 [2:25:04<55:11,  3.91s/it, lr: 1.0e-04 loss: 7.625e-02]  mindexpander_qwen_v1:  72%|#######1  | 2153/3000 [2:25:04<55:11,  3.91s/it, lr: 1.0e-04 loss: 7.625e-02]  mindexpander_qwen_v1:  72%|#######1  | 2153/3000 [2:25:08<55:11,  3.91s/it, lr: 1.0e-04 loss: 2.882e-02]mindexpander_qwen_v1:  72%|#######1  | 2153/3000 [2:25:08<55:11,  3.91s/it, lr: 1.0e-04 loss: 2.882e-02]mindexpander_qwen_v1:  72%|#######1  | 2154/3000 [2:25:08<54:30,  3.87s/it, lr: 1.0e-04 loss: 2.882e-02]mindexpander_qwen_v1:  72%|#######1  | 2154/3000 [2:25:08<54:30,  3.87s/it, lr: 1.0e-04 loss: 2.882e-02]mindexpander_qwen_v1:  72%|#######1  | 2154/3000 [2:25:14<54:30,  3.87s/it, lr: 1.0e-04 loss: 2.531e-02]mindexpander_qwen_v1:  72%|#######1  | 2154/3000 [2:25:14<54:30,  3.87s/it, lr: 1.0e-04 loss: 2.531e-02]mindexpander_qwen_v1:  72%|#######1  | 2155/3000 [2:25:14<1:01:52,  4.39s/it, lr: 1.0e-04 loss: 2.531e-02]mindexpander_qwen_v1:  72%|#######1  | 2155/3000 [2:25:14<1:01:52,  4.39s/it, lr: 1.0e-04 loss: 2.531e-02]mindexpander_qwen_v1:  72%|#######1  | 2155/3000 [2:25:17<1:01:52,  4.39s/it, lr: 1.0e-04 loss: 1.924e-02]mindexpander_qwen_v1:  72%|#######1  | 2155/3000 [2:25:17<1:01:52,  4.39s/it, lr: 1.0e-04 loss: 1.924e-02]mindexpander_qwen_v1:  72%|#######1  | 2156/3000 [2:25:17<54:52,  3.90s/it, lr: 1.0e-04 loss: 1.924e-02]  mindexpander_qwen_v1:  72%|#######1  | 2156/3000 [2:25:17<54:52,  3.90s/it, lr: 1.0e-04 loss: 1.924e-02]  mindexpander_qwen_v1:  72%|#######1  | 2156/3000 [2:25:19<54:52,  3.90s/it, lr: 1.0e-04 loss: 1.953e-01]mindexpander_qwen_v1:  72%|#######1  | 2156/3000 [2:25:19<54:52,  3.90s/it, lr: 1.0e-04 loss: 1.953e-01]mindexpander_qwen_v1:  72%|#######1  | 2157/3000 [2:25:19<48:56,  3.48s/it, lr: 1.0e-04 loss: 1.953e-01]mindexpander_qwen_v1:  72%|#######1  | 2157/3000 [2:25:19<48:56,  3.48s/it, lr: 1.0e-04 loss: 1.953e-01]mindexpander_qwen_v1:  72%|#######1  | 2157/3000 [2:25:22<48:56,  3.48s/it, lr: 1.0e-04 loss: 1.978e-01]mindexpander_qwen_v1:  72%|#######1  | 2157/3000 [2:25:22<48:56,  3.48s/it, lr: 1.0e-04 loss: 1.978e-01]mindexpander_qwen_v1:  72%|#######1  | 2158/3000 [2:25:22<44:38,  3.18s/it, lr: 1.0e-04 loss: 1.978e-01]mindexpander_qwen_v1:  72%|#######1  | 2158/3000 [2:25:22<44:38,  3.18s/it, lr: 1.0e-04 loss: 1.978e-01]mindexpander_qwen_v1:  72%|#######1  | 2158/3000 [2:25:25<44:38,  3.18s/it, lr: 1.0e-04 loss: 1.734e-01]mindexpander_qwen_v1:  72%|#######1  | 2158/3000 [2:25:25<44:38,  3.18s/it, lr: 1.0e-04 loss: 1.734e-01]mindexpander_qwen_v1:  72%|#######1  | 2159/3000 [2:25:25<47:34,  3.39s/it, lr: 1.0e-04 loss: 1.734e-01]mindexpander_qwen_v1:  72%|#######1  | 2159/3000 [2:25:25<47:34,  3.39s/it, lr: 1.0e-04 loss: 1.734e-01]mindexpander_qwen_v1:  72%|#######1  | 2159/3000 [2:25:28<47:34,  3.39s/it, lr: 1.0e-04 loss: 6.860e-02]mindexpander_qwen_v1:  72%|#######1  | 2159/3000 [2:25:28<47:34,  3.39s/it, lr: 1.0e-04 loss: 6.860e-02]mindexpander_qwen_v1:  72%|#######2  | 2160/3000 [2:25:32<47:31,  3.39s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  72%|#######2  | 2160/3000 [2:25:32<47:31,  3.39s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  72%|#######2  | 2161/3000 [2:25:32<37:44,  2.70s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  72%|#######2  | 2161/3000 [2:25:32<37:44,  2.70s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  72%|#######2  | 2161/3000 [2:25:34<37:44,  2.70s/it, lr: 1.0e-04 loss: 7.577e-02]mindexpander_qwen_v1:  72%|#######2  | 2161/3000 [2:25:34<37:44,  2.70s/it, lr: 1.0e-04 loss: 7.577e-02]mindexpander_qwen_v1:  72%|#######2  | 2162/3000 [2:25:34<36:50,  2.64s/it, lr: 1.0e-04 loss: 7.577e-02]mindexpander_qwen_v1:  72%|#######2  | 2162/3000 [2:25:34<36:50,  2.64s/it, lr: 1.0e-04 loss: 7.577e-02]mindexpander_qwen_v1:  72%|#######2  | 2162/3000 [2:25:37<36:50,  2.64s/it, lr: 1.0e-04 loss: 1.748e-01]mindexpander_qwen_v1:  72%|#######2  | 2162/3000 [2:25:37<36:50,  2.64s/it, lr: 1.0e-04 loss: 1.748e-01]mindexpander_qwen_v1:  72%|#######2  | 2163/3000 [2:25:37<37:05,  2.66s/it, lr: 1.0e-04 loss: 1.748e-01]mindexpander_qwen_v1:  72%|#######2  | 2163/3000 [2:25:37<37:05,  2.66s/it, lr: 1.0e-04 loss: 1.748e-01]mindexpander_qwen_v1:  72%|#######2  | 2163/3000 [2:25:43<37:05,  2.66s/it, lr: 1.0e-04 loss: 8.338e-02]mindexpander_qwen_v1:  72%|#######2  | 2163/3000 [2:25:43<37:05,  2.66s/it, lr: 1.0e-04 loss: 8.338e-02]mindexpander_qwen_v1:  72%|#######2  | 2164/3000 [2:25:43<48:44,  3.50s/it, lr: 1.0e-04 loss: 8.338e-02]mindexpander_qwen_v1:  72%|#######2  | 2164/3000 [2:25:43<48:44,  3.50s/it, lr: 1.0e-04 loss: 8.338e-02]mindexpander_qwen_v1:  72%|#######2  | 2164/3000 [2:25:49<48:44,  3.50s/it, lr: 1.0e-04 loss: 5.533e-03]mindexpander_qwen_v1:  72%|#######2  | 2164/3000 [2:25:49<48:44,  3.50s/it, lr: 1.0e-04 loss: 5.533e-03]mindexpander_qwen_v1:  72%|#######2  | 2165/3000 [2:25:49<57:26,  4.13s/it, lr: 1.0e-04 loss: 5.533e-03]mindexpander_qwen_v1:  72%|#######2  | 2165/3000 [2:25:49<57:26,  4.13s/it, lr: 1.0e-04 loss: 5.533e-03]mindexpander_qwen_v1:  72%|#######2  | 2165/3000 [2:25:54<57:26,  4.13s/it, lr: 1.0e-04 loss: 1.561e-01]mindexpander_qwen_v1:  72%|#######2  | 2165/3000 [2:25:54<57:26,  4.13s/it, lr: 1.0e-04 loss: 1.561e-01]mindexpander_qwen_v1:  72%|#######2  | 2166/3000 [2:25:54<1:03:49,  4.59s/it, lr: 1.0e-04 loss: 1.561e-01]mindexpander_qwen_v1:  72%|#######2  | 2166/3000 [2:25:54<1:03:49,  4.59s/it, lr: 1.0e-04 loss: 1.561e-01]mindexpander_qwen_v1:  72%|#######2  | 2166/3000 [2:25:57<1:03:49,  4.59s/it, lr: 1.0e-04 loss: 1.217e-01]mindexpander_qwen_v1:  72%|#######2  | 2166/3000 [2:25:57<1:03:49,  4.59s/it, lr: 1.0e-04 loss: 1.217e-01]mindexpander_qwen_v1:  72%|#######2  | 2167/3000 [2:25:57<55:07,  3.97s/it, lr: 1.0e-04 loss: 1.217e-01]  mindexpander_qwen_v1:  72%|#######2  | 2167/3000 [2:25:57<55:07,  3.97s/it, lr: 1.0e-04 loss: 1.217e-01]  mindexpander_qwen_v1:  72%|#######2  | 2167/3000 [2:26:03<55:07,  3.97s/it, lr: 1.0e-04 loss: 2.552e-02]mindexpander_qwen_v1:  72%|#######2  | 2167/3000 [2:26:03<55:07,  3.97s/it, lr: 1.0e-04 loss: 2.552e-02]mindexpander_qwen_v1:  72%|#######2  | 2168/3000 [2:26:03<1:02:54,  4.54s/it, lr: 1.0e-04 loss: 2.552e-02]mindexpander_qwen_v1:  72%|#######2  | 2168/3000 [2:26:03<1:02:54,  4.54s/it, lr: 1.0e-04 loss: 2.552e-02]mindexpander_qwen_v1:  72%|#######2  | 2168/3000 [2:26:07<1:02:54,  4.54s/it, lr: 1.0e-04 loss: 1.352e-01]mindexpander_qwen_v1:  72%|#######2  | 2168/3000 [2:26:07<1:02:54,  4.54s/it, lr: 1.0e-04 loss: 1.352e-01]mindexpander_qwen_v1:  72%|#######2  | 2169/3000 [2:26:07<59:34,  4.30s/it, lr: 1.0e-04 loss: 1.352e-01]  mindexpander_qwen_v1:  72%|#######2  | 2169/3000 [2:26:07<59:34,  4.30s/it, lr: 1.0e-04 loss: 1.352e-01]  mindexpander_qwen_v1:  72%|#######2  | 2169/3000 [2:26:09<59:34,  4.30s/it, lr: 1.0e-04 loss: 1.542e-03]mindexpander_qwen_v1:  72%|#######2  | 2169/3000 [2:26:09<59:34,  4.30s/it, lr: 1.0e-04 loss: 1.542e-03]mindexpander_qwen_v1:  72%|#######2  | 2170/3000 [2:26:15<59:30,  4.30s/it, lr: 1.0e-04 loss: 3.825e-02]mindexpander_qwen_v1:  72%|#######2  | 2170/3000 [2:26:15<59:30,  4.30s/it, lr: 1.0e-04 loss: 3.825e-02]mindexpander_qwen_v1:  72%|#######2  | 2171/3000 [2:26:15<50:28,  3.65s/it, lr: 1.0e-04 loss: 3.825e-02]mindexpander_qwen_v1:  72%|#######2  | 2171/3000 [2:26:15<50:28,  3.65s/it, lr: 1.0e-04 loss: 3.825e-02]mindexpander_qwen_v1:  72%|#######2  | 2171/3000 [2:26:17<50:28,  3.65s/it, lr: 1.0e-04 loss: 8.190e-03]mindexpander_qwen_v1:  72%|#######2  | 2171/3000 [2:26:17<50:28,  3.65s/it, lr: 1.0e-04 loss: 8.190e-03]mindexpander_qwen_v1:  72%|#######2  | 2172/3000 [2:26:17<47:04,  3.41s/it, lr: 1.0e-04 loss: 8.190e-03]mindexpander_qwen_v1:  72%|#######2  | 2172/3000 [2:26:17<47:04,  3.41s/it, lr: 1.0e-04 loss: 8.190e-03]mindexpander_qwen_v1:  72%|#######2  | 2172/3000 [2:26:21<47:04,  3.41s/it, lr: 1.0e-04 loss: 2.423e-02]mindexpander_qwen_v1:  72%|#######2  | 2172/3000 [2:26:21<47:04,  3.41s/it, lr: 1.0e-04 loss: 2.423e-02]mindexpander_qwen_v1:  72%|#######2  | 2173/3000 [2:26:21<48:11,  3.50s/it, lr: 1.0e-04 loss: 2.423e-02]mindexpander_qwen_v1:  72%|#######2  | 2173/3000 [2:26:21<48:11,  3.50s/it, lr: 1.0e-04 loss: 2.423e-02]mindexpander_qwen_v1:  72%|#######2  | 2173/3000 [2:26:27<48:11,  3.50s/it, lr: 1.0e-04 loss: 3.442e-02]mindexpander_qwen_v1:  72%|#######2  | 2173/3000 [2:26:27<48:11,  3.50s/it, lr: 1.0e-04 loss: 3.442e-02]mindexpander_qwen_v1:  72%|#######2  | 2174/3000 [2:26:27<56:35,  4.11s/it, lr: 1.0e-04 loss: 3.442e-02]mindexpander_qwen_v1:  72%|#######2  | 2174/3000 [2:26:27<56:35,  4.11s/it, lr: 1.0e-04 loss: 3.442e-02]mindexpander_qwen_v1:  72%|#######2  | 2174/3000 [2:26:30<56:35,  4.11s/it, lr: 1.0e-04 loss: 8.143e-03]mindexpander_qwen_v1:  72%|#######2  | 2174/3000 [2:26:30<56:35,  4.11s/it, lr: 1.0e-04 loss: 8.143e-03]mindexpander_qwen_v1:  72%|#######2  | 2175/3000 [2:26:30<50:55,  3.70s/it, lr: 1.0e-04 loss: 8.143e-03]mindexpander_qwen_v1:  72%|#######2  | 2175/3000 [2:26:30<50:55,  3.70s/it, lr: 1.0e-04 loss: 8.143e-03]mindexpander_qwen_v1:  72%|#######2  | 2175/3000 [2:26:33<50:55,  3.70s/it, lr: 1.0e-04 loss: 1.337e-01]mindexpander_qwen_v1:  72%|#######2  | 2175/3000 [2:26:33<50:55,  3.70s/it, lr: 1.0e-04 loss: 1.337e-01]mindexpander_qwen_v1:  73%|#######2  | 2176/3000 [2:26:33<51:01,  3.72s/it, lr: 1.0e-04 loss: 1.337e-01]mindexpander_qwen_v1:  73%|#######2  | 2176/3000 [2:26:33<51:01,  3.72s/it, lr: 1.0e-04 loss: 1.337e-01]mindexpander_qwen_v1:  73%|#######2  | 2176/3000 [2:26:37<51:01,  3.72s/it, lr: 1.0e-04 loss: 9.940e-03]mindexpander_qwen_v1:  73%|#######2  | 2176/3000 [2:26:37<51:01,  3.72s/it, lr: 1.0e-04 loss: 9.940e-03]mindexpander_qwen_v1:  73%|#######2  | 2177/3000 [2:26:37<51:05,  3.72s/it, lr: 1.0e-04 loss: 9.940e-03]mindexpander_qwen_v1:  73%|#######2  | 2177/3000 [2:26:37<51:05,  3.72s/it, lr: 1.0e-04 loss: 9.940e-03]mindexpander_qwen_v1:  73%|#######2  | 2177/3000 [2:26:41<51:05,  3.72s/it, lr: 1.0e-04 loss: 1.496e-01]mindexpander_qwen_v1:  73%|#######2  | 2177/3000 [2:26:41<51:05,  3.72s/it, lr: 1.0e-04 loss: 1.496e-01]mindexpander_qwen_v1:  73%|#######2  | 2178/3000 [2:26:41<51:08,  3.73s/it, lr: 1.0e-04 loss: 1.496e-01]mindexpander_qwen_v1:  73%|#######2  | 2178/3000 [2:26:41<51:08,  3.73s/it, lr: 1.0e-04 loss: 1.496e-01]mindexpander_qwen_v1:  73%|#######2  | 2178/3000 [2:26:44<51:08,  3.73s/it, lr: 1.0e-04 loss: 1.754e-01]mindexpander_qwen_v1:  73%|#######2  | 2178/3000 [2:26:44<51:08,  3.73s/it, lr: 1.0e-04 loss: 1.754e-01]mindexpander_qwen_v1:  73%|#######2  | 2179/3000 [2:26:44<46:47,  3.42s/it, lr: 1.0e-04 loss: 1.754e-01]mindexpander_qwen_v1:  73%|#######2  | 2179/3000 [2:26:44<46:47,  3.42s/it, lr: 1.0e-04 loss: 1.754e-01]mindexpander_qwen_v1:  73%|#######2  | 2179/3000 [2:26:49<46:47,  3.42s/it, lr: 1.0e-04 loss: 1.736e-01]mindexpander_qwen_v1:  73%|#######2  | 2179/3000 [2:26:49<46:47,  3.42s/it, lr: 1.0e-04 loss: 1.736e-01]mindexpander_qwen_v1:  73%|#######2  | 2180/3000 [2:26:53<46:43,  3.42s/it, lr: 1.0e-04 loss: 3.839e-02]mindexpander_qwen_v1:  73%|#######2  | 2180/3000 [2:26:53<46:43,  3.42s/it, lr: 1.0e-04 loss: 3.839e-02]mindexpander_qwen_v1:  73%|#######2  | 2181/3000 [2:26:53<37:02,  2.71s/it, lr: 1.0e-04 loss: 3.839e-02]mindexpander_qwen_v1:  73%|#######2  | 2181/3000 [2:26:53<37:02,  2.71s/it, lr: 1.0e-04 loss: 3.839e-02]mindexpander_qwen_v1:  73%|#######2  | 2181/3000 [2:26:59<37:02,  2.71s/it, lr: 1.0e-04 loss: 1.835e-01]mindexpander_qwen_v1:  73%|#######2  | 2181/3000 [2:26:59<37:02,  2.71s/it, lr: 1.0e-04 loss: 1.835e-01]mindexpander_qwen_v1:  73%|#######2  | 2182/3000 [2:26:59<47:18,  3.47s/it, lr: 1.0e-04 loss: 1.835e-01]mindexpander_qwen_v1:  73%|#######2  | 2182/3000 [2:26:59<47:18,  3.47s/it, lr: 1.0e-04 loss: 1.835e-01]mindexpander_qwen_v1:  73%|#######2  | 2182/3000 [2:27:03<47:18,  3.47s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  73%|#######2  | 2182/3000 [2:27:03<47:18,  3.47s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  73%|#######2  | 2183/3000 [2:27:03<48:26,  3.56s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  73%|#######2  | 2183/3000 [2:27:03<48:26,  3.56s/it, lr: 1.0e-04 loss: 8.778e-02]mindexpander_qwen_v1:  73%|#######2  | 2183/3000 [2:27:09<48:26,  3.56s/it, lr: 1.0e-04 loss: 7.611e-02]mindexpander_qwen_v1:  73%|#######2  | 2183/3000 [2:27:09<48:26,  3.56s/it, lr: 1.0e-04 loss: 7.611e-02]mindexpander_qwen_v1:  73%|#######2  | 2184/3000 [2:27:09<57:01,  4.19s/it, lr: 1.0e-04 loss: 7.611e-02]mindexpander_qwen_v1:  73%|#######2  | 2184/3000 [2:27:09<57:01,  4.19s/it, lr: 1.0e-04 loss: 7.611e-02]mindexpander_qwen_v1:  73%|#######2  | 2184/3000 [2:27:11<57:01,  4.19s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:  73%|#######2  | 2184/3000 [2:27:11<57:01,  4.19s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:  73%|#######2  | 2185/3000 [2:27:11<50:21,  3.71s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:  73%|#######2  | 2185/3000 [2:27:11<50:21,  3.71s/it, lr: 1.0e-04 loss: 1.162e-01]mindexpander_qwen_v1:  73%|#######2  | 2185/3000 [2:27:15<50:21,  3.71s/it, lr: 1.0e-04 loss: 1.843e-02]mindexpander_qwen_v1:  73%|#######2  | 2185/3000 [2:27:15<50:21,  3.71s/it, lr: 1.0e-04 loss: 1.843e-02]mindexpander_qwen_v1:  73%|#######2  | 2186/3000 [2:27:15<50:26,  3.72s/it, lr: 1.0e-04 loss: 1.843e-02]mindexpander_qwen_v1:  73%|#######2  | 2186/3000 [2:27:15<50:26,  3.72s/it, lr: 1.0e-04 loss: 1.843e-02]mindexpander_qwen_v1:  73%|#######2  | 2186/3000 [2:27:19<50:26,  3.72s/it, lr: 1.0e-04 loss: 8.945e-02]mindexpander_qwen_v1:  73%|#######2  | 2186/3000 [2:27:19<50:26,  3.72s/it, lr: 1.0e-04 loss: 8.945e-02]mindexpander_qwen_v1:  73%|#######2  | 2187/3000 [2:27:19<51:07,  3.77s/it, lr: 1.0e-04 loss: 8.945e-02]mindexpander_qwen_v1:  73%|#######2  | 2187/3000 [2:27:19<51:07,  3.77s/it, lr: 1.0e-04 loss: 8.945e-02]mindexpander_qwen_v1:  73%|#######2  | 2187/3000 [2:27:24<51:07,  3.77s/it, lr: 1.0e-04 loss: 1.257e-01]mindexpander_qwen_v1:  73%|#######2  | 2187/3000 [2:27:24<51:07,  3.77s/it, lr: 1.0e-04 loss: 1.257e-01]mindexpander_qwen_v1:  73%|#######2  | 2188/3000 [2:27:24<58:53,  4.35s/it, lr: 1.0e-04 loss: 1.257e-01]mindexpander_qwen_v1:  73%|#######2  | 2188/3000 [2:27:24<58:53,  4.35s/it, lr: 1.0e-04 loss: 1.257e-01]mindexpander_qwen_v1:  73%|#######2  | 2188/3000 [2:27:27<58:53,  4.35s/it, lr: 1.0e-04 loss: 2.314e-02]mindexpander_qwen_v1:  73%|#######2  | 2188/3000 [2:27:27<58:53,  4.35s/it, lr: 1.0e-04 loss: 2.314e-02]mindexpander_qwen_v1:  73%|#######2  | 2189/3000 [2:27:27<51:14,  3.79s/it, lr: 1.0e-04 loss: 2.314e-02]mindexpander_qwen_v1:  73%|#######2  | 2189/3000 [2:27:27<51:14,  3.79s/it, lr: 1.0e-04 loss: 2.314e-02]mindexpander_qwen_v1:  73%|#######2  | 2189/3000 [2:27:30<51:14,  3.79s/it, lr: 1.0e-04 loss: 4.576e-02]mindexpander_qwen_v1:  73%|#######2  | 2189/3000 [2:27:30<51:14,  3.79s/it, lr: 1.0e-04 loss: 4.576e-02]mindexpander_qwen_v1:  73%|#######3  | 2190/3000 [2:27:36<51:10,  3.79s/it, lr: 1.0e-04 loss: 7.424e-02]mindexpander_qwen_v1:  73%|#######3  | 2190/3000 [2:27:36<51:10,  3.79s/it, lr: 1.0e-04 loss: 7.424e-02]mindexpander_qwen_v1:  73%|#######3  | 2191/3000 [2:27:36<46:10,  3.42s/it, lr: 1.0e-04 loss: 7.424e-02]mindexpander_qwen_v1:  73%|#######3  | 2191/3000 [2:27:36<46:10,  3.42s/it, lr: 1.0e-04 loss: 7.424e-02]mindexpander_qwen_v1:  73%|#######3  | 2191/3000 [2:27:38<46:10,  3.42s/it, lr: 1.0e-04 loss: 3.724e-02]mindexpander_qwen_v1:  73%|#######3  | 2191/3000 [2:27:38<46:10,  3.42s/it, lr: 1.0e-04 loss: 3.724e-02]mindexpander_qwen_v1:  73%|#######3  | 2192/3000 [2:27:38<42:53,  3.18s/it, lr: 1.0e-04 loss: 3.724e-02]mindexpander_qwen_v1:  73%|#######3  | 2192/3000 [2:27:38<42:53,  3.18s/it, lr: 1.0e-04 loss: 3.724e-02]mindexpander_qwen_v1:  73%|#######3  | 2192/3000 [2:27:41<42:53,  3.18s/it, lr: 1.0e-04 loss: 3.803e-02]mindexpander_qwen_v1:  73%|#######3  | 2192/3000 [2:27:41<42:53,  3.18s/it, lr: 1.0e-04 loss: 3.803e-02]mindexpander_qwen_v1:  73%|#######3  | 2193/3000 [2:27:41<40:16,  2.99s/it, lr: 1.0e-04 loss: 3.803e-02]mindexpander_qwen_v1:  73%|#######3  | 2193/3000 [2:27:41<40:16,  2.99s/it, lr: 1.0e-04 loss: 3.803e-02]mindexpander_qwen_v1:  73%|#######3  | 2193/3000 [2:27:44<40:16,  2.99s/it, lr: 1.0e-04 loss: 2.388e-02]mindexpander_qwen_v1:  73%|#######3  | 2193/3000 [2:27:44<40:16,  2.99s/it, lr: 1.0e-04 loss: 2.388e-02]mindexpander_qwen_v1:  73%|#######3  | 2194/3000 [2:27:44<42:59,  3.20s/it, lr: 1.0e-04 loss: 2.388e-02]mindexpander_qwen_v1:  73%|#######3  | 2194/3000 [2:27:44<42:59,  3.20s/it, lr: 1.0e-04 loss: 2.388e-02]mindexpander_qwen_v1:  73%|#######3  | 2194/3000 [2:27:47<42:59,  3.20s/it, lr: 1.0e-04 loss: 8.007e-02]mindexpander_qwen_v1:  73%|#######3  | 2194/3000 [2:27:47<42:59,  3.20s/it, lr: 1.0e-04 loss: 8.007e-02]mindexpander_qwen_v1:  73%|#######3  | 2195/3000 [2:27:47<40:07,  2.99s/it, lr: 1.0e-04 loss: 8.007e-02]mindexpander_qwen_v1:  73%|#######3  | 2195/3000 [2:27:47<40:07,  2.99s/it, lr: 1.0e-04 loss: 8.007e-02]mindexpander_qwen_v1:  73%|#######3  | 2195/3000 [2:27:50<40:07,  2.99s/it, lr: 1.0e-04 loss: 4.487e-02]mindexpander_qwen_v1:  73%|#######3  | 2195/3000 [2:27:50<40:07,  2.99s/it, lr: 1.0e-04 loss: 4.487e-02]mindexpander_qwen_v1:  73%|#######3  | 2196/3000 [2:27:50<38:49,  2.90s/it, lr: 1.0e-04 loss: 4.487e-02]mindexpander_qwen_v1:  73%|#######3  | 2196/3000 [2:27:50<38:49,  2.90s/it, lr: 1.0e-04 loss: 4.487e-02]mindexpander_qwen_v1:  73%|#######3  | 2196/3000 [2:27:55<38:49,  2.90s/it, lr: 1.0e-04 loss: 4.904e-03]mindexpander_qwen_v1:  73%|#######3  | 2196/3000 [2:27:55<38:49,  2.90s/it, lr: 1.0e-04 loss: 4.904e-03]mindexpander_qwen_v1:  73%|#######3  | 2197/3000 [2:27:55<49:51,  3.73s/it, lr: 1.0e-04 loss: 4.904e-03]mindexpander_qwen_v1:  73%|#######3  | 2197/3000 [2:27:55<49:51,  3.73s/it, lr: 1.0e-04 loss: 4.904e-03]mindexpander_qwen_v1:  73%|#######3  | 2197/3000 [2:28:01<49:51,  3.73s/it, lr: 1.0e-04 loss: 9.951e-02]mindexpander_qwen_v1:  73%|#######3  | 2197/3000 [2:28:01<49:51,  3.73s/it, lr: 1.0e-04 loss: 9.951e-02]mindexpander_qwen_v1:  73%|#######3  | 2198/3000 [2:28:01<57:44,  4.32s/it, lr: 1.0e-04 loss: 9.951e-02]mindexpander_qwen_v1:  73%|#######3  | 2198/3000 [2:28:01<57:44,  4.32s/it, lr: 1.0e-04 loss: 9.951e-02]mindexpander_qwen_v1:  73%|#######3  | 2198/3000 [2:28:04<57:44,  4.32s/it, lr: 1.0e-04 loss: 1.185e-01]mindexpander_qwen_v1:  73%|#######3  | 2198/3000 [2:28:04<57:44,  4.32s/it, lr: 1.0e-04 loss: 1.185e-01]mindexpander_qwen_v1:  73%|#######3  | 2199/3000 [2:28:04<50:19,  3.77s/it, lr: 1.0e-04 loss: 1.185e-01]mindexpander_qwen_v1:  73%|#######3  | 2199/3000 [2:28:04<50:19,  3.77s/it, lr: 1.0e-04 loss: 1.185e-01]mindexpander_qwen_v1:  73%|#######3  | 2199/3000 [2:28:06<50:19,  3.77s/it, lr: 1.0e-04 loss: 1.127e-01]mindexpander_qwen_v1:  73%|#######3  | 2199/3000 [2:28:06<50:19,  3.77s/it, lr: 1.0e-04 loss: 1.127e-01]mindexpander_qwen_v1:  73%|#######3  | 2200/3000 [2:28:09<50:15,  3.77s/it, lr: 1.0e-04 loss: 9.998e-02]mindexpander_qwen_v1:  73%|#######3  | 2200/3000 [2:28:09<50:15,  3.77s/it, lr: 1.0e-04 loss: 9.998e-02]mindexpander_qwen_v1:  73%|#######3  | 2201/3000 [2:28:09<34:43,  2.61s/it, lr: 1.0e-04 loss: 9.998e-02]mindexpander_qwen_v1:  73%|#######3  | 2201/3000 [2:28:09<34:43,  2.61s/it, lr: 1.0e-04 loss: 9.998e-02]mindexpander_qwen_v1:  73%|#######3  | 2201/3000 [2:28:12<34:43,  2.61s/it, lr: 1.0e-04 loss: 1.344e-01]mindexpander_qwen_v1:  73%|#######3  | 2201/3000 [2:28:12<34:43,  2.61s/it, lr: 1.0e-04 loss: 1.344e-01]mindexpander_qwen_v1:  73%|#######3  | 2202/3000 [2:28:12<38:25,  2.89s/it, lr: 1.0e-04 loss: 1.344e-01]mindexpander_qwen_v1:  73%|#######3  | 2202/3000 [2:28:12<38:25,  2.89s/it, lr: 1.0e-04 loss: 1.344e-01]mindexpander_qwen_v1:  73%|#######3  | 2202/3000 [2:28:16<38:25,  2.89s/it, lr: 1.0e-04 loss: 1.407e-01]mindexpander_qwen_v1:  73%|#######3  | 2202/3000 [2:28:16<38:25,  2.89s/it, lr: 1.0e-04 loss: 1.407e-01]mindexpander_qwen_v1:  73%|#######3  | 2203/3000 [2:28:16<41:53,  3.15s/it, lr: 1.0e-04 loss: 1.407e-01]mindexpander_qwen_v1:  73%|#######3  | 2203/3000 [2:28:16<41:53,  3.15s/it, lr: 1.0e-04 loss: 1.407e-01]mindexpander_qwen_v1:  73%|#######3  | 2203/3000 [2:28:20<41:53,  3.15s/it, lr: 1.0e-04 loss: 8.794e-02]mindexpander_qwen_v1:  73%|#######3  | 2203/3000 [2:28:20<41:53,  3.15s/it, lr: 1.0e-04 loss: 8.794e-02]mindexpander_qwen_v1:  73%|#######3  | 2204/3000 [2:28:20<43:57,  3.31s/it, lr: 1.0e-04 loss: 8.794e-02]mindexpander_qwen_v1:  73%|#######3  | 2204/3000 [2:28:20<43:57,  3.31s/it, lr: 1.0e-04 loss: 8.794e-02]mindexpander_qwen_v1:  73%|#######3  | 2204/3000 [2:28:22<43:57,  3.31s/it, lr: 1.0e-04 loss: 1.194e-01]mindexpander_qwen_v1:  73%|#######3  | 2204/3000 [2:28:22<43:57,  3.31s/it, lr: 1.0e-04 loss: 1.194e-01]mindexpander_qwen_v1:  74%|#######3  | 2205/3000 [2:28:22<40:43,  3.07s/it, lr: 1.0e-04 loss: 1.194e-01]mindexpander_qwen_v1:  74%|#######3  | 2205/3000 [2:28:22<40:43,  3.07s/it, lr: 1.0e-04 loss: 1.194e-01]mindexpander_qwen_v1:  74%|#######3  | 2205/3000 [2:28:28<40:43,  3.07s/it, lr: 1.0e-04 loss: 1.929e-02]mindexpander_qwen_v1:  74%|#######3  | 2205/3000 [2:28:28<40:43,  3.07s/it, lr: 1.0e-04 loss: 1.929e-02]mindexpander_qwen_v1:  74%|#######3  | 2206/3000 [2:28:28<50:48,  3.84s/it, lr: 1.0e-04 loss: 1.929e-02]mindexpander_qwen_v1:  74%|#######3  | 2206/3000 [2:28:28<50:48,  3.84s/it, lr: 1.0e-04 loss: 1.929e-02]mindexpander_qwen_v1:  74%|#######3  | 2206/3000 [2:28:32<50:48,  3.84s/it, lr: 1.0e-04 loss: 9.116e-02]mindexpander_qwen_v1:  74%|#######3  | 2206/3000 [2:28:32<50:48,  3.84s/it, lr: 1.0e-04 loss: 9.116e-02]mindexpander_qwen_v1:  74%|#######3  | 2207/3000 [2:28:32<51:10,  3.87s/it, lr: 1.0e-04 loss: 9.116e-02]mindexpander_qwen_v1:  74%|#######3  | 2207/3000 [2:28:32<51:10,  3.87s/it, lr: 1.0e-04 loss: 9.116e-02]mindexpander_qwen_v1:  74%|#######3  | 2207/3000 [2:28:36<51:10,  3.87s/it, lr: 1.0e-04 loss: 1.928e-01]mindexpander_qwen_v1:  74%|#######3  | 2207/3000 [2:28:36<51:10,  3.87s/it, lr: 1.0e-04 loss: 1.928e-01]mindexpander_qwen_v1:  74%|#######3  | 2208/3000 [2:28:36<50:36,  3.83s/it, lr: 1.0e-04 loss: 1.928e-01]mindexpander_qwen_v1:  74%|#######3  | 2208/3000 [2:28:36<50:36,  3.83s/it, lr: 1.0e-04 loss: 1.928e-01]mindexpander_qwen_v1:  74%|#######3  | 2208/3000 [2:28:42<50:36,  3.83s/it, lr: 1.0e-04 loss: 5.222e-02]mindexpander_qwen_v1:  74%|#######3  | 2208/3000 [2:28:42<50:36,  3.83s/it, lr: 1.0e-04 loss: 5.222e-02]mindexpander_qwen_v1:  74%|#######3  | 2209/3000 [2:28:42<58:05,  4.41s/it, lr: 1.0e-04 loss: 5.222e-02]mindexpander_qwen_v1:  74%|#######3  | 2209/3000 [2:28:42<58:05,  4.41s/it, lr: 1.0e-04 loss: 5.222e-02]mindexpander_qwen_v1:  74%|#######3  | 2209/3000 [2:28:45<58:05,  4.41s/it, lr: 1.0e-04 loss: 1.423e-01]mindexpander_qwen_v1:  74%|#######3  | 2209/3000 [2:28:45<58:05,  4.41s/it, lr: 1.0e-04 loss: 1.423e-01]mindexpander_qwen_v1:  74%|#######3  | 2210/3000 [2:28:51<58:00,  4.41s/it, lr: 1.0e-04 loss: 1.732e-01]mindexpander_qwen_v1:  74%|#######3  | 2210/3000 [2:28:51<58:00,  4.41s/it, lr: 1.0e-04 loss: 1.732e-01]mindexpander_qwen_v1:  74%|#######3  | 2211/3000 [2:28:51<48:43,  3.71s/it, lr: 1.0e-04 loss: 1.732e-01]mindexpander_qwen_v1:  74%|#######3  | 2211/3000 [2:28:51<48:43,  3.71s/it, lr: 1.0e-04 loss: 1.732e-01]mindexpander_qwen_v1:  74%|#######3  | 2211/3000 [2:28:57<48:43,  3.71s/it, lr: 1.0e-04 loss: 1.766e-01]mindexpander_qwen_v1:  74%|#######3  | 2211/3000 [2:28:57<48:43,  3.71s/it, lr: 1.0e-04 loss: 1.766e-01]mindexpander_qwen_v1:  74%|#######3  | 2212/3000 [2:28:57<55:44,  4.24s/it, lr: 1.0e-04 loss: 1.766e-01]mindexpander_qwen_v1:  74%|#######3  | 2212/3000 [2:28:57<55:44,  4.24s/it, lr: 1.0e-04 loss: 1.766e-01]mindexpander_qwen_v1:  74%|#######3  | 2212/3000 [2:29:03<55:44,  4.24s/it, lr: 1.0e-04 loss: 4.538e-02]mindexpander_qwen_v1:  74%|#######3  | 2212/3000 [2:29:03<55:44,  4.24s/it, lr: 1.0e-04 loss: 4.538e-02]mindexpander_qwen_v1:  74%|#######3  | 2213/3000 [2:29:03<1:00:54,  4.64s/it, lr: 1.0e-04 loss: 4.538e-02]mindexpander_qwen_v1:  74%|#######3  | 2213/3000 [2:29:03<1:00:54,  4.64s/it, lr: 1.0e-04 loss: 4.538e-02]mindexpander_qwen_v1:  74%|#######3  | 2213/3000 [2:29:09<1:00:54,  4.64s/it, lr: 1.0e-04 loss: 1.298e-02]mindexpander_qwen_v1:  74%|#######3  | 2213/3000 [2:29:09<1:00:54,  4.64s/it, lr: 1.0e-04 loss: 1.298e-02]mindexpander_qwen_v1:  74%|#######3  | 2214/3000 [2:29:09<1:04:52,  4.95s/it, lr: 1.0e-04 loss: 1.298e-02]mindexpander_qwen_v1:  74%|#######3  | 2214/3000 [2:29:09<1:04:52,  4.95s/it, lr: 1.0e-04 loss: 1.298e-02]mindexpander_qwen_v1:  74%|#######3  | 2214/3000 [2:29:13<1:04:52,  4.95s/it, lr: 1.0e-04 loss: 3.579e-03]mindexpander_qwen_v1:  74%|#######3  | 2214/3000 [2:29:13<1:04:52,  4.95s/it, lr: 1.0e-04 loss: 3.579e-03]mindexpander_qwen_v1:  74%|#######3  | 2215/3000 [2:29:13<1:01:06,  4.67s/it, lr: 1.0e-04 loss: 3.579e-03]mindexpander_qwen_v1:  74%|#######3  | 2215/3000 [2:29:13<1:01:06,  4.67s/it, lr: 1.0e-04 loss: 3.579e-03]mindexpander_qwen_v1:  74%|#######3  | 2215/3000 [2:29:15<1:01:06,  4.67s/it, lr: 1.0e-04 loss: 2.153e-02]mindexpander_qwen_v1:  74%|#######3  | 2215/3000 [2:29:15<1:01:06,  4.67s/it, lr: 1.0e-04 loss: 2.153e-02]mindexpander_qwen_v1:  74%|#######3  | 2216/3000 [2:29:15<52:50,  4.04s/it, lr: 1.0e-04 loss: 2.153e-02]  mindexpander_qwen_v1:  74%|#######3  | 2216/3000 [2:29:15<52:50,  4.04s/it, lr: 1.0e-04 loss: 2.153e-02]  mindexpander_qwen_v1:  74%|#######3  | 2216/3000 [2:29:21<52:50,  4.04s/it, lr: 1.0e-04 loss: 1.485e-01]mindexpander_qwen_v1:  74%|#######3  | 2216/3000 [2:29:21<52:50,  4.04s/it, lr: 1.0e-04 loss: 1.485e-01]mindexpander_qwen_v1:  74%|#######3  | 2217/3000 [2:29:21<59:16,  4.54s/it, lr: 1.0e-04 loss: 1.485e-01]mindexpander_qwen_v1:  74%|#######3  | 2217/3000 [2:29:21<59:16,  4.54s/it, lr: 1.0e-04 loss: 1.485e-01]mindexpander_qwen_v1:  74%|#######3  | 2217/3000 [2:29:25<59:16,  4.54s/it, lr: 1.0e-04 loss: 3.082e-02]mindexpander_qwen_v1:  74%|#######3  | 2217/3000 [2:29:25<59:16,  4.54s/it, lr: 1.0e-04 loss: 3.082e-02]mindexpander_qwen_v1:  74%|#######3  | 2218/3000 [2:29:25<56:09,  4.31s/it, lr: 1.0e-04 loss: 3.082e-02]mindexpander_qwen_v1:  74%|#######3  | 2218/3000 [2:29:25<56:09,  4.31s/it, lr: 1.0e-04 loss: 3.082e-02]mindexpander_qwen_v1:  74%|#######3  | 2218/3000 [2:29:29<56:09,  4.31s/it, lr: 1.0e-04 loss: 3.648e-02]mindexpander_qwen_v1:  74%|#######3  | 2218/3000 [2:29:29<56:09,  4.31s/it, lr: 1.0e-04 loss: 3.648e-02]mindexpander_qwen_v1:  74%|#######3  | 2219/3000 [2:29:29<54:40,  4.20s/it, lr: 1.0e-04 loss: 3.648e-02]mindexpander_qwen_v1:  74%|#######3  | 2219/3000 [2:29:29<54:40,  4.20s/it, lr: 1.0e-04 loss: 3.648e-02]mindexpander_qwen_v1:  74%|#######3  | 2219/3000 [2:29:35<54:40,  4.20s/it, lr: 1.0e-04 loss: 7.353e-02]mindexpander_qwen_v1:  74%|#######3  | 2219/3000 [2:29:35<54:40,  4.20s/it, lr: 1.0e-04 loss: 7.353e-02]mindexpander_qwen_v1:  74%|#######4  | 2220/3000 [2:29:40<54:36,  4.20s/it, lr: 1.0e-04 loss: 8.768e-02]mindexpander_qwen_v1:  74%|#######4  | 2220/3000 [2:29:40<54:36,  4.20s/it, lr: 1.0e-04 loss: 8.768e-02]mindexpander_qwen_v1:  74%|#######4  | 2221/3000 [2:29:40<46:41,  3.60s/it, lr: 1.0e-04 loss: 8.768e-02]mindexpander_qwen_v1:  74%|#######4  | 2221/3000 [2:29:40<46:41,  3.60s/it, lr: 1.0e-04 loss: 8.768e-02]mindexpander_qwen_v1:  74%|#######4  | 2221/3000 [2:29:46<46:41,  3.60s/it, lr: 1.0e-04 loss: 5.281e-02]mindexpander_qwen_v1:  74%|#######4  | 2221/3000 [2:29:46<46:41,  3.60s/it, lr: 1.0e-04 loss: 5.281e-02]mindexpander_qwen_v1:  74%|#######4  | 2222/3000 [2:29:46<53:33,  4.13s/it, lr: 1.0e-04 loss: 5.281e-02]mindexpander_qwen_v1:  74%|#######4  | 2222/3000 [2:29:46<53:33,  4.13s/it, lr: 1.0e-04 loss: 5.281e-02]mindexpander_qwen_v1:  74%|#######4  | 2222/3000 [2:29:52<53:33,  4.13s/it, lr: 1.0e-04 loss: 9.174e-02]mindexpander_qwen_v1:  74%|#######4  | 2222/3000 [2:29:52<53:33,  4.13s/it, lr: 1.0e-04 loss: 9.174e-02]mindexpander_qwen_v1:  74%|#######4  | 2223/3000 [2:29:52<58:59,  4.55s/it, lr: 1.0e-04 loss: 9.174e-02]mindexpander_qwen_v1:  74%|#######4  | 2223/3000 [2:29:52<58:59,  4.55s/it, lr: 1.0e-04 loss: 9.174e-02]mindexpander_qwen_v1:  74%|#######4  | 2223/3000 [2:29:56<58:59,  4.55s/it, lr: 1.0e-04 loss: 4.316e-03]mindexpander_qwen_v1:  74%|#######4  | 2223/3000 [2:29:56<58:59,  4.55s/it, lr: 1.0e-04 loss: 4.316e-03]mindexpander_qwen_v1:  74%|#######4  | 2224/3000 [2:29:56<57:02,  4.41s/it, lr: 1.0e-04 loss: 4.316e-03]mindexpander_qwen_v1:  74%|#######4  | 2224/3000 [2:29:56<57:02,  4.41s/it, lr: 1.0e-04 loss: 4.316e-03]mindexpander_qwen_v1:  74%|#######4  | 2224/3000 [2:30:00<57:02,  4.41s/it, lr: 1.0e-04 loss: 2.001e-03]mindexpander_qwen_v1:  74%|#######4  | 2224/3000 [2:30:00<57:02,  4.41s/it, lr: 1.0e-04 loss: 2.001e-03]mindexpander_qwen_v1:  74%|#######4  | 2225/3000 [2:30:00<54:34,  4.22s/it, lr: 1.0e-04 loss: 2.001e-03]mindexpander_qwen_v1:  74%|#######4  | 2225/3000 [2:30:00<54:34,  4.22s/it, lr: 1.0e-04 loss: 2.001e-03]mindexpander_qwen_v1:  74%|#######4  | 2225/3000 [2:30:03<54:34,  4.22s/it, lr: 1.0e-04 loss: 3.133e-02]mindexpander_qwen_v1:  74%|#######4  | 2225/3000 [2:30:03<54:34,  4.22s/it, lr: 1.0e-04 loss: 3.133e-02]mindexpander_qwen_v1:  74%|#######4  | 2226/3000 [2:30:03<52:46,  4.09s/it, lr: 1.0e-04 loss: 3.133e-02]mindexpander_qwen_v1:  74%|#######4  | 2226/3000 [2:30:03<52:46,  4.09s/it, lr: 1.0e-04 loss: 3.133e-02]mindexpander_qwen_v1:  74%|#######4  | 2226/3000 [2:30:06<52:46,  4.09s/it, lr: 1.0e-04 loss: 1.974e-01]mindexpander_qwen_v1:  74%|#######4  | 2226/3000 [2:30:06<52:46,  4.09s/it, lr: 1.0e-04 loss: 1.974e-01]mindexpander_qwen_v1:  74%|#######4  | 2227/3000 [2:30:06<46:40,  3.62s/it, lr: 1.0e-04 loss: 1.974e-01]mindexpander_qwen_v1:  74%|#######4  | 2227/3000 [2:30:06<46:40,  3.62s/it, lr: 1.0e-04 loss: 1.974e-01]mindexpander_qwen_v1:  74%|#######4  | 2227/3000 [2:30:12<46:40,  3.62s/it, lr: 1.0e-04 loss: 1.649e-01]mindexpander_qwen_v1:  74%|#######4  | 2227/3000 [2:30:12<46:40,  3.62s/it, lr: 1.0e-04 loss: 1.649e-01]mindexpander_qwen_v1:  74%|#######4  | 2228/3000 [2:30:12<55:09,  4.29s/it, lr: 1.0e-04 loss: 1.649e-01]mindexpander_qwen_v1:  74%|#######4  | 2228/3000 [2:30:12<55:09,  4.29s/it, lr: 1.0e-04 loss: 1.649e-01]mindexpander_qwen_v1:  74%|#######4  | 2228/3000 [2:30:16<55:09,  4.29s/it, lr: 1.0e-04 loss: 5.167e-02]mindexpander_qwen_v1:  74%|#######4  | 2228/3000 [2:30:16<55:09,  4.29s/it, lr: 1.0e-04 loss: 5.167e-02]mindexpander_qwen_v1:  74%|#######4  | 2229/3000 [2:30:16<53:06,  4.13s/it, lr: 1.0e-04 loss: 5.167e-02]mindexpander_qwen_v1:  74%|#######4  | 2229/3000 [2:30:16<53:06,  4.13s/it, lr: 1.0e-04 loss: 5.167e-02]mindexpander_qwen_v1:  74%|#######4  | 2229/3000 [2:30:19<53:06,  4.13s/it, lr: 1.0e-04 loss: 1.062e-01]mindexpander_qwen_v1:  74%|#######4  | 2229/3000 [2:30:19<53:06,  4.13s/it, lr: 1.0e-04 loss: 1.062e-01]mindexpander_qwen_v1:  74%|#######4  | 2230/3000 [2:30:23<53:02,  4.13s/it, lr: 1.0e-04 loss: 1.785e-01]mindexpander_qwen_v1:  74%|#######4  | 2230/3000 [2:30:23<53:02,  4.13s/it, lr: 1.0e-04 loss: 1.785e-01]mindexpander_qwen_v1:  74%|#######4  | 2231/3000 [2:30:23<40:10,  3.13s/it, lr: 1.0e-04 loss: 1.785e-01]mindexpander_qwen_v1:  74%|#######4  | 2231/3000 [2:30:23<40:10,  3.13s/it, lr: 1.0e-04 loss: 1.785e-01]mindexpander_qwen_v1:  74%|#######4  | 2231/3000 [2:30:29<40:10,  3.13s/it, lr: 1.0e-04 loss: 9.798e-02]mindexpander_qwen_v1:  74%|#######4  | 2231/3000 [2:30:29<40:10,  3.13s/it, lr: 1.0e-04 loss: 9.798e-02]mindexpander_qwen_v1:  74%|#######4  | 2232/3000 [2:30:29<48:23,  3.78s/it, lr: 1.0e-04 loss: 9.798e-02]mindexpander_qwen_v1:  74%|#######4  | 2232/3000 [2:30:29<48:23,  3.78s/it, lr: 1.0e-04 loss: 9.798e-02]mindexpander_qwen_v1:  74%|#######4  | 2232/3000 [2:30:31<48:23,  3.78s/it, lr: 1.0e-04 loss: 1.271e-02]mindexpander_qwen_v1:  74%|#######4  | 2232/3000 [2:30:31<48:23,  3.78s/it, lr: 1.0e-04 loss: 1.271e-02]mindexpander_qwen_v1:  74%|#######4  | 2233/3000 [2:30:31<43:53,  3.43s/it, lr: 1.0e-04 loss: 1.271e-02]mindexpander_qwen_v1:  74%|#######4  | 2233/3000 [2:30:31<43:53,  3.43s/it, lr: 1.0e-04 loss: 1.271e-02]mindexpander_qwen_v1:  74%|#######4  | 2233/3000 [2:30:37<43:53,  3.43s/it, lr: 1.0e-04 loss: 2.723e-02]mindexpander_qwen_v1:  74%|#######4  | 2233/3000 [2:30:37<43:53,  3.43s/it, lr: 1.0e-04 loss: 2.723e-02]mindexpander_qwen_v1:  74%|#######4  | 2234/3000 [2:30:37<51:55,  4.07s/it, lr: 1.0e-04 loss: 2.723e-02]mindexpander_qwen_v1:  74%|#######4  | 2234/3000 [2:30:37<51:55,  4.07s/it, lr: 1.0e-04 loss: 2.723e-02]mindexpander_qwen_v1:  74%|#######4  | 2234/3000 [2:30:40<51:55,  4.07s/it, lr: 1.0e-04 loss: 6.399e-02]mindexpander_qwen_v1:  74%|#######4  | 2234/3000 [2:30:40<51:55,  4.07s/it, lr: 1.0e-04 loss: 6.399e-02]mindexpander_qwen_v1:  74%|#######4  | 2235/3000 [2:30:40<46:47,  3.67s/it, lr: 1.0e-04 loss: 6.399e-02]mindexpander_qwen_v1:  74%|#######4  | 2235/3000 [2:30:40<46:47,  3.67s/it, lr: 1.0e-04 loss: 6.399e-02]mindexpander_qwen_v1:  74%|#######4  | 2235/3000 [2:30:42<46:47,  3.67s/it, lr: 1.0e-04 loss: 3.006e-02]mindexpander_qwen_v1:  74%|#######4  | 2235/3000 [2:30:42<46:47,  3.67s/it, lr: 1.0e-04 loss: 3.006e-02]mindexpander_qwen_v1:  75%|#######4  | 2236/3000 [2:30:42<42:18,  3.32s/it, lr: 1.0e-04 loss: 3.006e-02]mindexpander_qwen_v1:  75%|#######4  | 2236/3000 [2:30:42<42:18,  3.32s/it, lr: 1.0e-04 loss: 3.006e-02]mindexpander_qwen_v1:  75%|#######4  | 2236/3000 [2:30:46<42:18,  3.32s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  75%|#######4  | 2236/3000 [2:30:46<42:18,  3.32s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  75%|#######4  | 2237/3000 [2:30:46<43:47,  3.44s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  75%|#######4  | 2237/3000 [2:30:46<43:47,  3.44s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  75%|#######4  | 2237/3000 [2:30:50<43:47,  3.44s/it, lr: 1.0e-04 loss: 4.289e-02]mindexpander_qwen_v1:  75%|#######4  | 2237/3000 [2:30:50<43:47,  3.44s/it, lr: 1.0e-04 loss: 4.289e-02]mindexpander_qwen_v1:  75%|#######4  | 2238/3000 [2:30:50<44:51,  3.53s/it, lr: 1.0e-04 loss: 4.289e-02]mindexpander_qwen_v1:  75%|#######4  | 2238/3000 [2:30:50<44:51,  3.53s/it, lr: 1.0e-04 loss: 4.289e-02]mindexpander_qwen_v1:  75%|#######4  | 2238/3000 [2:30:52<44:51,  3.53s/it, lr: 1.0e-04 loss: 1.758e-01]mindexpander_qwen_v1:  75%|#######4  | 2238/3000 [2:30:52<44:51,  3.53s/it, lr: 1.0e-04 loss: 1.758e-01]mindexpander_qwen_v1:  75%|#######4  | 2239/3000 [2:30:52<40:45,  3.21s/it, lr: 1.0e-04 loss: 1.758e-01]mindexpander_qwen_v1:  75%|#######4  | 2239/3000 [2:30:52<40:45,  3.21s/it, lr: 1.0e-04 loss: 1.758e-01]mindexpander_qwen_v1:  75%|#######4  | 2239/3000 [2:30:56<40:45,  3.21s/it, lr: 1.0e-04 loss: 6.108e-03]mindexpander_qwen_v1:  75%|#######4  | 2239/3000 [2:30:56<40:45,  3.21s/it, lr: 1.0e-04 loss: 6.108e-03]mindexpander_qwen_v1:  75%|#######4  | 2240/3000 [2:31:00<40:42,  3.21s/it, lr: 1.0e-04 loss: 3.504e-04]mindexpander_qwen_v1:  75%|#######4  | 2240/3000 [2:31:00<40:42,  3.21s/it, lr: 1.0e-04 loss: 3.504e-04]mindexpander_qwen_v1:  75%|#######4  | 2241/3000 [2:31:00<32:54,  2.60s/it, lr: 1.0e-04 loss: 3.504e-04]mindexpander_qwen_v1:  75%|#######4  | 2241/3000 [2:31:00<32:54,  2.60s/it, lr: 1.0e-04 loss: 3.504e-04]mindexpander_qwen_v1:  75%|#######4  | 2241/3000 [2:31:02<32:54,  2.60s/it, lr: 1.0e-04 loss: 2.497e-02]mindexpander_qwen_v1:  75%|#######4  | 2241/3000 [2:31:02<32:54,  2.60s/it, lr: 1.0e-04 loss: 2.497e-02]mindexpander_qwen_v1:  75%|#######4  | 2242/3000 [2:31:02<32:27,  2.57s/it, lr: 1.0e-04 loss: 2.497e-02]mindexpander_qwen_v1:  75%|#######4  | 2242/3000 [2:31:02<32:27,  2.57s/it, lr: 1.0e-04 loss: 2.497e-02]mindexpander_qwen_v1:  75%|#######4  | 2242/3000 [2:31:05<32:27,  2.57s/it, lr: 1.0e-04 loss: 1.148e-01]mindexpander_qwen_v1:  75%|#######4  | 2242/3000 [2:31:05<32:27,  2.57s/it, lr: 1.0e-04 loss: 1.148e-01]mindexpander_qwen_v1:  75%|#######4  | 2243/3000 [2:31:05<32:44,  2.60s/it, lr: 1.0e-04 loss: 1.148e-01]mindexpander_qwen_v1:  75%|#######4  | 2243/3000 [2:31:05<32:44,  2.60s/it, lr: 1.0e-04 loss: 1.148e-01]mindexpander_qwen_v1:  75%|#######4  | 2243/3000 [2:31:08<32:44,  2.60s/it, lr: 1.0e-04 loss: 5.608e-02]mindexpander_qwen_v1:  75%|#######4  | 2243/3000 [2:31:08<32:44,  2.60s/it, lr: 1.0e-04 loss: 5.608e-02]mindexpander_qwen_v1:  75%|#######4  | 2244/3000 [2:31:08<32:16,  2.56s/it, lr: 1.0e-04 loss: 5.608e-02]mindexpander_qwen_v1:  75%|#######4  | 2244/3000 [2:31:08<32:16,  2.56s/it, lr: 1.0e-04 loss: 5.608e-02]mindexpander_qwen_v1:  75%|#######4  | 2244/3000 [2:31:10<32:16,  2.56s/it, lr: 1.0e-04 loss: 3.241e-02]mindexpander_qwen_v1:  75%|#######4  | 2244/3000 [2:31:10<32:16,  2.56s/it, lr: 1.0e-04 loss: 3.241e-02]mindexpander_qwen_v1:  75%|#######4  | 2245/3000 [2:31:10<31:52,  2.53s/it, lr: 1.0e-04 loss: 3.241e-02]mindexpander_qwen_v1:  75%|#######4  | 2245/3000 [2:31:10<31:52,  2.53s/it, lr: 1.0e-04 loss: 3.241e-02]mindexpander_qwen_v1:  75%|#######4  | 2245/3000 [2:31:16<31:52,  2.53s/it, lr: 1.0e-04 loss: 3.312e-02]mindexpander_qwen_v1:  75%|#######4  | 2245/3000 [2:31:16<31:52,  2.53s/it, lr: 1.0e-04 loss: 3.312e-02]mindexpander_qwen_v1:  75%|#######4  | 2246/3000 [2:31:16<43:25,  3.46s/it, lr: 1.0e-04 loss: 3.312e-02]mindexpander_qwen_v1:  75%|#######4  | 2246/3000 [2:31:16<43:25,  3.46s/it, lr: 1.0e-04 loss: 3.312e-02]mindexpander_qwen_v1:  75%|#######4  | 2246/3000 [2:31:18<43:25,  3.46s/it, lr: 1.0e-04 loss: 3.433e-02]mindexpander_qwen_v1:  75%|#######4  | 2246/3000 [2:31:18<43:25,  3.46s/it, lr: 1.0e-04 loss: 3.433e-02]mindexpander_qwen_v1:  75%|#######4  | 2247/3000 [2:31:18<40:30,  3.23s/it, lr: 1.0e-04 loss: 3.433e-02]mindexpander_qwen_v1:  75%|#######4  | 2247/3000 [2:31:18<40:30,  3.23s/it, lr: 1.0e-04 loss: 3.433e-02]mindexpander_qwen_v1:  75%|#######4  | 2247/3000 [2:31:24<40:30,  3.23s/it, lr: 1.0e-04 loss: 1.160e-02]mindexpander_qwen_v1:  75%|#######4  | 2247/3000 [2:31:24<40:30,  3.23s/it, lr: 1.0e-04 loss: 1.160e-02]mindexpander_qwen_v1:  75%|#######4  | 2248/3000 [2:31:24<49:43,  3.97s/it, lr: 1.0e-04 loss: 1.160e-02]mindexpander_qwen_v1:  75%|#######4  | 2248/3000 [2:31:24<49:43,  3.97s/it, lr: 1.0e-04 loss: 1.160e-02]mindexpander_qwen_v1:  75%|#######4  | 2248/3000 [2:31:30<49:43,  3.97s/it, lr: 1.0e-04 loss: 4.576e-02]mindexpander_qwen_v1:  75%|#######4  | 2248/3000 [2:31:30<49:43,  3.97s/it, lr: 1.0e-04 loss: 4.576e-02]mindexpander_qwen_v1:  75%|#######4  | 2249/3000 [2:31:30<56:18,  4.50s/it, lr: 1.0e-04 loss: 4.576e-02]mindexpander_qwen_v1:  75%|#######4  | 2249/3000 [2:31:30<56:18,  4.50s/it, lr: 1.0e-04 loss: 4.576e-02]mindexpander_qwen_v1:  75%|#######4  | 2249/3000 [2:31:34<56:18,  4.50s/it, lr: 1.0e-04 loss: 1.049e-03]mindexpander_qwen_v1:  75%|#######4  | 2249/3000 [2:31:34<56:18,  4.50s/it, lr: 1.0e-04 loss: 1.049e-03]
+Saving at step 2250
+Saved checkpoint to /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000002250.safetensors
+Saved optimizer to /app/ai-toolkit/output/mindexpander_qwen_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000001250.safetensors
+
+
+Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:   0%|          | 0/2 [00:00<?, ?it/s][A[A
+
+Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.63s/it]Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.63s/it][A[A
+
+Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.97s/it]Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.97s/it][A[A
+
+                                                                                                                                [A[Amindexpander_qwen_v1:  75%|#######5  | 2250/3000 [2:31:40<56:13,  4.50s/it, lr: 1.0e-04 loss: 6.739e-02]mindexpander_qwen_v1:  75%|#######5  | 2250/3000 [2:31:40<56:13,  4.50s/it, lr: 1.0e-04 loss: 6.739e-02]mindexpander_qwen_v1:  75%|#######5  | 2251/3000 [2:31:40<47:28,  3.80s/it, lr: 1.0e-04 loss: 6.739e-02]mindexpander_qwen_v1:  75%|#######5  | 2251/3000 [2:31:40<47:28,  3.80s/it, lr: 1.0e-04 loss: 6.739e-02]mindexpander_qwen_v1:  75%|#######5  | 2251/3000 [2:31:42<47:28,  3.80s/it, lr: 1.0e-04 loss: 1.707e-01]mindexpander_qwen_v1:  75%|#######5  | 2251/3000 [2:31:42<47:28,  3.80s/it, lr: 1.0e-04 loss: 1.707e-01]mindexpander_qwen_v1:  75%|#######5  | 2252/3000 [2:31:42<43:17,  3.47s/it, lr: 1.0e-04 loss: 1.707e-01]mindexpander_qwen_v1:  75%|#######5  | 2252/3000 [2:31:42<43:17,  3.47s/it, lr: 1.0e-04 loss: 1.707e-01]mindexpander_qwen_v1:  75%|#######5  | 2252/3000 [2:31:48<43:17,  3.47s/it, lr: 1.0e-04 loss: 1.186e-01]mindexpander_qwen_v1:  75%|#######5  | 2252/3000 [2:31:48<43:17,  3.47s/it, lr: 1.0e-04 loss: 1.186e-01]mindexpander_qwen_v1:  75%|#######5  | 2253/3000 [2:31:48<50:38,  4.07s/it, lr: 1.0e-04 loss: 1.186e-01]mindexpander_qwen_v1:  75%|#######5  | 2253/3000 [2:31:48<50:38,  4.07s/it, lr: 1.0e-04 loss: 1.186e-01]mindexpander_qwen_v1:  75%|#######5  | 2253/3000 [2:31:51<50:38,  4.07s/it, lr: 1.0e-04 loss: 2.933e-02]mindexpander_qwen_v1:  75%|#######5  | 2253/3000 [2:31:51<50:38,  4.07s/it, lr: 1.0e-04 loss: 2.933e-02]mindexpander_qwen_v1:  75%|#######5  | 2254/3000 [2:31:51<45:53,  3.69s/it, lr: 1.0e-04 loss: 2.933e-02]mindexpander_qwen_v1:  75%|#######5  | 2254/3000 [2:31:51<45:53,  3.69s/it, lr: 1.0e-04 loss: 2.933e-02]mindexpander_qwen_v1:  75%|#######5  | 2254/3000 [2:31:57<45:53,  3.69s/it, lr: 1.0e-04 loss: 5.659e-02]mindexpander_qwen_v1:  75%|#######5  | 2254/3000 [2:31:57<45:53,  3.69s/it, lr: 1.0e-04 loss: 5.659e-02]mindexpander_qwen_v1:  75%|#######5  | 2255/3000 [2:31:57<52:59,  4.27s/it, lr: 1.0e-04 loss: 5.659e-02]mindexpander_qwen_v1:  75%|#######5  | 2255/3000 [2:31:57<52:59,  4.27s/it, lr: 1.0e-04 loss: 5.659e-02]mindexpander_qwen_v1:  75%|#######5  | 2255/3000 [2:32:00<52:59,  4.27s/it, lr: 1.0e-04 loss: 1.078e-01]mindexpander_qwen_v1:  75%|#######5  | 2255/3000 [2:32:00<52:59,  4.27s/it, lr: 1.0e-04 loss: 1.078e-01]mindexpander_qwen_v1:  75%|#######5  | 2256/3000 [2:32:00<51:04,  4.12s/it, lr: 1.0e-04 loss: 1.078e-01]mindexpander_qwen_v1:  75%|#######5  | 2256/3000 [2:32:00<51:04,  4.12s/it, lr: 1.0e-04 loss: 1.078e-01]mindexpander_qwen_v1:  75%|#######5  | 2256/3000 [2:32:04<51:04,  4.12s/it, lr: 1.0e-04 loss: 2.393e-02]mindexpander_qwen_v1:  75%|#######5  | 2256/3000 [2:32:04<51:04,  4.12s/it, lr: 1.0e-04 loss: 2.393e-02]mindexpander_qwen_v1:  75%|#######5  | 2257/3000 [2:32:04<49:40,  4.01s/it, lr: 1.0e-04 loss: 2.393e-02]mindexpander_qwen_v1:  75%|#######5  | 2257/3000 [2:32:04<49:40,  4.01s/it, lr: 1.0e-04 loss: 2.393e-02]mindexpander_qwen_v1:  75%|#######5  | 2257/3000 [2:32:08<49:40,  4.01s/it, lr: 1.0e-04 loss: 5.663e-02]mindexpander_qwen_v1:  75%|#######5  | 2257/3000 [2:32:08<49:40,  4.01s/it, lr: 1.0e-04 loss: 5.663e-02]mindexpander_qwen_v1:  75%|#######5  | 2258/3000 [2:32:08<49:13,  3.98s/it, lr: 1.0e-04 loss: 5.663e-02]mindexpander_qwen_v1:  75%|#######5  | 2258/3000 [2:32:08<49:13,  3.98s/it, lr: 1.0e-04 loss: 5.663e-02]mindexpander_qwen_v1:  75%|#######5  | 2258/3000 [2:32:14<49:13,  3.98s/it, lr: 1.0e-04 loss: 1.812e-01]mindexpander_qwen_v1:  75%|#######5  | 2258/3000 [2:32:14<49:13,  3.98s/it, lr: 1.0e-04 loss: 1.812e-01]mindexpander_qwen_v1:  75%|#######5  | 2259/3000 [2:32:14<55:39,  4.51s/it, lr: 1.0e-04 loss: 1.812e-01]mindexpander_qwen_v1:  75%|#######5  | 2259/3000 [2:32:14<55:39,  4.51s/it, lr: 1.0e-04 loss: 1.812e-01]mindexpander_qwen_v1:  75%|#######5  | 2259/3000 [2:32:16<55:39,  4.51s/it, lr: 1.0e-04 loss: 4.507e-02]mindexpander_qwen_v1:  75%|#######5  | 2259/3000 [2:32:16<55:39,  4.51s/it, lr: 1.0e-04 loss: 4.507e-02]mindexpander_qwen_v1:  75%|#######5  | 2260/3000 [2:32:19<55:35,  4.51s/it, lr: 1.0e-04 loss: 2.012e-02]mindexpander_qwen_v1:  75%|#######5  | 2260/3000 [2:32:19<55:35,  4.51s/it, lr: 1.0e-04 loss: 2.012e-02]mindexpander_qwen_v1:  75%|#######5  | 2261/3000 [2:32:19<37:04,  3.01s/it, lr: 1.0e-04 loss: 2.012e-02]mindexpander_qwen_v1:  75%|#######5  | 2261/3000 [2:32:19<37:04,  3.01s/it, lr: 1.0e-04 loss: 2.012e-02]mindexpander_qwen_v1:  75%|#######5  | 2261/3000 [2:32:25<37:04,  3.01s/it, lr: 1.0e-04 loss: 1.208e-01]mindexpander_qwen_v1:  75%|#######5  | 2261/3000 [2:32:25<37:04,  3.01s/it, lr: 1.0e-04 loss: 1.208e-01]mindexpander_qwen_v1:  75%|#######5  | 2262/3000 [2:32:25<45:46,  3.72s/it, lr: 1.0e-04 loss: 1.208e-01]mindexpander_qwen_v1:  75%|#######5  | 2262/3000 [2:32:25<45:46,  3.72s/it, lr: 1.0e-04 loss: 1.208e-01]mindexpander_qwen_v1:  75%|#######5  | 2262/3000 [2:32:27<45:46,  3.72s/it, lr: 1.0e-04 loss: 2.608e-02]mindexpander_qwen_v1:  75%|#######5  | 2262/3000 [2:32:27<45:46,  3.72s/it, lr: 1.0e-04 loss: 2.608e-02]mindexpander_qwen_v1:  75%|#######5  | 2263/3000 [2:32:27<41:43,  3.40s/it, lr: 1.0e-04 loss: 2.608e-02]mindexpander_qwen_v1:  75%|#######5  | 2263/3000 [2:32:27<41:43,  3.40s/it, lr: 1.0e-04 loss: 2.608e-02]mindexpander_qwen_v1:  75%|#######5  | 2263/3000 [2:32:33<41:43,  3.40s/it, lr: 1.0e-04 loss: 1.895e-02]mindexpander_qwen_v1:  75%|#######5  | 2263/3000 [2:32:33<41:43,  3.40s/it, lr: 1.0e-04 loss: 1.895e-02]mindexpander_qwen_v1:  75%|#######5  | 2264/3000 [2:32:33<49:30,  4.04s/it, lr: 1.0e-04 loss: 1.895e-02]mindexpander_qwen_v1:  75%|#######5  | 2264/3000 [2:32:33<49:30,  4.04s/it, lr: 1.0e-04 loss: 1.895e-02]mindexpander_qwen_v1:  75%|#######5  | 2264/3000 [2:32:39<49:30,  4.04s/it, lr: 1.0e-04 loss: 1.801e-01]mindexpander_qwen_v1:  75%|#######5  | 2264/3000 [2:32:39<49:30,  4.04s/it, lr: 1.0e-04 loss: 1.801e-01]mindexpander_qwen_v1:  76%|#######5  | 2265/3000 [2:32:39<55:19,  4.52s/it, lr: 1.0e-04 loss: 1.801e-01]mindexpander_qwen_v1:  76%|#######5  | 2265/3000 [2:32:39<55:19,  4.52s/it, lr: 1.0e-04 loss: 1.801e-01]mindexpander_qwen_v1:  76%|#######5  | 2265/3000 [2:32:41<55:19,  4.52s/it, lr: 1.0e-04 loss: 2.115e-02]mindexpander_qwen_v1:  76%|#######5  | 2265/3000 [2:32:41<55:19,  4.52s/it, lr: 1.0e-04 loss: 2.115e-02]mindexpander_qwen_v1:  76%|#######5  | 2266/3000 [2:32:41<48:43,  3.98s/it, lr: 1.0e-04 loss: 2.115e-02]mindexpander_qwen_v1:  76%|#######5  | 2266/3000 [2:32:41<48:43,  3.98s/it, lr: 1.0e-04 loss: 2.115e-02]mindexpander_qwen_v1:  76%|#######5  | 2266/3000 [2:32:44<48:43,  3.98s/it, lr: 1.0e-04 loss: 9.347e-02]mindexpander_qwen_v1:  76%|#######5  | 2266/3000 [2:32:44<48:43,  3.98s/it, lr: 1.0e-04 loss: 9.347e-02]mindexpander_qwen_v1:  76%|#######5  | 2267/3000 [2:32:44<43:13,  3.54s/it, lr: 1.0e-04 loss: 9.347e-02]mindexpander_qwen_v1:  76%|#######5  | 2267/3000 [2:32:44<43:13,  3.54s/it, lr: 1.0e-04 loss: 9.347e-02]mindexpander_qwen_v1:  76%|#######5  | 2267/3000 [2:32:47<43:13,  3.54s/it, lr: 1.0e-04 loss: 1.471e-01]mindexpander_qwen_v1:  76%|#######5  | 2267/3000 [2:32:47<43:13,  3.54s/it, lr: 1.0e-04 loss: 1.471e-01]mindexpander_qwen_v1:  76%|#######5  | 2268/3000 [2:32:47<43:53,  3.60s/it, lr: 1.0e-04 loss: 1.471e-01]mindexpander_qwen_v1:  76%|#######5  | 2268/3000 [2:32:47<43:53,  3.60s/it, lr: 1.0e-04 loss: 1.471e-01]mindexpander_qwen_v1:  76%|#######5  | 2268/3000 [2:32:53<43:53,  3.60s/it, lr: 1.0e-04 loss: 6.786e-02]mindexpander_qwen_v1:  76%|#######5  | 2268/3000 [2:32:53<43:53,  3.60s/it, lr: 1.0e-04 loss: 6.786e-02]mindexpander_qwen_v1:  76%|#######5  | 2269/3000 [2:32:53<51:35,  4.23s/it, lr: 1.0e-04 loss: 6.786e-02]mindexpander_qwen_v1:  76%|#######5  | 2269/3000 [2:32:53<51:35,  4.23s/it, lr: 1.0e-04 loss: 6.786e-02]mindexpander_qwen_v1:  76%|#######5  | 2269/3000 [2:32:57<51:35,  4.23s/it, lr: 1.0e-04 loss: 2.358e-02]mindexpander_qwen_v1:  76%|#######5  | 2269/3000 [2:32:57<51:35,  4.23s/it, lr: 1.0e-04 loss: 2.358e-02]mindexpander_qwen_v1:  76%|#######5  | 2270/3000 [2:33:03<51:31,  4.23s/it, lr: 1.0e-04 loss: 8.185e-02]mindexpander_qwen_v1:  76%|#######5  | 2270/3000 [2:33:03<51:31,  4.23s/it, lr: 1.0e-04 loss: 8.185e-02]mindexpander_qwen_v1:  76%|#######5  | 2271/3000 [2:33:03<43:55,  3.62s/it, lr: 1.0e-04 loss: 8.185e-02]mindexpander_qwen_v1:  76%|#######5  | 2271/3000 [2:33:03<43:55,  3.62s/it, lr: 1.0e-04 loss: 8.185e-02]mindexpander_qwen_v1:  76%|#######5  | 2271/3000 [2:33:07<43:55,  3.62s/it, lr: 1.0e-04 loss: 1.250e-02]mindexpander_qwen_v1:  76%|#######5  | 2271/3000 [2:33:07<43:55,  3.62s/it, lr: 1.0e-04 loss: 1.250e-02]mindexpander_qwen_v1:  76%|#######5  | 2272/3000 [2:33:07<44:14,  3.65s/it, lr: 1.0e-04 loss: 1.250e-02]mindexpander_qwen_v1:  76%|#######5  | 2272/3000 [2:33:07<44:14,  3.65s/it, lr: 1.0e-04 loss: 1.250e-02]mindexpander_qwen_v1:  76%|#######5  | 2272/3000 [2:33:10<44:14,  3.65s/it, lr: 1.0e-04 loss: 5.786e-02]mindexpander_qwen_v1:  76%|#######5  | 2272/3000 [2:33:10<44:14,  3.65s/it, lr: 1.0e-04 loss: 5.786e-02]mindexpander_qwen_v1:  76%|#######5  | 2273/3000 [2:33:10<44:29,  3.67s/it, lr: 1.0e-04 loss: 5.786e-02]mindexpander_qwen_v1:  76%|#######5  | 2273/3000 [2:33:10<44:29,  3.67s/it, lr: 1.0e-04 loss: 5.786e-02]mindexpander_qwen_v1:  76%|#######5  | 2273/3000 [2:33:13<44:29,  3.67s/it, lr: 1.0e-04 loss: 2.258e-02]mindexpander_qwen_v1:  76%|#######5  | 2273/3000 [2:33:13<44:29,  3.67s/it, lr: 1.0e-04 loss: 2.258e-02]mindexpander_qwen_v1:  76%|#######5  | 2274/3000 [2:33:13<41:01,  3.39s/it, lr: 1.0e-04 loss: 2.258e-02]mindexpander_qwen_v1:  76%|#######5  | 2274/3000 [2:33:13<41:01,  3.39s/it, lr: 1.0e-04 loss: 2.258e-02]mindexpander_qwen_v1:  76%|#######5  | 2274/3000 [2:33:17<41:01,  3.39s/it, lr: 1.0e-04 loss: 1.329e-02]mindexpander_qwen_v1:  76%|#######5  | 2274/3000 [2:33:17<41:01,  3.39s/it, lr: 1.0e-04 loss: 1.329e-02]mindexpander_qwen_v1:  76%|#######5  | 2275/3000 [2:33:17<42:09,  3.49s/it, lr: 1.0e-04 loss: 1.329e-02]mindexpander_qwen_v1:  76%|#######5  | 2275/3000 [2:33:17<42:09,  3.49s/it, lr: 1.0e-04 loss: 1.329e-02]mindexpander_qwen_v1:  76%|#######5  | 2275/3000 [2:33:19<42:09,  3.49s/it, lr: 1.0e-04 loss: 5.420e-02]mindexpander_qwen_v1:  76%|#######5  | 2275/3000 [2:33:19<42:09,  3.49s/it, lr: 1.0e-04 loss: 5.420e-02]mindexpander_qwen_v1:  76%|#######5  | 2276/3000 [2:33:19<38:31,  3.19s/it, lr: 1.0e-04 loss: 5.420e-02]mindexpander_qwen_v1:  76%|#######5  | 2276/3000 [2:33:19<38:31,  3.19s/it, lr: 1.0e-04 loss: 5.420e-02]mindexpander_qwen_v1:  76%|#######5  | 2276/3000 [2:33:25<38:31,  3.19s/it, lr: 1.0e-04 loss: 1.702e-01]mindexpander_qwen_v1:  76%|#######5  | 2276/3000 [2:33:25<38:31,  3.19s/it, lr: 1.0e-04 loss: 1.702e-01]mindexpander_qwen_v1:  76%|#######5  | 2277/3000 [2:33:25<47:26,  3.94s/it, lr: 1.0e-04 loss: 1.702e-01]mindexpander_qwen_v1:  76%|#######5  | 2277/3000 [2:33:25<47:26,  3.94s/it, lr: 1.0e-04 loss: 1.702e-01]mindexpander_qwen_v1:  76%|#######5  | 2277/3000 [2:33:29<47:26,  3.94s/it, lr: 1.0e-04 loss: 1.378e-01]mindexpander_qwen_v1:  76%|#######5  | 2277/3000 [2:33:29<47:26,  3.94s/it, lr: 1.0e-04 loss: 1.378e-01]mindexpander_qwen_v1:  76%|#######5  | 2278/3000 [2:33:29<47:17,  3.93s/it, lr: 1.0e-04 loss: 1.378e-01]mindexpander_qwen_v1:  76%|#######5  | 2278/3000 [2:33:29<47:17,  3.93s/it, lr: 1.0e-04 loss: 1.378e-01]mindexpander_qwen_v1:  76%|#######5  | 2278/3000 [2:33:31<47:17,  3.93s/it, lr: 1.0e-04 loss: 2.700e-02]mindexpander_qwen_v1:  76%|#######5  | 2278/3000 [2:33:31<47:17,  3.93s/it, lr: 1.0e-04 loss: 2.700e-02]mindexpander_qwen_v1:  76%|#######5  | 2279/3000 [2:33:31<41:59,  3.49s/it, lr: 1.0e-04 loss: 2.700e-02]mindexpander_qwen_v1:  76%|#######5  | 2279/3000 [2:33:31<41:59,  3.49s/it, lr: 1.0e-04 loss: 2.700e-02]mindexpander_qwen_v1:  76%|#######5  | 2279/3000 [2:33:34<41:59,  3.49s/it, lr: 1.0e-04 loss: 1.723e-01]mindexpander_qwen_v1:  76%|#######5  | 2279/3000 [2:33:34<41:59,  3.49s/it, lr: 1.0e-04 loss: 1.723e-01]mindexpander_qwen_v1:  76%|#######6  | 2280/3000 [2:33:37<41:55,  3.49s/it, lr: 1.0e-04 loss: 1.011e-01]mindexpander_qwen_v1:  76%|#######6  | 2280/3000 [2:33:37<41:55,  3.49s/it, lr: 1.0e-04 loss: 1.011e-01]mindexpander_qwen_v1:  76%|#######6  | 2281/3000 [2:33:37<29:27,  2.46s/it, lr: 1.0e-04 loss: 1.011e-01]mindexpander_qwen_v1:  76%|#######6  | 2281/3000 [2:33:37<29:27,  2.46s/it, lr: 1.0e-04 loss: 1.011e-01]mindexpander_qwen_v1:  76%|#######6  | 2281/3000 [2:33:39<29:27,  2.46s/it, lr: 1.0e-04 loss: 7.945e-02]mindexpander_qwen_v1:  76%|#######6  | 2281/3000 [2:33:39<29:27,  2.46s/it, lr: 1.0e-04 loss: 7.945e-02]mindexpander_qwen_v1:  76%|#######6  | 2282/3000 [2:33:39<30:11,  2.52s/it, lr: 1.0e-04 loss: 7.945e-02]mindexpander_qwen_v1:  76%|#######6  | 2282/3000 [2:33:39<30:11,  2.52s/it, lr: 1.0e-04 loss: 7.945e-02]mindexpander_qwen_v1:  76%|#######6  | 2282/3000 [2:33:43<30:11,  2.52s/it, lr: 1.0e-04 loss: 3.137e-02]mindexpander_qwen_v1:  76%|#######6  | 2282/3000 [2:33:43<30:11,  2.52s/it, lr: 1.0e-04 loss: 3.137e-02]mindexpander_qwen_v1:  76%|#######6  | 2283/3000 [2:33:43<33:56,  2.84s/it, lr: 1.0e-04 loss: 3.137e-02]mindexpander_qwen_v1:  76%|#######6  | 2283/3000 [2:33:43<33:56,  2.84s/it, lr: 1.0e-04 loss: 3.137e-02]mindexpander_qwen_v1:  76%|#######6  | 2283/3000 [2:33:49<33:56,  2.84s/it, lr: 1.0e-04 loss: 9.684e-02]mindexpander_qwen_v1:  76%|#######6  | 2283/3000 [2:33:49<33:56,  2.84s/it, lr: 1.0e-04 loss: 9.684e-02]mindexpander_qwen_v1:  76%|#######6  | 2284/3000 [2:33:49<43:21,  3.63s/it, lr: 1.0e-04 loss: 9.684e-02]mindexpander_qwen_v1:  76%|#######6  | 2284/3000 [2:33:49<43:21,  3.63s/it, lr: 1.0e-04 loss: 9.684e-02]mindexpander_qwen_v1:  76%|#######6  | 2284/3000 [2:33:55<43:21,  3.63s/it, lr: 1.0e-04 loss: 6.918e-02]mindexpander_qwen_v1:  76%|#######6  | 2284/3000 [2:33:55<43:21,  3.63s/it, lr: 1.0e-04 loss: 6.918e-02]mindexpander_qwen_v1:  76%|#######6  | 2285/3000 [2:33:55<50:24,  4.23s/it, lr: 1.0e-04 loss: 6.918e-02]mindexpander_qwen_v1:  76%|#######6  | 2285/3000 [2:33:55<50:24,  4.23s/it, lr: 1.0e-04 loss: 6.918e-02]mindexpander_qwen_v1:  76%|#######6  | 2285/3000 [2:33:58<50:24,  4.23s/it, lr: 1.0e-04 loss: 1.785e-01]mindexpander_qwen_v1:  76%|#######6  | 2285/3000 [2:33:58<50:24,  4.23s/it, lr: 1.0e-04 loss: 1.785e-01]mindexpander_qwen_v1:  76%|#######6  | 2286/3000 [2:33:58<49:14,  4.14s/it, lr: 1.0e-04 loss: 1.785e-01]mindexpander_qwen_v1:  76%|#######6  | 2286/3000 [2:33:58<49:14,  4.14s/it, lr: 1.0e-04 loss: 1.785e-01]mindexpander_qwen_v1:  76%|#######6  | 2286/3000 [2:34:01<49:14,  4.14s/it, lr: 1.0e-04 loss: 1.812e-01]mindexpander_qwen_v1:  76%|#######6  | 2286/3000 [2:34:01<49:14,  4.14s/it, lr: 1.0e-04 loss: 1.812e-01]mindexpander_qwen_v1:  76%|#######6  | 2287/3000 [2:34:01<43:21,  3.65s/it, lr: 1.0e-04 loss: 1.812e-01]mindexpander_qwen_v1:  76%|#######6  | 2287/3000 [2:34:01<43:21,  3.65s/it, lr: 1.0e-04 loss: 1.812e-01]mindexpander_qwen_v1:  76%|#######6  | 2287/3000 [2:34:07<43:21,  3.65s/it, lr: 1.0e-04 loss: 6.462e-02]mindexpander_qwen_v1:  76%|#######6  | 2287/3000 [2:34:07<43:21,  3.65s/it, lr: 1.0e-04 loss: 6.462e-02]mindexpander_qwen_v1:  76%|#######6  | 2288/3000 [2:34:07<50:36,  4.26s/it, lr: 1.0e-04 loss: 6.462e-02]mindexpander_qwen_v1:  76%|#######6  | 2288/3000 [2:34:07<50:36,  4.26s/it, lr: 1.0e-04 loss: 6.462e-02]mindexpander_qwen_v1:  76%|#######6  | 2288/3000 [2:34:09<50:36,  4.26s/it, lr: 1.0e-04 loss: 2.226e-02]mindexpander_qwen_v1:  76%|#######6  | 2288/3000 [2:34:09<50:36,  4.26s/it, lr: 1.0e-04 loss: 2.226e-02]mindexpander_qwen_v1:  76%|#######6  | 2289/3000 [2:34:09<44:11,  3.73s/it, lr: 1.0e-04 loss: 2.226e-02]mindexpander_qwen_v1:  76%|#######6  | 2289/3000 [2:34:09<44:11,  3.73s/it, lr: 1.0e-04 loss: 2.226e-02]mindexpander_qwen_v1:  76%|#######6  | 2289/3000 [2:34:12<44:11,  3.73s/it, lr: 1.0e-04 loss: 5.652e-02]mindexpander_qwen_v1:  76%|#######6  | 2289/3000 [2:34:12<44:11,  3.73s/it, lr: 1.0e-04 loss: 5.652e-02]mindexpander_qwen_v1:  76%|#######6  | 2290/3000 [2:34:14<44:07,  3.73s/it, lr: 1.0e-04 loss: 5.152e-02]mindexpander_qwen_v1:  76%|#######6  | 2290/3000 [2:34:14<44:07,  3.73s/it, lr: 1.0e-04 loss: 5.152e-02]mindexpander_qwen_v1:  76%|#######6  | 2291/3000 [2:34:14<30:32,  2.58s/it, lr: 1.0e-04 loss: 5.152e-02]mindexpander_qwen_v1:  76%|#######6  | 2291/3000 [2:34:14<30:32,  2.58s/it, lr: 1.0e-04 loss: 5.152e-02]mindexpander_qwen_v1:  76%|#######6  | 2291/3000 [2:34:17<30:32,  2.58s/it, lr: 1.0e-04 loss: 4.682e-02]mindexpander_qwen_v1:  76%|#######6  | 2291/3000 [2:34:17<30:32,  2.58s/it, lr: 1.0e-04 loss: 4.682e-02]mindexpander_qwen_v1:  76%|#######6  | 2292/3000 [2:34:17<30:07,  2.55s/it, lr: 1.0e-04 loss: 4.682e-02]mindexpander_qwen_v1:  76%|#######6  | 2292/3000 [2:34:17<30:07,  2.55s/it, lr: 1.0e-04 loss: 4.682e-02]mindexpander_qwen_v1:  76%|#######6  | 2292/3000 [2:34:19<30:07,  2.55s/it, lr: 1.0e-04 loss: 6.906e-02]mindexpander_qwen_v1:  76%|#######6  | 2292/3000 [2:34:19<30:07,  2.55s/it, lr: 1.0e-04 loss: 6.906e-02]mindexpander_qwen_v1:  76%|#######6  | 2293/3000 [2:34:19<29:47,  2.53s/it, lr: 1.0e-04 loss: 6.906e-02]mindexpander_qwen_v1:  76%|#######6  | 2293/3000 [2:34:19<29:47,  2.53s/it, lr: 1.0e-04 loss: 6.906e-02]mindexpander_qwen_v1:  76%|#######6  | 2293/3000 [2:34:25<29:47,  2.53s/it, lr: 1.0e-04 loss: 2.464e-02]mindexpander_qwen_v1:  76%|#######6  | 2293/3000 [2:34:25<29:47,  2.53s/it, lr: 1.0e-04 loss: 2.464e-02]mindexpander_qwen_v1:  76%|#######6  | 2294/3000 [2:34:25<40:32,  3.45s/it, lr: 1.0e-04 loss: 2.464e-02]mindexpander_qwen_v1:  76%|#######6  | 2294/3000 [2:34:25<40:32,  3.45s/it, lr: 1.0e-04 loss: 2.464e-02]mindexpander_qwen_v1:  76%|#######6  | 2294/3000 [2:34:29<40:32,  3.45s/it, lr: 1.0e-04 loss: 1.259e-01]mindexpander_qwen_v1:  76%|#######6  | 2294/3000 [2:34:29<40:32,  3.45s/it, lr: 1.0e-04 loss: 1.259e-01]mindexpander_qwen_v1:  76%|#######6  | 2295/3000 [2:34:29<41:26,  3.53s/it, lr: 1.0e-04 loss: 1.259e-01]mindexpander_qwen_v1:  76%|#######6  | 2295/3000 [2:34:29<41:26,  3.53s/it, lr: 1.0e-04 loss: 1.259e-01]mindexpander_qwen_v1:  76%|#######6  | 2295/3000 [2:34:33<41:26,  3.53s/it, lr: 1.0e-04 loss: 9.938e-03]mindexpander_qwen_v1:  76%|#######6  | 2295/3000 [2:34:33<41:26,  3.53s/it, lr: 1.0e-04 loss: 9.938e-03]mindexpander_qwen_v1:  77%|#######6  | 2296/3000 [2:34:33<42:07,  3.59s/it, lr: 1.0e-04 loss: 9.938e-03]mindexpander_qwen_v1:  77%|#######6  | 2296/3000 [2:34:33<42:07,  3.59s/it, lr: 1.0e-04 loss: 9.938e-03]mindexpander_qwen_v1:  77%|#######6  | 2296/3000 [2:34:36<42:07,  3.59s/it, lr: 1.0e-04 loss: 5.750e-02]mindexpander_qwen_v1:  77%|#######6  | 2296/3000 [2:34:36<42:07,  3.59s/it, lr: 1.0e-04 loss: 5.750e-02]mindexpander_qwen_v1:  77%|#######6  | 2297/3000 [2:34:36<42:34,  3.63s/it, lr: 1.0e-04 loss: 5.750e-02]mindexpander_qwen_v1:  77%|#######6  | 2297/3000 [2:34:36<42:34,  3.63s/it, lr: 1.0e-04 loss: 5.750e-02]mindexpander_qwen_v1:  77%|#######6  | 2297/3000 [2:34:40<42:34,  3.63s/it, lr: 1.0e-04 loss: 1.690e-01]mindexpander_qwen_v1:  77%|#######6  | 2297/3000 [2:34:40<42:34,  3.63s/it, lr: 1.0e-04 loss: 1.690e-01]mindexpander_qwen_v1:  77%|#######6  | 2298/3000 [2:34:40<43:26,  3.71s/it, lr: 1.0e-04 loss: 1.690e-01]mindexpander_qwen_v1:  77%|#######6  | 2298/3000 [2:34:40<43:26,  3.71s/it, lr: 1.0e-04 loss: 1.690e-01]mindexpander_qwen_v1:  77%|#######6  | 2298/3000 [2:34:46<43:26,  3.71s/it, lr: 1.0e-04 loss: 1.047e-01]mindexpander_qwen_v1:  77%|#######6  | 2298/3000 [2:34:46<43:26,  3.71s/it, lr: 1.0e-04 loss: 1.047e-01]mindexpander_qwen_v1:  77%|#######6  | 2299/3000 [2:34:46<50:26,  4.32s/it, lr: 1.0e-04 loss: 1.047e-01]mindexpander_qwen_v1:  77%|#######6  | 2299/3000 [2:34:46<50:26,  4.32s/it, lr: 1.0e-04 loss: 1.047e-01]mindexpander_qwen_v1:  77%|#######6  | 2299/3000 [2:34:50<50:26,  4.32s/it, lr: 1.0e-04 loss: 9.857e-02]mindexpander_qwen_v1:  77%|#######6  | 2299/3000 [2:34:50<50:26,  4.32s/it, lr: 1.0e-04 loss: 9.857e-02]mindexpander_qwen_v1:  77%|#######6  | 2300/3000 [2:34:55<50:21,  4.32s/it, lr: 1.0e-04 loss: 1.367e-01]mindexpander_qwen_v1:  77%|#######6  | 2300/3000 [2:34:55<50:21,  4.32s/it, lr: 1.0e-04 loss: 1.367e-01]mindexpander_qwen_v1:  77%|#######6  | 2301/3000 [2:34:55<42:37,  3.66s/it, lr: 1.0e-04 loss: 1.367e-01]mindexpander_qwen_v1:  77%|#######6  | 2301/3000 [2:34:55<42:37,  3.66s/it, lr: 1.0e-04 loss: 1.367e-01]mindexpander_qwen_v1:  77%|#######6  | 2301/3000 [2:34:59<42:37,  3.66s/it, lr: 1.0e-04 loss: 1.614e-01]mindexpander_qwen_v1:  77%|#######6  | 2301/3000 [2:34:59<42:37,  3.66s/it, lr: 1.0e-04 loss: 1.614e-01]mindexpander_qwen_v1:  77%|#######6  | 2302/3000 [2:34:59<43:18,  3.72s/it, lr: 1.0e-04 loss: 1.614e-01]mindexpander_qwen_v1:  77%|#######6  | 2302/3000 [2:34:59<43:18,  3.72s/it, lr: 1.0e-04 loss: 1.614e-01]mindexpander_qwen_v1:  77%|#######6  | 2302/3000 [2:35:03<43:18,  3.72s/it, lr: 1.0e-04 loss: 2.001e-02]mindexpander_qwen_v1:  77%|#######6  | 2302/3000 [2:35:03<43:18,  3.72s/it, lr: 1.0e-04 loss: 2.001e-02]mindexpander_qwen_v1:  77%|#######6  | 2303/3000 [2:35:03<43:19,  3.73s/it, lr: 1.0e-04 loss: 2.001e-02]mindexpander_qwen_v1:  77%|#######6  | 2303/3000 [2:35:03<43:19,  3.73s/it, lr: 1.0e-04 loss: 2.001e-02]mindexpander_qwen_v1:  77%|#######6  | 2303/3000 [2:35:09<43:19,  3.73s/it, lr: 1.0e-04 loss: 1.260e-01]mindexpander_qwen_v1:  77%|#######6  | 2303/3000 [2:35:09<43:19,  3.73s/it, lr: 1.0e-04 loss: 1.260e-01]mindexpander_qwen_v1:  77%|#######6  | 2304/3000 [2:35:09<49:39,  4.28s/it, lr: 1.0e-04 loss: 1.260e-01]mindexpander_qwen_v1:  77%|#######6  | 2304/3000 [2:35:09<49:39,  4.28s/it, lr: 1.0e-04 loss: 1.260e-01]mindexpander_qwen_v1:  77%|#######6  | 2304/3000 [2:35:13<49:39,  4.28s/it, lr: 1.0e-04 loss: 6.272e-02]mindexpander_qwen_v1:  77%|#######6  | 2304/3000 [2:35:13<49:39,  4.28s/it, lr: 1.0e-04 loss: 6.272e-02]mindexpander_qwen_v1:  77%|#######6  | 2305/3000 [2:35:13<47:55,  4.14s/it, lr: 1.0e-04 loss: 6.272e-02]mindexpander_qwen_v1:  77%|#######6  | 2305/3000 [2:35:13<47:55,  4.14s/it, lr: 1.0e-04 loss: 6.272e-02]mindexpander_qwen_v1:  77%|#######6  | 2305/3000 [2:35:18<47:55,  4.14s/it, lr: 1.0e-04 loss: 1.070e-01]mindexpander_qwen_v1:  77%|#######6  | 2305/3000 [2:35:18<47:55,  4.14s/it, lr: 1.0e-04 loss: 1.070e-01]mindexpander_qwen_v1:  77%|#######6  | 2306/3000 [2:35:18<53:36,  4.63s/it, lr: 1.0e-04 loss: 1.070e-01]mindexpander_qwen_v1:  77%|#######6  | 2306/3000 [2:35:18<53:36,  4.63s/it, lr: 1.0e-04 loss: 1.070e-01]mindexpander_qwen_v1:  77%|#######6  | 2306/3000 [2:35:24<53:36,  4.63s/it, lr: 1.0e-04 loss: 2.649e-02]mindexpander_qwen_v1:  77%|#######6  | 2306/3000 [2:35:24<53:36,  4.63s/it, lr: 1.0e-04 loss: 2.649e-02]mindexpander_qwen_v1:  77%|#######6  | 2307/3000 [2:35:24<57:19,  4.96s/it, lr: 1.0e-04 loss: 2.649e-02]mindexpander_qwen_v1:  77%|#######6  | 2307/3000 [2:35:24<57:19,  4.96s/it, lr: 1.0e-04 loss: 2.649e-02]mindexpander_qwen_v1:  77%|#######6  | 2307/3000 [2:35:27<57:19,  4.96s/it, lr: 1.0e-04 loss: 1.741e-01]mindexpander_qwen_v1:  77%|#######6  | 2307/3000 [2:35:27<57:19,  4.96s/it, lr: 1.0e-04 loss: 1.741e-01]mindexpander_qwen_v1:  77%|#######6  | 2308/3000 [2:35:27<48:47,  4.23s/it, lr: 1.0e-04 loss: 1.741e-01]mindexpander_qwen_v1:  77%|#######6  | 2308/3000 [2:35:27<48:47,  4.23s/it, lr: 1.0e-04 loss: 1.741e-01]mindexpander_qwen_v1:  77%|#######6  | 2308/3000 [2:35:32<48:47,  4.23s/it, lr: 1.0e-04 loss: 5.142e-02]mindexpander_qwen_v1:  77%|#######6  | 2308/3000 [2:35:32<48:47,  4.23s/it, lr: 1.0e-04 loss: 5.142e-02]mindexpander_qwen_v1:  77%|#######6  | 2309/3000 [2:35:32<53:56,  4.68s/it, lr: 1.0e-04 loss: 5.142e-02]mindexpander_qwen_v1:  77%|#######6  | 2309/3000 [2:35:32<53:56,  4.68s/it, lr: 1.0e-04 loss: 5.142e-02]mindexpander_qwen_v1:  77%|#######6  | 2309/3000 [2:35:37<53:56,  4.68s/it, lr: 1.0e-04 loss: 1.058e-01]mindexpander_qwen_v1:  77%|#######6  | 2309/3000 [2:35:37<53:56,  4.68s/it, lr: 1.0e-04 loss: 1.058e-01]mindexpander_qwen_v1:  77%|#######7  | 2310/3000 [2:35:39<53:51,  4.68s/it, lr: 1.0e-04 loss: 3.128e-04]mindexpander_qwen_v1:  77%|#######7  | 2310/3000 [2:35:39<53:51,  4.68s/it, lr: 1.0e-04 loss: 3.128e-04]mindexpander_qwen_v1:  77%|#######7  | 2311/3000 [2:35:39<35:38,  3.10s/it, lr: 1.0e-04 loss: 3.128e-04]mindexpander_qwen_v1:  77%|#######7  | 2311/3000 [2:35:39<35:38,  3.10s/it, lr: 1.0e-04 loss: 3.128e-04]mindexpander_qwen_v1:  77%|#######7  | 2311/3000 [2:35:42<35:38,  3.10s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  77%|#######7  | 2311/3000 [2:35:42<35:38,  3.10s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  77%|#######7  | 2312/3000 [2:35:42<33:45,  2.94s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  77%|#######7  | 2312/3000 [2:35:42<33:45,  2.94s/it, lr: 1.0e-04 loss: 1.777e-01]mindexpander_qwen_v1:  77%|#######7  | 2312/3000 [2:35:48<33:45,  2.94s/it, lr: 1.0e-04 loss: 1.243e-02]mindexpander_qwen_v1:  77%|#######7  | 2312/3000 [2:35:48<33:45,  2.94s/it, lr: 1.0e-04 loss: 1.243e-02]mindexpander_qwen_v1:  77%|#######7  | 2313/3000 [2:35:48<42:06,  3.68s/it, lr: 1.0e-04 loss: 1.243e-02]mindexpander_qwen_v1:  77%|#######7  | 2313/3000 [2:35:48<42:06,  3.68s/it, lr: 1.0e-04 loss: 1.243e-02]mindexpander_qwen_v1:  77%|#######7  | 2313/3000 [2:35:50<42:06,  3.68s/it, lr: 1.0e-04 loss: 4.459e-02]mindexpander_qwen_v1:  77%|#######7  | 2313/3000 [2:35:50<42:06,  3.68s/it, lr: 1.0e-04 loss: 4.459e-02]mindexpander_qwen_v1:  77%|#######7  | 2314/3000 [2:35:50<38:59,  3.41s/it, lr: 1.0e-04 loss: 4.459e-02]mindexpander_qwen_v1:  77%|#######7  | 2314/3000 [2:35:50<38:59,  3.41s/it, lr: 1.0e-04 loss: 4.459e-02]mindexpander_qwen_v1:  77%|#######7  | 2314/3000 [2:35:53<38:59,  3.41s/it, lr: 1.0e-04 loss: 1.476e-01]mindexpander_qwen_v1:  77%|#######7  | 2314/3000 [2:35:53<38:59,  3.41s/it, lr: 1.0e-04 loss: 1.476e-01]mindexpander_qwen_v1:  77%|#######7  | 2315/3000 [2:35:53<35:55,  3.15s/it, lr: 1.0e-04 loss: 1.476e-01]mindexpander_qwen_v1:  77%|#######7  | 2315/3000 [2:35:53<35:55,  3.15s/it, lr: 1.0e-04 loss: 1.476e-01]mindexpander_qwen_v1:  77%|#######7  | 2315/3000 [2:35:55<35:55,  3.15s/it, lr: 1.0e-04 loss: 1.117e-01]mindexpander_qwen_v1:  77%|#######7  | 2315/3000 [2:35:55<35:55,  3.15s/it, lr: 1.0e-04 loss: 1.117e-01]mindexpander_qwen_v1:  77%|#######7  | 2316/3000 [2:35:55<33:35,  2.95s/it, lr: 1.0e-04 loss: 1.117e-01]mindexpander_qwen_v1:  77%|#######7  | 2316/3000 [2:35:55<33:35,  2.95s/it, lr: 1.0e-04 loss: 1.117e-01]mindexpander_qwen_v1:  77%|#######7  | 2316/3000 [2:35:58<33:35,  2.95s/it, lr: 1.0e-04 loss: 2.369e-02]mindexpander_qwen_v1:  77%|#######7  | 2316/3000 [2:35:58<33:35,  2.95s/it, lr: 1.0e-04 loss: 2.369e-02]mindexpander_qwen_v1:  77%|#######7  | 2317/3000 [2:35:58<31:54,  2.80s/it, lr: 1.0e-04 loss: 2.369e-02]mindexpander_qwen_v1:  77%|#######7  | 2317/3000 [2:35:58<31:54,  2.80s/it, lr: 1.0e-04 loss: 2.369e-02]mindexpander_qwen_v1:  77%|#######7  | 2317/3000 [2:36:00<31:54,  2.80s/it, lr: 1.0e-04 loss: 4.984e-02]mindexpander_qwen_v1:  77%|#######7  | 2317/3000 [2:36:00<31:54,  2.80s/it, lr: 1.0e-04 loss: 4.984e-02]mindexpander_qwen_v1:  77%|#######7  | 2318/3000 [2:36:00<31:22,  2.76s/it, lr: 1.0e-04 loss: 4.984e-02]mindexpander_qwen_v1:  77%|#######7  | 2318/3000 [2:36:00<31:22,  2.76s/it, lr: 1.0e-04 loss: 4.984e-02]mindexpander_qwen_v1:  77%|#######7  | 2318/3000 [2:36:03<31:22,  2.76s/it, lr: 1.0e-04 loss: 7.650e-02]mindexpander_qwen_v1:  77%|#######7  | 2318/3000 [2:36:03<31:22,  2.76s/it, lr: 1.0e-04 loss: 7.650e-02]mindexpander_qwen_v1:  77%|#######7  | 2319/3000 [2:36:03<30:21,  2.67s/it, lr: 1.0e-04 loss: 7.650e-02]mindexpander_qwen_v1:  77%|#######7  | 2319/3000 [2:36:03<30:21,  2.67s/it, lr: 1.0e-04 loss: 7.650e-02]mindexpander_qwen_v1:  77%|#######7  | 2319/3000 [2:36:06<30:21,  2.67s/it, lr: 1.0e-04 loss: 1.810e-01]mindexpander_qwen_v1:  77%|#######7  | 2319/3000 [2:36:06<30:21,  2.67s/it, lr: 1.0e-04 loss: 1.810e-01]mindexpander_qwen_v1:  77%|#######7  | 2320/3000 [2:36:10<30:18,  2.67s/it, lr: 1.0e-04 loss: 1.786e-01]mindexpander_qwen_v1:  77%|#######7  | 2320/3000 [2:36:10<30:18,  2.67s/it, lr: 1.0e-04 loss: 1.786e-01]mindexpander_qwen_v1:  77%|#######7  | 2321/3000 [2:36:10<26:05,  2.31s/it, lr: 1.0e-04 loss: 1.786e-01]mindexpander_qwen_v1:  77%|#######7  | 2321/3000 [2:36:10<26:05,  2.31s/it, lr: 1.0e-04 loss: 1.786e-01]mindexpander_qwen_v1:  77%|#######7  | 2321/3000 [2:36:14<26:05,  2.31s/it, lr: 1.0e-04 loss: 1.191e-01]mindexpander_qwen_v1:  77%|#######7  | 2321/3000 [2:36:14<26:05,  2.31s/it, lr: 1.0e-04 loss: 1.191e-01]mindexpander_qwen_v1:  77%|#######7  | 2322/3000 [2:36:14<30:30,  2.70s/it, lr: 1.0e-04 loss: 1.191e-01]mindexpander_qwen_v1:  77%|#######7  | 2322/3000 [2:36:14<30:30,  2.70s/it, lr: 1.0e-04 loss: 1.191e-01]mindexpander_qwen_v1:  77%|#######7  | 2322/3000 [2:36:20<30:30,  2.70s/it, lr: 1.0e-04 loss: 7.259e-03]mindexpander_qwen_v1:  77%|#######7  | 2322/3000 [2:36:20<30:30,  2.70s/it, lr: 1.0e-04 loss: 7.259e-03]mindexpander_qwen_v1:  77%|#######7  | 2323/3000 [2:36:20<39:26,  3.50s/it, lr: 1.0e-04 loss: 7.259e-03]mindexpander_qwen_v1:  77%|#######7  | 2323/3000 [2:36:20<39:26,  3.50s/it, lr: 1.0e-04 loss: 7.259e-03]mindexpander_qwen_v1:  77%|#######7  | 2323/3000 [2:36:26<39:26,  3.50s/it, lr: 1.0e-04 loss: 1.075e-02]mindexpander_qwen_v1:  77%|#######7  | 2323/3000 [2:36:26<39:26,  3.50s/it, lr: 1.0e-04 loss: 1.075e-02]mindexpander_qwen_v1:  77%|#######7  | 2324/3000 [2:36:26<46:27,  4.12s/it, lr: 1.0e-04 loss: 1.075e-02]mindexpander_qwen_v1:  77%|#######7  | 2324/3000 [2:36:26<46:27,  4.12s/it, lr: 1.0e-04 loss: 1.075e-02]mindexpander_qwen_v1:  77%|#######7  | 2324/3000 [2:36:29<46:27,  4.12s/it, lr: 1.0e-04 loss: 1.452e-01]mindexpander_qwen_v1:  77%|#######7  | 2324/3000 [2:36:29<46:27,  4.12s/it, lr: 1.0e-04 loss: 1.452e-01]mindexpander_qwen_v1:  78%|#######7  | 2325/3000 [2:36:29<45:33,  4.05s/it, lr: 1.0e-04 loss: 1.452e-01]mindexpander_qwen_v1:  78%|#######7  | 2325/3000 [2:36:29<45:33,  4.05s/it, lr: 1.0e-04 loss: 1.452e-01]mindexpander_qwen_v1:  78%|#######7  | 2325/3000 [2:36:35<45:33,  4.05s/it, lr: 1.0e-04 loss: 7.174e-02]mindexpander_qwen_v1:  78%|#######7  | 2325/3000 [2:36:35<45:33,  4.05s/it, lr: 1.0e-04 loss: 7.174e-02]mindexpander_qwen_v1:  78%|#######7  | 2326/3000 [2:36:35<51:26,  4.58s/it, lr: 1.0e-04 loss: 7.174e-02]mindexpander_qwen_v1:  78%|#######7  | 2326/3000 [2:36:35<51:26,  4.58s/it, lr: 1.0e-04 loss: 7.174e-02]mindexpander_qwen_v1:  78%|#######7  | 2326/3000 [2:36:41<51:26,  4.58s/it, lr: 1.0e-04 loss: 5.178e-02]mindexpander_qwen_v1:  78%|#######7  | 2326/3000 [2:36:41<51:26,  4.58s/it, lr: 1.0e-04 loss: 5.178e-02]mindexpander_qwen_v1:  78%|#######7  | 2327/3000 [2:36:41<55:11,  4.92s/it, lr: 1.0e-04 loss: 5.178e-02]mindexpander_qwen_v1:  78%|#######7  | 2327/3000 [2:36:41<55:11,  4.92s/it, lr: 1.0e-04 loss: 5.178e-02]mindexpander_qwen_v1:  78%|#######7  | 2327/3000 [2:36:45<55:11,  4.92s/it, lr: 1.0e-04 loss: 1.787e-01]mindexpander_qwen_v1:  78%|#######7  | 2327/3000 [2:36:45<55:11,  4.92s/it, lr: 1.0e-04 loss: 1.787e-01]mindexpander_qwen_v1:  78%|#######7  | 2328/3000 [2:36:45<51:15,  4.58s/it, lr: 1.0e-04 loss: 1.787e-01]mindexpander_qwen_v1:  78%|#######7  | 2328/3000 [2:36:45<51:15,  4.58s/it, lr: 1.0e-04 loss: 1.787e-01]mindexpander_qwen_v1:  78%|#######7  | 2328/3000 [2:36:49<51:15,  4.58s/it, lr: 1.0e-04 loss: 1.385e-02]mindexpander_qwen_v1:  78%|#######7  | 2328/3000 [2:36:49<51:15,  4.58s/it, lr: 1.0e-04 loss: 1.385e-02]mindexpander_qwen_v1:  78%|#######7  | 2329/3000 [2:36:49<48:25,  4.33s/it, lr: 1.0e-04 loss: 1.385e-02]mindexpander_qwen_v1:  78%|#######7  | 2329/3000 [2:36:49<48:25,  4.33s/it, lr: 1.0e-04 loss: 1.385e-02]mindexpander_qwen_v1:  78%|#######7  | 2329/3000 [2:36:55<48:25,  4.33s/it, lr: 1.0e-04 loss: 1.610e-01]mindexpander_qwen_v1:  78%|#######7  | 2329/3000 [2:36:55<48:25,  4.33s/it, lr: 1.0e-04 loss: 1.610e-01]mindexpander_qwen_v1:  78%|#######7  | 2330/3000 [2:37:00<48:21,  4.33s/it, lr: 1.0e-04 loss: 1.189e-02]mindexpander_qwen_v1:  78%|#######7  | 2330/3000 [2:37:00<48:21,  4.33s/it, lr: 1.0e-04 loss: 1.189e-02]mindexpander_qwen_v1:  78%|#######7  | 2331/3000 [2:37:00<40:53,  3.67s/it, lr: 1.0e-04 loss: 1.189e-02]mindexpander_qwen_v1:  78%|#######7  | 2331/3000 [2:37:00<40:53,  3.67s/it, lr: 1.0e-04 loss: 1.189e-02]mindexpander_qwen_v1:  78%|#######7  | 2331/3000 [2:37:04<40:53,  3.67s/it, lr: 1.0e-04 loss: 6.123e-02]mindexpander_qwen_v1:  78%|#######7  | 2331/3000 [2:37:04<40:53,  3.67s/it, lr: 1.0e-04 loss: 6.123e-02]mindexpander_qwen_v1:  78%|#######7  | 2332/3000 [2:37:04<41:02,  3.69s/it, lr: 1.0e-04 loss: 6.123e-02]mindexpander_qwen_v1:  78%|#######7  | 2332/3000 [2:37:04<41:02,  3.69s/it, lr: 1.0e-04 loss: 6.123e-02]mindexpander_qwen_v1:  78%|#######7  | 2332/3000 [2:37:08<41:02,  3.69s/it, lr: 1.0e-04 loss: 6.926e-02]mindexpander_qwen_v1:  78%|#######7  | 2332/3000 [2:37:08<41:02,  3.69s/it, lr: 1.0e-04 loss: 6.926e-02]mindexpander_qwen_v1:  78%|#######7  | 2333/3000 [2:37:08<41:08,  3.70s/it, lr: 1.0e-04 loss: 6.926e-02]mindexpander_qwen_v1:  78%|#######7  | 2333/3000 [2:37:08<41:08,  3.70s/it, lr: 1.0e-04 loss: 6.926e-02]mindexpander_qwen_v1:  78%|#######7  | 2333/3000 [2:37:10<41:08,  3.70s/it, lr: 1.0e-04 loss: 1.406e-01]mindexpander_qwen_v1:  78%|#######7  | 2333/3000 [2:37:10<41:08,  3.70s/it, lr: 1.0e-04 loss: 1.406e-01]mindexpander_qwen_v1:  78%|#######7  | 2334/3000 [2:37:10<37:50,  3.41s/it, lr: 1.0e-04 loss: 1.406e-01]mindexpander_qwen_v1:  78%|#######7  | 2334/3000 [2:37:10<37:50,  3.41s/it, lr: 1.0e-04 loss: 1.406e-01]mindexpander_qwen_v1:  78%|#######7  | 2334/3000 [2:37:14<37:50,  3.41s/it, lr: 1.0e-04 loss: 1.413e-01]mindexpander_qwen_v1:  78%|#######7  | 2334/3000 [2:37:14<37:50,  3.41s/it, lr: 1.0e-04 loss: 1.413e-01]mindexpander_qwen_v1:  78%|#######7  | 2335/3000 [2:37:14<38:48,  3.50s/it, lr: 1.0e-04 loss: 1.413e-01]mindexpander_qwen_v1:  78%|#######7  | 2335/3000 [2:37:14<38:48,  3.50s/it, lr: 1.0e-04 loss: 1.413e-01]mindexpander_qwen_v1:  78%|#######7  | 2335/3000 [2:37:20<38:48,  3.50s/it, lr: 1.0e-04 loss: 2.931e-02]mindexpander_qwen_v1:  78%|#######7  | 2335/3000 [2:37:20<38:48,  3.50s/it, lr: 1.0e-04 loss: 2.931e-02]mindexpander_qwen_v1:  78%|#######7  | 2336/3000 [2:37:20<45:51,  4.14s/it, lr: 1.0e-04 loss: 2.931e-02]mindexpander_qwen_v1:  78%|#######7  | 2336/3000 [2:37:20<45:51,  4.14s/it, lr: 1.0e-04 loss: 2.931e-02]mindexpander_qwen_v1:  78%|#######7  | 2336/3000 [2:37:26<45:51,  4.14s/it, lr: 1.0e-04 loss: 6.499e-02]mindexpander_qwen_v1:  78%|#######7  | 2336/3000 [2:37:26<45:51,  4.14s/it, lr: 1.0e-04 loss: 6.499e-02]mindexpander_qwen_v1:  78%|#######7  | 2337/3000 [2:37:26<50:56,  4.61s/it, lr: 1.0e-04 loss: 6.499e-02]mindexpander_qwen_v1:  78%|#######7  | 2337/3000 [2:37:26<50:56,  4.61s/it, lr: 1.0e-04 loss: 6.499e-02]mindexpander_qwen_v1:  78%|#######7  | 2337/3000 [2:37:28<50:56,  4.61s/it, lr: 1.0e-04 loss: 1.776e-02]mindexpander_qwen_v1:  78%|#######7  | 2337/3000 [2:37:28<50:56,  4.61s/it, lr: 1.0e-04 loss: 1.776e-02]mindexpander_qwen_v1:  78%|#######7  | 2338/3000 [2:37:28<44:29,  4.03s/it, lr: 1.0e-04 loss: 1.776e-02]mindexpander_qwen_v1:  78%|#######7  | 2338/3000 [2:37:28<44:29,  4.03s/it, lr: 1.0e-04 loss: 1.776e-02]mindexpander_qwen_v1:  78%|#######7  | 2338/3000 [2:37:34<44:29,  4.03s/it, lr: 1.0e-04 loss: 6.407e-02]mindexpander_qwen_v1:  78%|#######7  | 2338/3000 [2:37:34<44:29,  4.03s/it, lr: 1.0e-04 loss: 6.407e-02]mindexpander_qwen_v1:  78%|#######7  | 2339/3000 [2:37:34<50:00,  4.54s/it, lr: 1.0e-04 loss: 6.407e-02]mindexpander_qwen_v1:  78%|#######7  | 2339/3000 [2:37:34<50:00,  4.54s/it, lr: 1.0e-04 loss: 6.407e-02]mindexpander_qwen_v1:  78%|#######7  | 2339/3000 [2:37:40<50:00,  4.54s/it, lr: 1.0e-04 loss: 3.321e-02]mindexpander_qwen_v1:  78%|#######7  | 2339/3000 [2:37:40<50:00,  4.54s/it, lr: 1.0e-04 loss: 3.321e-02]mindexpander_qwen_v1:  78%|#######8  | 2340/3000 [2:37:46<49:56,  4.54s/it, lr: 1.0e-04 loss: 1.256e-01]mindexpander_qwen_v1:  78%|#######8  | 2340/3000 [2:37:46<49:56,  4.54s/it, lr: 1.0e-04 loss: 1.256e-01]mindexpander_qwen_v1:  78%|#######8  | 2341/3000 [2:37:46<41:31,  3.78s/it, lr: 1.0e-04 loss: 1.256e-01]mindexpander_qwen_v1:  78%|#######8  | 2341/3000 [2:37:46<41:31,  3.78s/it, lr: 1.0e-04 loss: 1.256e-01]mindexpander_qwen_v1:  78%|#######8  | 2341/3000 [2:37:50<41:31,  3.78s/it, lr: 1.0e-04 loss: 7.440e-02]mindexpander_qwen_v1:  78%|#######8  | 2341/3000 [2:37:50<41:31,  3.78s/it, lr: 1.0e-04 loss: 7.440e-02]mindexpander_qwen_v1:  78%|#######8  | 2342/3000 [2:37:50<42:03,  3.84s/it, lr: 1.0e-04 loss: 7.440e-02]mindexpander_qwen_v1:  78%|#######8  | 2342/3000 [2:37:50<42:03,  3.84s/it, lr: 1.0e-04 loss: 7.440e-02]mindexpander_qwen_v1:  78%|#######8  | 2342/3000 [2:37:54<42:03,  3.84s/it, lr: 1.0e-04 loss: 3.836e-02]mindexpander_qwen_v1:  78%|#######8  | 2342/3000 [2:37:54<42:03,  3.84s/it, lr: 1.0e-04 loss: 3.836e-02]mindexpander_qwen_v1:  78%|#######8  | 2343/3000 [2:37:54<41:43,  3.81s/it, lr: 1.0e-04 loss: 3.836e-02]mindexpander_qwen_v1:  78%|#######8  | 2343/3000 [2:37:54<41:43,  3.81s/it, lr: 1.0e-04 loss: 3.836e-02]mindexpander_qwen_v1:  78%|#######8  | 2343/3000 [2:37:59<41:43,  3.81s/it, lr: 1.0e-04 loss: 8.626e-02]mindexpander_qwen_v1:  78%|#######8  | 2343/3000 [2:37:59<41:43,  3.81s/it, lr: 1.0e-04 loss: 8.626e-02]mindexpander_qwen_v1:  78%|#######8  | 2344/3000 [2:37:59<47:23,  4.34s/it, lr: 1.0e-04 loss: 8.626e-02]mindexpander_qwen_v1:  78%|#######8  | 2344/3000 [2:37:59<47:23,  4.34s/it, lr: 1.0e-04 loss: 8.626e-02]mindexpander_qwen_v1:  78%|#######8  | 2344/3000 [2:38:02<47:23,  4.34s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:  78%|#######8  | 2344/3000 [2:38:02<47:23,  4.34s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:  78%|#######8  | 2345/3000 [2:38:02<41:36,  3.81s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:  78%|#######8  | 2345/3000 [2:38:02<41:36,  3.81s/it, lr: 1.0e-04 loss: 1.622e-01]mindexpander_qwen_v1:  78%|#######8  | 2345/3000 [2:38:08<41:36,  3.81s/it, lr: 1.0e-04 loss: 3.066e-02]mindexpander_qwen_v1:  78%|#######8  | 2345/3000 [2:38:08<41:36,  3.81s/it, lr: 1.0e-04 loss: 3.066e-02]mindexpander_qwen_v1:  78%|#######8  | 2346/3000 [2:38:08<47:59,  4.40s/it, lr: 1.0e-04 loss: 3.066e-02]mindexpander_qwen_v1:  78%|#######8  | 2346/3000 [2:38:08<47:59,  4.40s/it, lr: 1.0e-04 loss: 3.066e-02]mindexpander_qwen_v1:  78%|#######8  | 2346/3000 [2:38:14<47:59,  4.40s/it, lr: 1.0e-04 loss: 3.916e-02]mindexpander_qwen_v1:  78%|#######8  | 2346/3000 [2:38:14<47:59,  4.40s/it, lr: 1.0e-04 loss: 3.916e-02]mindexpander_qwen_v1:  78%|#######8  | 2347/3000 [2:38:14<52:10,  4.79s/it, lr: 1.0e-04 loss: 3.916e-02]mindexpander_qwen_v1:  78%|#######8  | 2347/3000 [2:38:14<52:10,  4.79s/it, lr: 1.0e-04 loss: 3.916e-02]mindexpander_qwen_v1:  78%|#######8  | 2347/3000 [2:38:17<52:10,  4.79s/it, lr: 1.0e-04 loss: 1.065e-02]mindexpander_qwen_v1:  78%|#######8  | 2347/3000 [2:38:17<52:10,  4.79s/it, lr: 1.0e-04 loss: 1.065e-02]mindexpander_qwen_v1:  78%|#######8  | 2348/3000 [2:38:17<48:46,  4.49s/it, lr: 1.0e-04 loss: 1.065e-02]mindexpander_qwen_v1:  78%|#######8  | 2348/3000 [2:38:17<48:46,  4.49s/it, lr: 1.0e-04 loss: 1.065e-02]mindexpander_qwen_v1:  78%|#######8  | 2348/3000 [2:38:20<48:46,  4.49s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  78%|#######8  | 2348/3000 [2:38:20<48:46,  4.49s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  78%|#######8  | 2349/3000 [2:38:20<42:11,  3.89s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  78%|#######8  | 2349/3000 [2:38:20<42:11,  3.89s/it, lr: 1.0e-04 loss: 1.773e-01]mindexpander_qwen_v1:  78%|#######8  | 2349/3000 [2:38:26<42:11,  3.89s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  78%|#######8  | 2349/3000 [2:38:26<42:11,  3.89s/it, lr: 1.0e-04 loss: 1.637e-01]mindexpander_qwen_v1:  78%|#######8  | 2350/3000 [2:38:28<42:07,  3.89s/it, lr: 1.0e-04 loss: 3.630e-02]mindexpander_qwen_v1:  78%|#######8  | 2350/3000 [2:38:28<42:07,  3.89s/it, lr: 1.0e-04 loss: 3.630e-02]mindexpander_qwen_v1:  78%|#######8  | 2351/3000 [2:38:28<28:53,  2.67s/it, lr: 1.0e-04 loss: 3.630e-02]mindexpander_qwen_v1:  78%|#######8  | 2351/3000 [2:38:28<28:53,  2.67s/it, lr: 1.0e-04 loss: 3.630e-02]mindexpander_qwen_v1:  78%|#######8  | 2351/3000 [2:38:32<28:53,  2.67s/it, lr: 1.0e-04 loss: 1.381e-01]mindexpander_qwen_v1:  78%|#######8  | 2351/3000 [2:38:32<28:53,  2.67s/it, lr: 1.0e-04 loss: 1.381e-01]mindexpander_qwen_v1:  78%|#######8  | 2352/3000 [2:38:32<31:41,  2.93s/it, lr: 1.0e-04 loss: 1.381e-01]mindexpander_qwen_v1:  78%|#######8  | 2352/3000 [2:38:32<31:41,  2.93s/it, lr: 1.0e-04 loss: 1.381e-01]mindexpander_qwen_v1:  78%|#######8  | 2352/3000 [2:38:36<31:41,  2.93s/it, lr: 1.0e-04 loss: 4.403e-02]mindexpander_qwen_v1:  78%|#######8  | 2352/3000 [2:38:36<31:41,  2.93s/it, lr: 1.0e-04 loss: 4.403e-02]mindexpander_qwen_v1:  78%|#######8  | 2353/3000 [2:38:36<33:55,  3.15s/it, lr: 1.0e-04 loss: 4.403e-02]mindexpander_qwen_v1:  78%|#######8  | 2353/3000 [2:38:36<33:55,  3.15s/it, lr: 1.0e-04 loss: 4.403e-02]mindexpander_qwen_v1:  78%|#######8  | 2353/3000 [2:38:39<33:55,  3.15s/it, lr: 1.0e-04 loss: 1.570e-01]mindexpander_qwen_v1:  78%|#######8  | 2353/3000 [2:38:39<33:55,  3.15s/it, lr: 1.0e-04 loss: 1.570e-01]mindexpander_qwen_v1:  78%|#######8  | 2354/3000 [2:38:39<36:07,  3.36s/it, lr: 1.0e-04 loss: 1.570e-01]mindexpander_qwen_v1:  78%|#######8  | 2354/3000 [2:38:39<36:07,  3.36s/it, lr: 1.0e-04 loss: 1.570e-01]mindexpander_qwen_v1:  78%|#######8  | 2354/3000 [2:38:43<36:07,  3.36s/it, lr: 1.0e-04 loss: 1.819e-02]mindexpander_qwen_v1:  78%|#######8  | 2354/3000 [2:38:43<36:07,  3.36s/it, lr: 1.0e-04 loss: 1.819e-02]mindexpander_qwen_v1:  78%|#######8  | 2355/3000 [2:38:43<37:13,  3.46s/it, lr: 1.0e-04 loss: 1.819e-02]mindexpander_qwen_v1:  78%|#######8  | 2355/3000 [2:38:43<37:13,  3.46s/it, lr: 1.0e-04 loss: 1.819e-02]mindexpander_qwen_v1:  78%|#######8  | 2355/3000 [2:38:46<37:13,  3.46s/it, lr: 1.0e-04 loss: 8.243e-02]mindexpander_qwen_v1:  78%|#######8  | 2355/3000 [2:38:46<37:13,  3.46s/it, lr: 1.0e-04 loss: 8.243e-02]mindexpander_qwen_v1:  79%|#######8  | 2356/3000 [2:38:46<34:03,  3.17s/it, lr: 1.0e-04 loss: 8.243e-02]mindexpander_qwen_v1:  79%|#######8  | 2356/3000 [2:38:46<34:03,  3.17s/it, lr: 1.0e-04 loss: 8.243e-02]mindexpander_qwen_v1:  79%|#######8  | 2356/3000 [2:38:48<34:03,  3.17s/it, lr: 1.0e-04 loss: 3.263e-02]mindexpander_qwen_v1:  79%|#######8  | 2356/3000 [2:38:48<34:03,  3.17s/it, lr: 1.0e-04 loss: 3.263e-02]mindexpander_qwen_v1:  79%|#######8  | 2357/3000 [2:38:48<31:45,  2.96s/it, lr: 1.0e-04 loss: 3.263e-02]mindexpander_qwen_v1:  79%|#######8  | 2357/3000 [2:38:48<31:45,  2.96s/it, lr: 1.0e-04 loss: 3.263e-02]mindexpander_qwen_v1:  79%|#######8  | 2357/3000 [2:38:51<31:45,  2.96s/it, lr: 1.0e-04 loss: 4.809e-02]mindexpander_qwen_v1:  79%|#######8  | 2357/3000 [2:38:51<31:45,  2.96s/it, lr: 1.0e-04 loss: 4.809e-02]mindexpander_qwen_v1:  79%|#######8  | 2358/3000 [2:38:51<30:43,  2.87s/it, lr: 1.0e-04 loss: 4.809e-02]mindexpander_qwen_v1:  79%|#######8  | 2358/3000 [2:38:51<30:43,  2.87s/it, lr: 1.0e-04 loss: 4.809e-02]mindexpander_qwen_v1:  79%|#######8  | 2358/3000 [2:38:53<30:43,  2.87s/it, lr: 1.0e-04 loss: 2.077e-02]mindexpander_qwen_v1:  79%|#######8  | 2358/3000 [2:38:53<30:43,  2.87s/it, lr: 1.0e-04 loss: 2.077e-02]mindexpander_qwen_v1:  79%|#######8  | 2359/3000 [2:38:53<29:20,  2.75s/it, lr: 1.0e-04 loss: 2.077e-02]mindexpander_qwen_v1:  79%|#######8  | 2359/3000 [2:38:53<29:20,  2.75s/it, lr: 1.0e-04 loss: 2.077e-02]mindexpander_qwen_v1:  79%|#######8  | 2359/3000 [2:38:59<29:20,  2.75s/it, lr: 1.0e-04 loss: 1.319e-01]mindexpander_qwen_v1:  79%|#######8  | 2359/3000 [2:38:59<29:20,  2.75s/it, lr: 1.0e-04 loss: 1.319e-01]mindexpander_qwen_v1:  79%|#######8  | 2360/3000 [2:39:03<29:17,  2.75s/it, lr: 1.0e-04 loss: 1.228e-01]mindexpander_qwen_v1:  79%|#######8  | 2360/3000 [2:39:03<29:17,  2.75s/it, lr: 1.0e-04 loss: 1.228e-01]mindexpander_qwen_v1:  79%|#######8  | 2361/3000 [2:39:03<24:59,  2.35s/it, lr: 1.0e-04 loss: 1.228e-01]mindexpander_qwen_v1:  79%|#######8  | 2361/3000 [2:39:03<24:59,  2.35s/it, lr: 1.0e-04 loss: 1.228e-01]mindexpander_qwen_v1:  79%|#######8  | 2361/3000 [2:39:09<24:59,  2.35s/it, lr: 1.0e-04 loss: 1.512e-02]mindexpander_qwen_v1:  79%|#######8  | 2361/3000 [2:39:09<24:59,  2.35s/it, lr: 1.0e-04 loss: 1.512e-02]mindexpander_qwen_v1:  79%|#######8  | 2362/3000 [2:39:09<34:12,  3.22s/it, lr: 1.0e-04 loss: 1.512e-02]mindexpander_qwen_v1:  79%|#######8  | 2362/3000 [2:39:09<34:12,  3.22s/it, lr: 1.0e-04 loss: 1.512e-02]mindexpander_qwen_v1:  79%|#######8  | 2362/3000 [2:39:12<34:12,  3.22s/it, lr: 1.0e-04 loss: 6.994e-02]mindexpander_qwen_v1:  79%|#######8  | 2362/3000 [2:39:12<34:12,  3.22s/it, lr: 1.0e-04 loss: 6.994e-02]mindexpander_qwen_v1:  79%|#######8  | 2363/3000 [2:39:12<35:37,  3.36s/it, lr: 1.0e-04 loss: 6.994e-02]mindexpander_qwen_v1:  79%|#######8  | 2363/3000 [2:39:12<35:37,  3.36s/it, lr: 1.0e-04 loss: 6.994e-02]mindexpander_qwen_v1:  79%|#######8  | 2363/3000 [2:39:15<35:37,  3.36s/it, lr: 1.0e-04 loss: 1.397e-01]mindexpander_qwen_v1:  79%|#######8  | 2363/3000 [2:39:15<35:37,  3.36s/it, lr: 1.0e-04 loss: 1.397e-01]mindexpander_qwen_v1:  79%|#######8  | 2364/3000 [2:39:15<32:57,  3.11s/it, lr: 1.0e-04 loss: 1.397e-01]mindexpander_qwen_v1:  79%|#######8  | 2364/3000 [2:39:15<32:57,  3.11s/it, lr: 1.0e-04 loss: 1.397e-01]mindexpander_qwen_v1:  79%|#######8  | 2364/3000 [2:39:21<32:57,  3.11s/it, lr: 1.0e-04 loss: 1.692e-01]mindexpander_qwen_v1:  79%|#######8  | 2364/3000 [2:39:21<32:57,  3.11s/it, lr: 1.0e-04 loss: 1.692e-01]mindexpander_qwen_v1:  79%|#######8  | 2365/3000 [2:39:21<40:43,  3.85s/it, lr: 1.0e-04 loss: 1.692e-01]mindexpander_qwen_v1:  79%|#######8  | 2365/3000 [2:39:21<40:43,  3.85s/it, lr: 1.0e-04 loss: 1.692e-01]mindexpander_qwen_v1:  79%|#######8  | 2365/3000 [2:39:26<40:43,  3.85s/it, lr: 1.0e-04 loss: 1.795e-01]mindexpander_qwen_v1:  79%|#######8  | 2365/3000 [2:39:26<40:43,  3.85s/it, lr: 1.0e-04 loss: 1.795e-01]mindexpander_qwen_v1:  79%|#######8  | 2366/3000 [2:39:26<46:47,  4.43s/it, lr: 1.0e-04 loss: 1.795e-01]mindexpander_qwen_v1:  79%|#######8  | 2366/3000 [2:39:26<46:47,  4.43s/it, lr: 1.0e-04 loss: 1.795e-01]mindexpander_qwen_v1:  79%|#######8  | 2366/3000 [2:39:29<46:47,  4.43s/it, lr: 1.0e-04 loss: 3.682e-02]mindexpander_qwen_v1:  79%|#######8  | 2366/3000 [2:39:29<46:47,  4.43s/it, lr: 1.0e-04 loss: 3.682e-02]mindexpander_qwen_v1:  79%|#######8  | 2367/3000 [2:39:29<40:40,  3.86s/it, lr: 1.0e-04 loss: 3.682e-02]mindexpander_qwen_v1:  79%|#######8  | 2367/3000 [2:39:29<40:40,  3.86s/it, lr: 1.0e-04 loss: 3.682e-02]mindexpander_qwen_v1:  79%|#######8  | 2367/3000 [2:39:33<40:40,  3.86s/it, lr: 1.0e-04 loss: 1.479e-02]mindexpander_qwen_v1:  79%|#######8  | 2367/3000 [2:39:33<40:40,  3.86s/it, lr: 1.0e-04 loss: 1.479e-02]mindexpander_qwen_v1:  79%|#######8  | 2368/3000 [2:39:33<40:14,  3.82s/it, lr: 1.0e-04 loss: 1.479e-02]mindexpander_qwen_v1:  79%|#######8  | 2368/3000 [2:39:33<40:14,  3.82s/it, lr: 1.0e-04 loss: 1.479e-02]mindexpander_qwen_v1:  79%|#######8  | 2368/3000 [2:39:35<40:14,  3.82s/it, lr: 1.0e-04 loss: 1.753e-02]mindexpander_qwen_v1:  79%|#######8  | 2368/3000 [2:39:35<40:14,  3.82s/it, lr: 1.0e-04 loss: 1.753e-02]mindexpander_qwen_v1:  79%|#######8  | 2369/3000 [2:39:35<35:54,  3.42s/it, lr: 1.0e-04 loss: 1.753e-02]mindexpander_qwen_v1:  79%|#######8  | 2369/3000 [2:39:35<35:54,  3.42s/it, lr: 1.0e-04 loss: 1.753e-02]mindexpander_qwen_v1:  79%|#######8  | 2369/3000 [2:39:39<35:54,  3.42s/it, lr: 1.0e-04 loss: 2.092e-02]mindexpander_qwen_v1:  79%|#######8  | 2369/3000 [2:39:39<35:54,  3.42s/it, lr: 1.0e-04 loss: 2.092e-02]mindexpander_qwen_v1:  79%|#######9  | 2370/3000 [2:39:42<35:51,  3.42s/it, lr: 1.0e-04 loss: 4.230e-02]mindexpander_qwen_v1:  79%|#######9  | 2370/3000 [2:39:42<35:51,  3.42s/it, lr: 1.0e-04 loss: 4.230e-02]mindexpander_qwen_v1:  79%|#######9  | 2371/3000 [2:39:42<25:18,  2.41s/it, lr: 1.0e-04 loss: 4.230e-02]mindexpander_qwen_v1:  79%|#######9  | 2371/3000 [2:39:42<25:18,  2.41s/it, lr: 1.0e-04 loss: 4.230e-02]mindexpander_qwen_v1:  79%|#######9  | 2371/3000 [2:39:48<25:18,  2.41s/it, lr: 1.0e-04 loss: 1.557e-02]mindexpander_qwen_v1:  79%|#######9  | 2371/3000 [2:39:48<25:18,  2.41s/it, lr: 1.0e-04 loss: 1.557e-02]mindexpander_qwen_v1:  79%|#######9  | 2372/3000 [2:39:48<33:53,  3.24s/it, lr: 1.0e-04 loss: 1.557e-02]mindexpander_qwen_v1:  79%|#######9  | 2372/3000 [2:39:48<33:53,  3.24s/it, lr: 1.0e-04 loss: 1.557e-02]mindexpander_qwen_v1:  79%|#######9  | 2372/3000 [2:39:50<33:53,  3.24s/it, lr: 1.0e-04 loss: 1.455e-02]mindexpander_qwen_v1:  79%|#######9  | 2372/3000 [2:39:50<33:53,  3.24s/it, lr: 1.0e-04 loss: 1.455e-02]mindexpander_qwen_v1:  79%|#######9  | 2373/3000 [2:39:50<31:41,  3.03s/it, lr: 1.0e-04 loss: 1.455e-02]mindexpander_qwen_v1:  79%|#######9  | 2373/3000 [2:39:50<31:41,  3.03s/it, lr: 1.0e-04 loss: 1.455e-02]mindexpander_qwen_v1:  79%|#######9  | 2373/3000 [2:39:53<31:41,  3.03s/it, lr: 1.0e-04 loss: 5.991e-02]mindexpander_qwen_v1:  79%|#######9  | 2373/3000 [2:39:53<31:41,  3.03s/it, lr: 1.0e-04 loss: 5.991e-02]mindexpander_qwen_v1:  79%|#######9  | 2374/3000 [2:39:53<30:32,  2.93s/it, lr: 1.0e-04 loss: 5.991e-02]mindexpander_qwen_v1:  79%|#######9  | 2374/3000 [2:39:53<30:32,  2.93s/it, lr: 1.0e-04 loss: 5.991e-02]mindexpander_qwen_v1:  79%|#######9  | 2374/3000 [2:39:56<30:32,  2.93s/it, lr: 1.0e-04 loss: 1.729e-01]mindexpander_qwen_v1:  79%|#######9  | 2374/3000 [2:39:56<30:32,  2.93s/it, lr: 1.0e-04 loss: 1.729e-01]mindexpander_qwen_v1:  79%|#######9  | 2375/3000 [2:39:56<32:50,  3.15s/it, lr: 1.0e-04 loss: 1.729e-01]mindexpander_qwen_v1:  79%|#######9  | 2375/3000 [2:39:56<32:50,  3.15s/it, lr: 1.0e-04 loss: 1.729e-01]mindexpander_qwen_v1:  79%|#######9  | 2375/3000 [2:40:02<32:50,  3.15s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  79%|#######9  | 2375/3000 [2:40:02<32:50,  3.15s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  79%|#######9  | 2376/3000 [2:40:02<40:30,  3.90s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  79%|#######9  | 2376/3000 [2:40:02<40:30,  3.90s/it, lr: 1.0e-04 loss: 1.472e-01]mindexpander_qwen_v1:  79%|#######9  | 2376/3000 [2:40:08<40:30,  3.90s/it, lr: 1.0e-04 loss: 9.414e-02]mindexpander_qwen_v1:  79%|#######9  | 2376/3000 [2:40:08<40:30,  3.90s/it, lr: 1.0e-04 loss: 9.414e-02]mindexpander_qwen_v1:  79%|#######9  | 2377/3000 [2:40:08<46:02,  4.43s/it, lr: 1.0e-04 loss: 9.414e-02]mindexpander_qwen_v1:  79%|#######9  | 2377/3000 [2:40:08<46:02,  4.43s/it, lr: 1.0e-04 loss: 9.414e-02]mindexpander_qwen_v1:  79%|#######9  | 2377/3000 [2:40:11<46:02,  4.43s/it, lr: 1.0e-04 loss: 6.895e-02]mindexpander_qwen_v1:  79%|#######9  | 2377/3000 [2:40:11<46:02,  4.43s/it, lr: 1.0e-04 loss: 6.895e-02]mindexpander_qwen_v1:  79%|#######9  | 2378/3000 [2:40:11<40:31,  3.91s/it, lr: 1.0e-04 loss: 6.895e-02]mindexpander_qwen_v1:  79%|#######9  | 2378/3000 [2:40:11<40:31,  3.91s/it, lr: 1.0e-04 loss: 6.895e-02]mindexpander_qwen_v1:  79%|#######9  | 2378/3000 [2:40:16<40:31,  3.91s/it, lr: 1.0e-04 loss: 2.200e-03]mindexpander_qwen_v1:  79%|#######9  | 2378/3000 [2:40:16<40:31,  3.91s/it, lr: 1.0e-04 loss: 2.200e-03]mindexpander_qwen_v1:  79%|#######9  | 2379/3000 [2:40:16<46:05,  4.45s/it, lr: 1.0e-04 loss: 2.200e-03]mindexpander_qwen_v1:  79%|#######9  | 2379/3000 [2:40:16<46:05,  4.45s/it, lr: 1.0e-04 loss: 2.200e-03]mindexpander_qwen_v1:  79%|#######9  | 2379/3000 [2:40:20<46:05,  4.45s/it, lr: 1.0e-04 loss: 6.128e-02]mindexpander_qwen_v1:  79%|#######9  | 2379/3000 [2:40:20<46:05,  4.45s/it, lr: 1.0e-04 loss: 6.128e-02]mindexpander_qwen_v1:  79%|#######9  | 2380/3000 [2:40:24<46:01,  4.45s/it, lr: 1.0e-04 loss: 5.790e-02]mindexpander_qwen_v1:  79%|#######9  | 2380/3000 [2:40:24<46:01,  4.45s/it, lr: 1.0e-04 loss: 5.790e-02]mindexpander_qwen_v1:  79%|#######9  | 2381/3000 [2:40:24<33:46,  3.27s/it, lr: 1.0e-04 loss: 5.790e-02]mindexpander_qwen_v1:  79%|#######9  | 2381/3000 [2:40:24<33:46,  3.27s/it, lr: 1.0e-04 loss: 5.790e-02]mindexpander_qwen_v1:  79%|#######9  | 2381/3000 [2:40:28<33:46,  3.27s/it, lr: 1.0e-04 loss: 3.703e-02]mindexpander_qwen_v1:  79%|#######9  | 2381/3000 [2:40:28<33:46,  3.27s/it, lr: 1.0e-04 loss: 3.703e-02]mindexpander_qwen_v1:  79%|#######9  | 2382/3000 [2:40:28<35:16,  3.43s/it, lr: 1.0e-04 loss: 3.703e-02]mindexpander_qwen_v1:  79%|#######9  | 2382/3000 [2:40:28<35:16,  3.43s/it, lr: 1.0e-04 loss: 3.703e-02]mindexpander_qwen_v1:  79%|#######9  | 2382/3000 [2:40:33<35:16,  3.43s/it, lr: 1.0e-04 loss: 1.603e-03]mindexpander_qwen_v1:  79%|#######9  | 2382/3000 [2:40:33<35:16,  3.43s/it, lr: 1.0e-04 loss: 1.603e-03]mindexpander_qwen_v1:  79%|#######9  | 2383/3000 [2:40:33<41:26,  4.03s/it, lr: 1.0e-04 loss: 1.603e-03]mindexpander_qwen_v1:  79%|#######9  | 2383/3000 [2:40:33<41:26,  4.03s/it, lr: 1.0e-04 loss: 1.603e-03]mindexpander_qwen_v1:  79%|#######9  | 2383/3000 [2:40:37<41:26,  4.03s/it, lr: 1.0e-04 loss: 3.223e-02]mindexpander_qwen_v1:  79%|#######9  | 2383/3000 [2:40:37<41:26,  4.03s/it, lr: 1.0e-04 loss: 3.223e-02]mindexpander_qwen_v1:  79%|#######9  | 2384/3000 [2:40:37<40:34,  3.95s/it, lr: 1.0e-04 loss: 3.223e-02]mindexpander_qwen_v1:  79%|#######9  | 2384/3000 [2:40:37<40:34,  3.95s/it, lr: 1.0e-04 loss: 3.223e-02]mindexpander_qwen_v1:  79%|#######9  | 2384/3000 [2:40:41<40:34,  3.95s/it, lr: 1.0e-04 loss: 1.575e-02]mindexpander_qwen_v1:  79%|#######9  | 2384/3000 [2:40:41<40:34,  3.95s/it, lr: 1.0e-04 loss: 1.575e-02]mindexpander_qwen_v1:  80%|#######9  | 2385/3000 [2:40:41<39:54,  3.89s/it, lr: 1.0e-04 loss: 1.575e-02]mindexpander_qwen_v1:  80%|#######9  | 2385/3000 [2:40:41<39:54,  3.89s/it, lr: 1.0e-04 loss: 1.575e-02]mindexpander_qwen_v1:  80%|#######9  | 2385/3000 [2:40:44<39:54,  3.89s/it, lr: 1.0e-04 loss: 6.728e-02]mindexpander_qwen_v1:  80%|#######9  | 2385/3000 [2:40:44<39:54,  3.89s/it, lr: 1.0e-04 loss: 6.728e-02]mindexpander_qwen_v1:  80%|#######9  | 2386/3000 [2:40:44<36:10,  3.54s/it, lr: 1.0e-04 loss: 6.728e-02]mindexpander_qwen_v1:  80%|#######9  | 2386/3000 [2:40:44<36:10,  3.54s/it, lr: 1.0e-04 loss: 6.728e-02]mindexpander_qwen_v1:  80%|#######9  | 2386/3000 [2:40:49<36:10,  3.54s/it, lr: 1.0e-04 loss: 1.101e-01]mindexpander_qwen_v1:  80%|#######9  | 2386/3000 [2:40:49<36:10,  3.54s/it, lr: 1.0e-04 loss: 1.101e-01]mindexpander_qwen_v1:  80%|#######9  | 2387/3000 [2:40:49<42:39,  4.17s/it, lr: 1.0e-04 loss: 1.101e-01]mindexpander_qwen_v1:  80%|#######9  | 2387/3000 [2:40:49<42:39,  4.17s/it, lr: 1.0e-04 loss: 1.101e-01]mindexpander_qwen_v1:  80%|#######9  | 2387/3000 [2:40:52<42:39,  4.17s/it, lr: 1.0e-04 loss: 1.638e-01]mindexpander_qwen_v1:  80%|#######9  | 2387/3000 [2:40:52<42:39,  4.17s/it, lr: 1.0e-04 loss: 1.638e-01]mindexpander_qwen_v1:  80%|#######9  | 2388/3000 [2:40:52<37:27,  3.67s/it, lr: 1.0e-04 loss: 1.638e-01]mindexpander_qwen_v1:  80%|#######9  | 2388/3000 [2:40:52<37:27,  3.67s/it, lr: 1.0e-04 loss: 1.638e-01]mindexpander_qwen_v1:  80%|#######9  | 2388/3000 [2:40:54<37:27,  3.67s/it, lr: 1.0e-04 loss: 2.886e-02]mindexpander_qwen_v1:  80%|#######9  | 2388/3000 [2:40:54<37:27,  3.67s/it, lr: 1.0e-04 loss: 2.886e-02]mindexpander_qwen_v1:  80%|#######9  | 2389/3000 [2:40:54<33:45,  3.31s/it, lr: 1.0e-04 loss: 2.886e-02]mindexpander_qwen_v1:  80%|#######9  | 2389/3000 [2:40:54<33:45,  3.31s/it, lr: 1.0e-04 loss: 2.886e-02]mindexpander_qwen_v1:  80%|#######9  | 2389/3000 [2:41:00<33:45,  3.31s/it, lr: 1.0e-04 loss: 1.841e-01]mindexpander_qwen_v1:  80%|#######9  | 2389/3000 [2:41:00<33:45,  3.31s/it, lr: 1.0e-04 loss: 1.841e-01]mindexpander_qwen_v1:  80%|#######9  | 2390/3000 [2:41:03<33:42,  3.31s/it, lr: 1.0e-04 loss: 9.476e-02]mindexpander_qwen_v1:  80%|#######9  | 2390/3000 [2:41:03<33:42,  3.31s/it, lr: 1.0e-04 loss: 9.476e-02]mindexpander_qwen_v1:  80%|#######9  | 2391/3000 [2:41:03<23:57,  2.36s/it, lr: 1.0e-04 loss: 9.476e-02]mindexpander_qwen_v1:  80%|#######9  | 2391/3000 [2:41:03<23:57,  2.36s/it, lr: 1.0e-04 loss: 9.476e-02]mindexpander_qwen_v1:  80%|#######9  | 2391/3000 [2:41:08<23:57,  2.36s/it, lr: 1.0e-04 loss: 4.199e-02]mindexpander_qwen_v1:  80%|#######9  | 2391/3000 [2:41:08<23:57,  2.36s/it, lr: 1.0e-04 loss: 4.199e-02]mindexpander_qwen_v1:  80%|#######9  | 2392/3000 [2:41:08<32:24,  3.20s/it, lr: 1.0e-04 loss: 4.199e-02]mindexpander_qwen_v1:  80%|#######9  | 2392/3000 [2:41:08<32:24,  3.20s/it, lr: 1.0e-04 loss: 4.199e-02]mindexpander_qwen_v1:  80%|#######9  | 2392/3000 [2:41:11<32:24,  3.20s/it, lr: 1.0e-04 loss: 1.621e-01]mindexpander_qwen_v1:  80%|#######9  | 2392/3000 [2:41:11<32:24,  3.20s/it, lr: 1.0e-04 loss: 1.621e-01]mindexpander_qwen_v1:  80%|#######9  | 2393/3000 [2:41:11<30:23,  3.00s/it, lr: 1.0e-04 loss: 1.621e-01]mindexpander_qwen_v1:  80%|#######9  | 2393/3000 [2:41:11<30:23,  3.00s/it, lr: 1.0e-04 loss: 1.621e-01]mindexpander_qwen_v1:  80%|#######9  | 2393/3000 [2:41:17<30:23,  3.00s/it, lr: 1.0e-04 loss: 6.178e-03]mindexpander_qwen_v1:  80%|#######9  | 2393/3000 [2:41:17<30:23,  3.00s/it, lr: 1.0e-04 loss: 6.178e-03]mindexpander_qwen_v1:  80%|#######9  | 2394/3000 [2:41:17<38:18,  3.79s/it, lr: 1.0e-04 loss: 6.178e-03]mindexpander_qwen_v1:  80%|#######9  | 2394/3000 [2:41:17<38:18,  3.79s/it, lr: 1.0e-04 loss: 6.178e-03]mindexpander_qwen_v1:  80%|#######9  | 2394/3000 [2:41:20<38:18,  3.79s/it, lr: 1.0e-04 loss: 1.852e-01]mindexpander_qwen_v1:  80%|#######9  | 2394/3000 [2:41:20<38:18,  3.79s/it, lr: 1.0e-04 loss: 1.852e-01]mindexpander_qwen_v1:  80%|#######9  | 2395/3000 [2:41:20<38:08,  3.78s/it, lr: 1.0e-04 loss: 1.852e-01]mindexpander_qwen_v1:  80%|#######9  | 2395/3000 [2:41:20<38:08,  3.78s/it, lr: 1.0e-04 loss: 1.852e-01]mindexpander_qwen_v1:  80%|#######9  | 2395/3000 [2:41:23<38:08,  3.78s/it, lr: 1.0e-04 loss: 1.999e-02]mindexpander_qwen_v1:  80%|#######9  | 2395/3000 [2:41:23<38:08,  3.78s/it, lr: 1.0e-04 loss: 1.999e-02]mindexpander_qwen_v1:  80%|#######9  | 2396/3000 [2:41:23<34:17,  3.41s/it, lr: 1.0e-04 loss: 1.999e-02]mindexpander_qwen_v1:  80%|#######9  | 2396/3000 [2:41:23<34:17,  3.41s/it, lr: 1.0e-04 loss: 1.999e-02]mindexpander_qwen_v1:  80%|#######9  | 2396/3000 [2:41:29<34:17,  3.41s/it, lr: 1.0e-04 loss: 2.769e-02]mindexpander_qwen_v1:  80%|#######9  | 2396/3000 [2:41:29<34:17,  3.41s/it, lr: 1.0e-04 loss: 2.769e-02]mindexpander_qwen_v1:  80%|#######9  | 2397/3000 [2:41:29<41:03,  4.09s/it, lr: 1.0e-04 loss: 2.769e-02]mindexpander_qwen_v1:  80%|#######9  | 2397/3000 [2:41:29<41:03,  4.09s/it, lr: 1.0e-04 loss: 2.769e-02]mindexpander_qwen_v1:  80%|#######9  | 2397/3000 [2:41:33<41:03,  4.09s/it, lr: 1.0e-04 loss: 1.864e-02]mindexpander_qwen_v1:  80%|#######9  | 2397/3000 [2:41:33<41:03,  4.09s/it, lr: 1.0e-04 loss: 1.864e-02]mindexpander_qwen_v1:  80%|#######9  | 2398/3000 [2:41:33<40:30,  4.04s/it, lr: 1.0e-04 loss: 1.864e-02]mindexpander_qwen_v1:  80%|#######9  | 2398/3000 [2:41:33<40:30,  4.04s/it, lr: 1.0e-04 loss: 1.864e-02]mindexpander_qwen_v1:  80%|#######9  | 2398/3000 [2:41:36<40:30,  4.04s/it, lr: 1.0e-04 loss: 3.283e-02]mindexpander_qwen_v1:  80%|#######9  | 2398/3000 [2:41:36<40:30,  4.04s/it, lr: 1.0e-04 loss: 3.283e-02]mindexpander_qwen_v1:  80%|#######9  | 2399/3000 [2:41:36<39:34,  3.95s/it, lr: 1.0e-04 loss: 3.283e-02]mindexpander_qwen_v1:  80%|#######9  | 2399/3000 [2:41:36<39:34,  3.95s/it, lr: 1.0e-04 loss: 3.283e-02]mindexpander_qwen_v1:  80%|#######9  | 2399/3000 [2:41:39<39:34,  3.95s/it, lr: 1.0e-04 loss: 1.958e-01]mindexpander_qwen_v1:  80%|#######9  | 2399/3000 [2:41:39<39:34,  3.95s/it, lr: 1.0e-04 loss: 1.958e-01]mindexpander_qwen_v1:  80%|########  | 2400/3000 [2:41:43<39:30,  3.95s/it, lr: 1.0e-04 loss: 9.972e-03]mindexpander_qwen_v1:  80%|########  | 2400/3000 [2:41:43<39:30,  3.95s/it, lr: 1.0e-04 loss: 9.972e-03]mindexpander_qwen_v1:  80%|########  | 2401/3000 [2:41:43<29:59,  3.00s/it, lr: 1.0e-04 loss: 9.972e-03]mindexpander_qwen_v1:  80%|########  | 2401/3000 [2:41:43<29:59,  3.00s/it, lr: 1.0e-04 loss: 9.972e-03]mindexpander_qwen_v1:  80%|########  | 2401/3000 [2:41:47<29:59,  3.00s/it, lr: 1.0e-04 loss: 1.420e-01]mindexpander_qwen_v1:  80%|########  | 2401/3000 [2:41:47<29:59,  3.00s/it, lr: 1.0e-04 loss: 1.420e-01]mindexpander_qwen_v1:  80%|########  | 2402/3000 [2:41:47<32:22,  3.25s/it, lr: 1.0e-04 loss: 1.420e-01]mindexpander_qwen_v1:  80%|########  | 2402/3000 [2:41:47<32:22,  3.25s/it, lr: 1.0e-04 loss: 1.420e-01]mindexpander_qwen_v1:  80%|########  | 2402/3000 [2:41:49<32:22,  3.25s/it, lr: 1.0e-04 loss: 1.164e-01]mindexpander_qwen_v1:  80%|########  | 2402/3000 [2:41:49<32:22,  3.25s/it, lr: 1.0e-04 loss: 1.164e-01]mindexpander_qwen_v1:  80%|########  | 2403/3000 [2:41:49<30:15,  3.04s/it, lr: 1.0e-04 loss: 1.164e-01]mindexpander_qwen_v1:  80%|########  | 2403/3000 [2:41:49<30:15,  3.04s/it, lr: 1.0e-04 loss: 1.164e-01]mindexpander_qwen_v1:  80%|########  | 2403/3000 [2:41:52<30:15,  3.04s/it, lr: 1.0e-04 loss: 1.652e-01]mindexpander_qwen_v1:  80%|########  | 2403/3000 [2:41:52<30:15,  3.04s/it, lr: 1.0e-04 loss: 1.652e-01]mindexpander_qwen_v1:  80%|########  | 2404/3000 [2:41:52<28:40,  2.89s/it, lr: 1.0e-04 loss: 1.652e-01]mindexpander_qwen_v1:  80%|########  | 2404/3000 [2:41:52<28:40,  2.89s/it, lr: 1.0e-04 loss: 1.652e-01]mindexpander_qwen_v1:  80%|########  | 2404/3000 [2:41:54<28:40,  2.89s/it, lr: 1.0e-04 loss: 6.376e-02]mindexpander_qwen_v1:  80%|########  | 2404/3000 [2:41:54<28:40,  2.89s/it, lr: 1.0e-04 loss: 6.376e-02]mindexpander_qwen_v1:  80%|########  | 2405/3000 [2:41:54<27:25,  2.77s/it, lr: 1.0e-04 loss: 6.376e-02]mindexpander_qwen_v1:  80%|########  | 2405/3000 [2:41:54<27:25,  2.77s/it, lr: 1.0e-04 loss: 6.376e-02]mindexpander_qwen_v1:  80%|########  | 2405/3000 [2:41:57<27:25,  2.77s/it, lr: 1.0e-04 loss: 2.802e-02]mindexpander_qwen_v1:  80%|########  | 2405/3000 [2:41:57<27:25,  2.77s/it, lr: 1.0e-04 loss: 2.802e-02]mindexpander_qwen_v1:  80%|########  | 2406/3000 [2:41:57<27:05,  2.74s/it, lr: 1.0e-04 loss: 2.802e-02]mindexpander_qwen_v1:  80%|########  | 2406/3000 [2:41:57<27:05,  2.74s/it, lr: 1.0e-04 loss: 2.802e-02]mindexpander_qwen_v1:  80%|########  | 2406/3000 [2:42:03<27:05,  2.74s/it, lr: 1.0e-04 loss: 9.415e-02]mindexpander_qwen_v1:  80%|########  | 2406/3000 [2:42:03<27:05,  2.74s/it, lr: 1.0e-04 loss: 9.415e-02]mindexpander_qwen_v1:  80%|########  | 2407/3000 [2:42:03<35:41,  3.61s/it, lr: 1.0e-04 loss: 9.415e-02]mindexpander_qwen_v1:  80%|########  | 2407/3000 [2:42:03<35:41,  3.61s/it, lr: 1.0e-04 loss: 9.415e-02]mindexpander_qwen_v1:  80%|########  | 2407/3000 [2:42:08<35:41,  3.61s/it, lr: 1.0e-04 loss: 8.276e-02]mindexpander_qwen_v1:  80%|########  | 2407/3000 [2:42:08<35:41,  3.61s/it, lr: 1.0e-04 loss: 8.276e-02]mindexpander_qwen_v1:  80%|########  | 2408/3000 [2:42:08<41:49,  4.24s/it, lr: 1.0e-04 loss: 8.276e-02]mindexpander_qwen_v1:  80%|########  | 2408/3000 [2:42:08<41:49,  4.24s/it, lr: 1.0e-04 loss: 8.276e-02]mindexpander_qwen_v1:  80%|########  | 2408/3000 [2:42:12<41:49,  4.24s/it, lr: 1.0e-04 loss: 9.389e-02]mindexpander_qwen_v1:  80%|########  | 2408/3000 [2:42:12<41:49,  4.24s/it, lr: 1.0e-04 loss: 9.389e-02]mindexpander_qwen_v1:  80%|########  | 2409/3000 [2:42:12<40:18,  4.09s/it, lr: 1.0e-04 loss: 9.389e-02]mindexpander_qwen_v1:  80%|########  | 2409/3000 [2:42:12<40:18,  4.09s/it, lr: 1.0e-04 loss: 9.389e-02]mindexpander_qwen_v1:  80%|########  | 2409/3000 [2:42:18<40:18,  4.09s/it, lr: 1.0e-04 loss: 8.668e-02]mindexpander_qwen_v1:  80%|########  | 2409/3000 [2:42:18<40:18,  4.09s/it, lr: 1.0e-04 loss: 8.668e-02]mindexpander_qwen_v1:  80%|########  | 2410/3000 [2:42:20<40:14,  4.09s/it, lr: 1.0e-04 loss: 1.962e-01]mindexpander_qwen_v1:  80%|########  | 2410/3000 [2:42:20<40:14,  4.09s/it, lr: 1.0e-04 loss: 1.962e-01]mindexpander_qwen_v1:  80%|########  | 2411/3000 [2:42:20<27:17,  2.78s/it, lr: 1.0e-04 loss: 1.962e-01]mindexpander_qwen_v1:  80%|########  | 2411/3000 [2:42:20<27:17,  2.78s/it, lr: 1.0e-04 loss: 1.962e-01]mindexpander_qwen_v1:  80%|########  | 2411/3000 [2:42:26<27:17,  2.78s/it, lr: 1.0e-04 loss: 1.317e-01]mindexpander_qwen_v1:  80%|########  | 2411/3000 [2:42:26<27:17,  2.78s/it, lr: 1.0e-04 loss: 1.317e-01]mindexpander_qwen_v1:  80%|########  | 2412/3000 [2:42:26<34:25,  3.51s/it, lr: 1.0e-04 loss: 1.317e-01]mindexpander_qwen_v1:  80%|########  | 2412/3000 [2:42:26<34:25,  3.51s/it, lr: 1.0e-04 loss: 1.317e-01]mindexpander_qwen_v1:  80%|########  | 2412/3000 [2:42:30<34:25,  3.51s/it, lr: 1.0e-04 loss: 4.165e-02]mindexpander_qwen_v1:  80%|########  | 2412/3000 [2:42:30<34:25,  3.51s/it, lr: 1.0e-04 loss: 4.165e-02]mindexpander_qwen_v1:  80%|########  | 2413/3000 [2:42:30<34:56,  3.57s/it, lr: 1.0e-04 loss: 4.165e-02]mindexpander_qwen_v1:  80%|########  | 2413/3000 [2:42:30<34:56,  3.57s/it, lr: 1.0e-04 loss: 4.165e-02]mindexpander_qwen_v1:  80%|########  | 2413/3000 [2:42:34<34:56,  3.57s/it, lr: 1.0e-04 loss: 1.316e-01]mindexpander_qwen_v1:  80%|########  | 2413/3000 [2:42:34<34:56,  3.57s/it, lr: 1.0e-04 loss: 1.316e-01]mindexpander_qwen_v1:  80%|########  | 2414/3000 [2:42:34<35:43,  3.66s/it, lr: 1.0e-04 loss: 1.316e-01]mindexpander_qwen_v1:  80%|########  | 2414/3000 [2:42:34<35:43,  3.66s/it, lr: 1.0e-04 loss: 1.316e-01]mindexpander_qwen_v1:  80%|########  | 2414/3000 [2:42:36<35:43,  3.66s/it, lr: 1.0e-04 loss: 2.207e-02]mindexpander_qwen_v1:  80%|########  | 2414/3000 [2:42:36<35:43,  3.66s/it, lr: 1.0e-04 loss: 2.207e-02]mindexpander_qwen_v1:  80%|########  | 2415/3000 [2:42:36<32:22,  3.32s/it, lr: 1.0e-04 loss: 2.207e-02]mindexpander_qwen_v1:  80%|########  | 2415/3000 [2:42:36<32:22,  3.32s/it, lr: 1.0e-04 loss: 2.207e-02]mindexpander_qwen_v1:  80%|########  | 2415/3000 [2:42:42<32:22,  3.32s/it, lr: 1.0e-04 loss: 1.551e-01]mindexpander_qwen_v1:  80%|########  | 2415/3000 [2:42:42<32:22,  3.32s/it, lr: 1.0e-04 loss: 1.551e-01]mindexpander_qwen_v1:  81%|########  | 2416/3000 [2:42:42<39:05,  4.02s/it, lr: 1.0e-04 loss: 1.551e-01]mindexpander_qwen_v1:  81%|########  | 2416/3000 [2:42:42<39:05,  4.02s/it, lr: 1.0e-04 loss: 1.551e-01]mindexpander_qwen_v1:  81%|########  | 2416/3000 [2:42:48<39:05,  4.02s/it, lr: 1.0e-04 loss: 2.363e-02]mindexpander_qwen_v1:  81%|########  | 2416/3000 [2:42:48<39:05,  4.02s/it, lr: 1.0e-04 loss: 2.363e-02]mindexpander_qwen_v1:  81%|########  | 2417/3000 [2:42:48<43:55,  4.52s/it, lr: 1.0e-04 loss: 2.363e-02]mindexpander_qwen_v1:  81%|########  | 2417/3000 [2:42:48<43:55,  4.52s/it, lr: 1.0e-04 loss: 2.363e-02]mindexpander_qwen_v1:  81%|########  | 2417/3000 [2:42:54<43:55,  4.52s/it, lr: 1.0e-04 loss: 1.254e-01]mindexpander_qwen_v1:  81%|########  | 2417/3000 [2:42:54<43:55,  4.52s/it, lr: 1.0e-04 loss: 1.254e-01]mindexpander_qwen_v1:  81%|########  | 2418/3000 [2:42:54<47:45,  4.92s/it, lr: 1.0e-04 loss: 1.254e-01]mindexpander_qwen_v1:  81%|########  | 2418/3000 [2:42:54<47:45,  4.92s/it, lr: 1.0e-04 loss: 1.254e-01]mindexpander_qwen_v1:  81%|########  | 2418/3000 [2:42:56<47:45,  4.92s/it, lr: 1.0e-04 loss: 3.483e-02]mindexpander_qwen_v1:  81%|########  | 2418/3000 [2:42:56<47:45,  4.92s/it, lr: 1.0e-04 loss: 3.483e-02]mindexpander_qwen_v1:  81%|########  | 2419/3000 [2:42:56<40:35,  4.19s/it, lr: 1.0e-04 loss: 3.483e-02]mindexpander_qwen_v1:  81%|########  | 2419/3000 [2:42:56<40:35,  4.19s/it, lr: 1.0e-04 loss: 3.483e-02]mindexpander_qwen_v1:  81%|########  | 2419/3000 [2:43:00<40:35,  4.19s/it, lr: 1.0e-04 loss: 6.635e-02]mindexpander_qwen_v1:  81%|########  | 2419/3000 [2:43:00<40:35,  4.19s/it, lr: 1.0e-04 loss: 6.635e-02]mindexpander_qwen_v1:  81%|########  | 2420/3000 [2:43:02<40:31,  4.19s/it, lr: 1.0e-04 loss: 5.606e-02]mindexpander_qwen_v1:  81%|########  | 2420/3000 [2:43:02<40:31,  4.19s/it, lr: 1.0e-04 loss: 5.606e-02]mindexpander_qwen_v1:  81%|########  | 2421/3000 [2:43:02<27:22,  2.84s/it, lr: 1.0e-04 loss: 5.606e-02]mindexpander_qwen_v1:  81%|########  | 2421/3000 [2:43:02<27:22,  2.84s/it, lr: 1.0e-04 loss: 5.606e-02]mindexpander_qwen_v1:  81%|########  | 2421/3000 [2:43:06<27:22,  2.84s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  81%|########  | 2421/3000 [2:43:06<27:22,  2.84s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  81%|########  | 2422/3000 [2:43:06<29:52,  3.10s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  81%|########  | 2422/3000 [2:43:06<29:52,  3.10s/it, lr: 1.0e-04 loss: 1.803e-01]mindexpander_qwen_v1:  81%|########  | 2422/3000 [2:43:12<29:52,  3.10s/it, lr: 1.0e-04 loss: 2.822e-02]mindexpander_qwen_v1:  81%|########  | 2422/3000 [2:43:12<29:52,  3.10s/it, lr: 1.0e-04 loss: 2.822e-02]mindexpander_qwen_v1:  81%|########  | 2423/3000 [2:43:12<36:27,  3.79s/it, lr: 1.0e-04 loss: 2.822e-02]mindexpander_qwen_v1:  81%|########  | 2423/3000 [2:43:12<36:27,  3.79s/it, lr: 1.0e-04 loss: 2.822e-02]mindexpander_qwen_v1:  81%|########  | 2423/3000 [2:43:16<36:27,  3.79s/it, lr: 1.0e-04 loss: 1.539e-02]mindexpander_qwen_v1:  81%|########  | 2423/3000 [2:43:16<36:27,  3.79s/it, lr: 1.0e-04 loss: 1.539e-02]mindexpander_qwen_v1:  81%|########  | 2424/3000 [2:43:16<36:18,  3.78s/it, lr: 1.0e-04 loss: 1.539e-02]mindexpander_qwen_v1:  81%|########  | 2424/3000 [2:43:16<36:18,  3.78s/it, lr: 1.0e-04 loss: 1.539e-02]mindexpander_qwen_v1:  81%|########  | 2424/3000 [2:43:21<36:18,  3.78s/it, lr: 1.0e-04 loss: 1.602e-01]mindexpander_qwen_v1:  81%|########  | 2424/3000 [2:43:21<36:18,  3.78s/it, lr: 1.0e-04 loss: 1.602e-01]mindexpander_qwen_v1:  81%|########  | 2425/3000 [2:43:21<41:32,  4.33s/it, lr: 1.0e-04 loss: 1.602e-01]mindexpander_qwen_v1:  81%|########  | 2425/3000 [2:43:21<41:32,  4.33s/it, lr: 1.0e-04 loss: 1.602e-01]mindexpander_qwen_v1:  81%|########  | 2425/3000 [2:43:27<41:32,  4.33s/it, lr: 1.0e-04 loss: 1.270e-02]mindexpander_qwen_v1:  81%|########  | 2425/3000 [2:43:27<41:32,  4.33s/it, lr: 1.0e-04 loss: 1.270e-02]mindexpander_qwen_v1:  81%|########  | 2426/3000 [2:43:27<45:50,  4.79s/it, lr: 1.0e-04 loss: 1.270e-02]mindexpander_qwen_v1:  81%|########  | 2426/3000 [2:43:27<45:50,  4.79s/it, lr: 1.0e-04 loss: 1.270e-02]mindexpander_qwen_v1:  81%|########  | 2426/3000 [2:43:30<45:50,  4.79s/it, lr: 1.0e-04 loss: 2.785e-02]mindexpander_qwen_v1:  81%|########  | 2426/3000 [2:43:30<45:50,  4.79s/it, lr: 1.0e-04 loss: 2.785e-02]mindexpander_qwen_v1:  81%|########  | 2427/3000 [2:43:30<39:18,  4.12s/it, lr: 1.0e-04 loss: 2.785e-02]mindexpander_qwen_v1:  81%|########  | 2427/3000 [2:43:30<39:18,  4.12s/it, lr: 1.0e-04 loss: 2.785e-02]mindexpander_qwen_v1:  81%|########  | 2427/3000 [2:43:34<39:18,  4.12s/it, lr: 1.0e-04 loss: 8.557e-02]mindexpander_qwen_v1:  81%|########  | 2427/3000 [2:43:34<39:18,  4.12s/it, lr: 1.0e-04 loss: 8.557e-02]mindexpander_qwen_v1:  81%|########  | 2428/3000 [2:43:34<38:11,  4.01s/it, lr: 1.0e-04 loss: 8.557e-02]mindexpander_qwen_v1:  81%|########  | 2428/3000 [2:43:34<38:11,  4.01s/it, lr: 1.0e-04 loss: 8.557e-02]mindexpander_qwen_v1:  81%|########  | 2428/3000 [2:43:37<38:11,  4.01s/it, lr: 1.0e-04 loss: 1.151e-01]mindexpander_qwen_v1:  81%|########  | 2428/3000 [2:43:37<38:11,  4.01s/it, lr: 1.0e-04 loss: 1.151e-01]mindexpander_qwen_v1:  81%|########  | 2429/3000 [2:43:37<37:25,  3.93s/it, lr: 1.0e-04 loss: 1.151e-01]mindexpander_qwen_v1:  81%|########  | 2429/3000 [2:43:37<37:25,  3.93s/it, lr: 1.0e-04 loss: 1.151e-01]mindexpander_qwen_v1:  81%|########  | 2429/3000 [2:43:42<37:25,  3.93s/it, lr: 1.0e-04 loss: 1.422e-01]mindexpander_qwen_v1:  81%|########  | 2429/3000 [2:43:42<37:25,  3.93s/it, lr: 1.0e-04 loss: 1.422e-01]mindexpander_qwen_v1:  81%|########1 | 2430/3000 [2:43:47<37:21,  3.93s/it, lr: 1.0e-04 loss: 5.777e-02]mindexpander_qwen_v1:  81%|########1 | 2430/3000 [2:43:47<37:21,  3.93s/it, lr: 1.0e-04 loss: 5.777e-02]mindexpander_qwen_v1:  81%|########1 | 2431/3000 [2:43:47<32:44,  3.45s/it, lr: 1.0e-04 loss: 5.777e-02]mindexpander_qwen_v1:  81%|########1 | 2431/3000 [2:43:47<32:44,  3.45s/it, lr: 1.0e-04 loss: 5.777e-02]mindexpander_qwen_v1:  81%|########1 | 2431/3000 [2:43:50<32:44,  3.45s/it, lr: 1.0e-04 loss: 2.008e-01]mindexpander_qwen_v1:  81%|########1 | 2431/3000 [2:43:50<32:44,  3.45s/it, lr: 1.0e-04 loss: 2.008e-01]mindexpander_qwen_v1:  81%|########1 | 2432/3000 [2:43:50<30:22,  3.21s/it, lr: 1.0e-04 loss: 2.008e-01]mindexpander_qwen_v1:  81%|########1 | 2432/3000 [2:43:50<30:22,  3.21s/it, lr: 1.0e-04 loss: 2.008e-01]mindexpander_qwen_v1:  81%|########1 | 2432/3000 [2:43:56<30:22,  3.21s/it, lr: 1.0e-04 loss: 1.349e-01]mindexpander_qwen_v1:  81%|########1 | 2432/3000 [2:43:56<30:22,  3.21s/it, lr: 1.0e-04 loss: 1.349e-01]mindexpander_qwen_v1:  81%|########1 | 2433/3000 [2:43:56<36:36,  3.87s/it, lr: 1.0e-04 loss: 1.349e-01]mindexpander_qwen_v1:  81%|########1 | 2433/3000 [2:43:56<36:36,  3.87s/it, lr: 1.0e-04 loss: 1.349e-01]mindexpander_qwen_v1:  81%|########1 | 2433/3000 [2:43:58<36:36,  3.87s/it, lr: 1.0e-04 loss: 5.158e-02]mindexpander_qwen_v1:  81%|########1 | 2433/3000 [2:43:58<36:36,  3.87s/it, lr: 1.0e-04 loss: 5.158e-02]mindexpander_qwen_v1:  81%|########1 | 2434/3000 [2:43:58<33:22,  3.54s/it, lr: 1.0e-04 loss: 5.158e-02]mindexpander_qwen_v1:  81%|########1 | 2434/3000 [2:43:58<33:22,  3.54s/it, lr: 1.0e-04 loss: 5.158e-02]mindexpander_qwen_v1:  81%|########1 | 2434/3000 [2:44:04<33:22,  3.54s/it, lr: 1.0e-04 loss: 6.628e-02]mindexpander_qwen_v1:  81%|########1 | 2434/3000 [2:44:04<33:22,  3.54s/it, lr: 1.0e-04 loss: 6.628e-02]mindexpander_qwen_v1:  81%|########1 | 2435/3000 [2:44:04<39:08,  4.16s/it, lr: 1.0e-04 loss: 6.628e-02]mindexpander_qwen_v1:  81%|########1 | 2435/3000 [2:44:04<39:08,  4.16s/it, lr: 1.0e-04 loss: 6.628e-02]mindexpander_qwen_v1:  81%|########1 | 2435/3000 [2:44:10<39:08,  4.16s/it, lr: 1.0e-04 loss: 1.042e-01]mindexpander_qwen_v1:  81%|########1 | 2435/3000 [2:44:10<39:08,  4.16s/it, lr: 1.0e-04 loss: 1.042e-01]mindexpander_qwen_v1:  81%|########1 | 2436/3000 [2:44:10<43:22,  4.61s/it, lr: 1.0e-04 loss: 1.042e-01]mindexpander_qwen_v1:  81%|########1 | 2436/3000 [2:44:10<43:22,  4.61s/it, lr: 1.0e-04 loss: 1.042e-01]mindexpander_qwen_v1:  81%|########1 | 2436/3000 [2:44:12<43:22,  4.61s/it, lr: 1.0e-04 loss: 1.171e-01]mindexpander_qwen_v1:  81%|########1 | 2436/3000 [2:44:12<43:22,  4.61s/it, lr: 1.0e-04 loss: 1.171e-01]mindexpander_qwen_v1:  81%|########1 | 2437/3000 [2:44:12<37:25,  3.99s/it, lr: 1.0e-04 loss: 1.171e-01]mindexpander_qwen_v1:  81%|########1 | 2437/3000 [2:44:12<37:25,  3.99s/it, lr: 1.0e-04 loss: 1.171e-01]mindexpander_qwen_v1:  81%|########1 | 2437/3000 [2:44:18<37:25,  3.99s/it, lr: 1.0e-04 loss: 2.908e-02]mindexpander_qwen_v1:  81%|########1 | 2437/3000 [2:44:18<37:25,  3.99s/it, lr: 1.0e-04 loss: 2.908e-02]mindexpander_qwen_v1:  81%|########1 | 2438/3000 [2:44:18<42:34,  4.55s/it, lr: 1.0e-04 loss: 2.908e-02]mindexpander_qwen_v1:  81%|########1 | 2438/3000 [2:44:18<42:34,  4.55s/it, lr: 1.0e-04 loss: 2.908e-02]mindexpander_qwen_v1:  81%|########1 | 2438/3000 [2:44:22<42:34,  4.55s/it, lr: 1.0e-04 loss: 1.116e-01]mindexpander_qwen_v1:  81%|########1 | 2438/3000 [2:44:22<42:34,  4.55s/it, lr: 1.0e-04 loss: 1.116e-01]mindexpander_qwen_v1:  81%|########1 | 2439/3000 [2:44:22<40:17,  4.31s/it, lr: 1.0e-04 loss: 1.116e-01]mindexpander_qwen_v1:  81%|########1 | 2439/3000 [2:44:22<40:17,  4.31s/it, lr: 1.0e-04 loss: 1.116e-01]mindexpander_qwen_v1:  81%|########1 | 2439/3000 [2:44:26<40:17,  4.31s/it, lr: 1.0e-04 loss: 1.355e-02]mindexpander_qwen_v1:  81%|########1 | 2439/3000 [2:44:26<40:17,  4.31s/it, lr: 1.0e-04 loss: 1.355e-02]mindexpander_qwen_v1:  81%|########1 | 2440/3000 [2:44:29<40:13,  4.31s/it, lr: 1.0e-04 loss: 2.000e-02]mindexpander_qwen_v1:  81%|########1 | 2440/3000 [2:44:29<40:13,  4.31s/it, lr: 1.0e-04 loss: 2.000e-02]mindexpander_qwen_v1:  81%|########1 | 2441/3000 [2:44:29<29:46,  3.20s/it, lr: 1.0e-04 loss: 2.000e-02]mindexpander_qwen_v1:  81%|########1 | 2441/3000 [2:44:29<29:46,  3.20s/it, lr: 1.0e-04 loss: 2.000e-02]mindexpander_qwen_v1:  81%|########1 | 2441/3000 [2:44:33<29:46,  3.20s/it, lr: 1.0e-04 loss: 2.511e-02]mindexpander_qwen_v1:  81%|########1 | 2441/3000 [2:44:33<29:46,  3.20s/it, lr: 1.0e-04 loss: 2.511e-02]mindexpander_qwen_v1:  81%|########1 | 2442/3000 [2:44:33<31:19,  3.37s/it, lr: 1.0e-04 loss: 2.511e-02]mindexpander_qwen_v1:  81%|########1 | 2442/3000 [2:44:33<31:19,  3.37s/it, lr: 1.0e-04 loss: 2.511e-02]mindexpander_qwen_v1:  81%|########1 | 2442/3000 [2:44:36<31:19,  3.37s/it, lr: 1.0e-04 loss: 6.338e-02]mindexpander_qwen_v1:  81%|########1 | 2442/3000 [2:44:36<31:19,  3.37s/it, lr: 1.0e-04 loss: 6.338e-02]mindexpander_qwen_v1:  81%|########1 | 2443/3000 [2:44:36<29:03,  3.13s/it, lr: 1.0e-04 loss: 6.338e-02]mindexpander_qwen_v1:  81%|########1 | 2443/3000 [2:44:36<29:03,  3.13s/it, lr: 1.0e-04 loss: 6.338e-02]mindexpander_qwen_v1:  81%|########1 | 2443/3000 [2:44:41<29:03,  3.13s/it, lr: 1.0e-04 loss: 1.576e-02]mindexpander_qwen_v1:  81%|########1 | 2443/3000 [2:44:41<29:03,  3.13s/it, lr: 1.0e-04 loss: 1.576e-02]mindexpander_qwen_v1:  81%|########1 | 2444/3000 [2:44:41<35:36,  3.84s/it, lr: 1.0e-04 loss: 1.576e-02]mindexpander_qwen_v1:  81%|########1 | 2444/3000 [2:44:41<35:36,  3.84s/it, lr: 1.0e-04 loss: 1.576e-02]mindexpander_qwen_v1:  81%|########1 | 2444/3000 [2:44:45<35:36,  3.84s/it, lr: 1.0e-04 loss: 1.348e-01]mindexpander_qwen_v1:  81%|########1 | 2444/3000 [2:44:45<35:36,  3.84s/it, lr: 1.0e-04 loss: 1.348e-01]mindexpander_qwen_v1:  82%|########1 | 2445/3000 [2:44:45<35:16,  3.81s/it, lr: 1.0e-04 loss: 1.348e-01]mindexpander_qwen_v1:  82%|########1 | 2445/3000 [2:44:45<35:16,  3.81s/it, lr: 1.0e-04 loss: 1.348e-01]mindexpander_qwen_v1:  82%|########1 | 2445/3000 [2:44:51<35:16,  3.81s/it, lr: 1.0e-04 loss: 2.754e-02]mindexpander_qwen_v1:  82%|########1 | 2445/3000 [2:44:51<35:16,  3.81s/it, lr: 1.0e-04 loss: 2.754e-02]mindexpander_qwen_v1:  82%|########1 | 2446/3000 [2:44:51<40:39,  4.40s/it, lr: 1.0e-04 loss: 2.754e-02]mindexpander_qwen_v1:  82%|########1 | 2446/3000 [2:44:51<40:39,  4.40s/it, lr: 1.0e-04 loss: 2.754e-02]mindexpander_qwen_v1:  82%|########1 | 2446/3000 [2:44:55<40:39,  4.40s/it, lr: 1.0e-04 loss: 4.728e-02]mindexpander_qwen_v1:  82%|########1 | 2446/3000 [2:44:55<40:39,  4.40s/it, lr: 1.0e-04 loss: 4.728e-02]mindexpander_qwen_v1:  82%|########1 | 2447/3000 [2:44:55<38:50,  4.21s/it, lr: 1.0e-04 loss: 4.728e-02]mindexpander_qwen_v1:  82%|########1 | 2447/3000 [2:44:55<38:50,  4.21s/it, lr: 1.0e-04 loss: 4.728e-02]mindexpander_qwen_v1:  82%|########1 | 2447/3000 [2:44:57<38:50,  4.21s/it, lr: 1.0e-04 loss: 1.478e-02]mindexpander_qwen_v1:  82%|########1 | 2447/3000 [2:44:57<38:50,  4.21s/it, lr: 1.0e-04 loss: 1.478e-02]mindexpander_qwen_v1:  82%|########1 | 2448/3000 [2:44:57<34:05,  3.70s/it, lr: 1.0e-04 loss: 1.478e-02]mindexpander_qwen_v1:  82%|########1 | 2448/3000 [2:44:57<34:05,  3.70s/it, lr: 1.0e-04 loss: 1.478e-02]mindexpander_qwen_v1:  82%|########1 | 2448/3000 [2:45:01<34:05,  3.70s/it, lr: 1.0e-04 loss: 1.603e-01]mindexpander_qwen_v1:  82%|########1 | 2448/3000 [2:45:01<34:05,  3.70s/it, lr: 1.0e-04 loss: 1.603e-01]mindexpander_qwen_v1:  82%|########1 | 2449/3000 [2:45:01<34:07,  3.72s/it, lr: 1.0e-04 loss: 1.603e-01]mindexpander_qwen_v1:  82%|########1 | 2449/3000 [2:45:01<34:07,  3.72s/it, lr: 1.0e-04 loss: 1.603e-01]mindexpander_qwen_v1:  82%|########1 | 2449/3000 [2:45:07<34:07,  3.72s/it, lr: 1.0e-04 loss: 9.693e-02]mindexpander_qwen_v1:  82%|########1 | 2449/3000 [2:45:07<34:07,  3.72s/it, lr: 1.0e-04 loss: 9.693e-02]mindexpander_qwen_v1:  82%|########1 | 2450/3000 [2:45:11<34:04,  3.72s/it, lr: 1.0e-04 loss: 1.434e-01]mindexpander_qwen_v1:  82%|########1 | 2450/3000 [2:45:11<34:04,  3.72s/it, lr: 1.0e-04 loss: 1.434e-01]mindexpander_qwen_v1:  82%|########1 | 2451/3000 [2:45:11<26:17,  2.87s/it, lr: 1.0e-04 loss: 1.434e-01]mindexpander_qwen_v1:  82%|########1 | 2451/3000 [2:45:11<26:17,  2.87s/it, lr: 1.0e-04 loss: 1.434e-01]mindexpander_qwen_v1:  82%|########1 | 2451/3000 [2:45:16<26:17,  2.87s/it, lr: 1.0e-04 loss: 1.489e-01]mindexpander_qwen_v1:  82%|########1 | 2451/3000 [2:45:16<26:17,  2.87s/it, lr: 1.0e-04 loss: 1.489e-01]mindexpander_qwen_v1:  82%|########1 | 2452/3000 [2:45:16<32:41,  3.58s/it, lr: 1.0e-04 loss: 1.489e-01]mindexpander_qwen_v1:  82%|########1 | 2452/3000 [2:45:16<32:41,  3.58s/it, lr: 1.0e-04 loss: 1.489e-01]mindexpander_qwen_v1:  82%|########1 | 2452/3000 [2:45:19<32:41,  3.58s/it, lr: 1.0e-04 loss: 6.124e-02]mindexpander_qwen_v1:  82%|########1 | 2452/3000 [2:45:19<32:41,  3.58s/it, lr: 1.0e-04 loss: 6.124e-02]mindexpander_qwen_v1:  82%|########1 | 2453/3000 [2:45:19<29:57,  3.29s/it, lr: 1.0e-04 loss: 6.124e-02]mindexpander_qwen_v1:  82%|########1 | 2453/3000 [2:45:19<29:57,  3.29s/it, lr: 1.0e-04 loss: 6.124e-02]mindexpander_qwen_v1:  82%|########1 | 2453/3000 [2:45:22<29:57,  3.29s/it, lr: 1.0e-04 loss: 1.846e-02]mindexpander_qwen_v1:  82%|########1 | 2453/3000 [2:45:22<29:57,  3.29s/it, lr: 1.0e-04 loss: 1.846e-02]mindexpander_qwen_v1:  82%|########1 | 2454/3000 [2:45:22<28:21,  3.12s/it, lr: 1.0e-04 loss: 1.846e-02]mindexpander_qwen_v1:  82%|########1 | 2454/3000 [2:45:22<28:21,  3.12s/it, lr: 1.0e-04 loss: 1.846e-02]mindexpander_qwen_v1:  82%|########1 | 2454/3000 [2:45:27<28:21,  3.12s/it, lr: 1.0e-04 loss: 1.491e-01]mindexpander_qwen_v1:  82%|########1 | 2454/3000 [2:45:27<28:21,  3.12s/it, lr: 1.0e-04 loss: 1.491e-01]mindexpander_qwen_v1:  82%|########1 | 2455/3000 [2:45:27<35:01,  3.86s/it, lr: 1.0e-04 loss: 1.491e-01]mindexpander_qwen_v1:  82%|########1 | 2455/3000 [2:45:27<35:01,  3.86s/it, lr: 1.0e-04 loss: 1.491e-01]mindexpander_qwen_v1:  82%|########1 | 2455/3000 [2:45:31<35:01,  3.86s/it, lr: 1.0e-04 loss: 3.600e-03]mindexpander_qwen_v1:  82%|########1 | 2455/3000 [2:45:31<35:01,  3.86s/it, lr: 1.0e-04 loss: 3.600e-03]mindexpander_qwen_v1:  82%|########1 | 2456/3000 [2:45:31<34:40,  3.82s/it, lr: 1.0e-04 loss: 3.600e-03]mindexpander_qwen_v1:  82%|########1 | 2456/3000 [2:45:31<34:40,  3.82s/it, lr: 1.0e-04 loss: 3.600e-03]mindexpander_qwen_v1:  82%|########1 | 2456/3000 [2:45:33<34:40,  3.82s/it, lr: 1.0e-04 loss: 1.302e-02]mindexpander_qwen_v1:  82%|########1 | 2456/3000 [2:45:33<34:40,  3.82s/it, lr: 1.0e-04 loss: 1.302e-02]mindexpander_qwen_v1:  82%|########1 | 2457/3000 [2:45:33<31:00,  3.43s/it, lr: 1.0e-04 loss: 1.302e-02]mindexpander_qwen_v1:  82%|########1 | 2457/3000 [2:45:33<31:00,  3.43s/it, lr: 1.0e-04 loss: 1.302e-02]mindexpander_qwen_v1:  82%|########1 | 2457/3000 [2:45:36<31:00,  3.43s/it, lr: 1.0e-04 loss: 3.151e-02]mindexpander_qwen_v1:  82%|########1 | 2457/3000 [2:45:36<31:00,  3.43s/it, lr: 1.0e-04 loss: 3.151e-02]mindexpander_qwen_v1:  82%|########1 | 2458/3000 [2:45:36<28:57,  3.20s/it, lr: 1.0e-04 loss: 3.151e-02]mindexpander_qwen_v1:  82%|########1 | 2458/3000 [2:45:36<28:57,  3.20s/it, lr: 1.0e-04 loss: 3.151e-02]mindexpander_qwen_v1:  82%|########1 | 2458/3000 [2:45:39<28:57,  3.20s/it, lr: 1.0e-04 loss: 1.677e-01]mindexpander_qwen_v1:  82%|########1 | 2458/3000 [2:45:39<28:57,  3.20s/it, lr: 1.0e-04 loss: 1.677e-01]mindexpander_qwen_v1:  82%|########1 | 2459/3000 [2:45:39<26:54,  2.98s/it, lr: 1.0e-04 loss: 1.677e-01]mindexpander_qwen_v1:  82%|########1 | 2459/3000 [2:45:39<26:54,  2.98s/it, lr: 1.0e-04 loss: 1.677e-01]mindexpander_qwen_v1:  82%|########1 | 2459/3000 [2:45:41<26:54,  2.98s/it, lr: 1.0e-04 loss: 1.356e-01]mindexpander_qwen_v1:  82%|########1 | 2459/3000 [2:45:41<26:54,  2.98s/it, lr: 1.0e-04 loss: 1.356e-01]mindexpander_qwen_v1:  82%|########2 | 2460/3000 [2:45:44<26:51,  2.98s/it, lr: 1.0e-04 loss: 1.526e-02]mindexpander_qwen_v1:  82%|########2 | 2460/3000 [2:45:44<26:51,  2.98s/it, lr: 1.0e-04 loss: 1.526e-02]mindexpander_qwen_v1:  82%|########2 | 2461/3000 [2:45:44<19:36,  2.18s/it, lr: 1.0e-04 loss: 1.526e-02]mindexpander_qwen_v1:  82%|########2 | 2461/3000 [2:45:44<19:36,  2.18s/it, lr: 1.0e-04 loss: 1.526e-02]mindexpander_qwen_v1:  82%|########2 | 2461/3000 [2:45:48<19:36,  2.18s/it, lr: 1.0e-04 loss: 2.700e-02]mindexpander_qwen_v1:  82%|########2 | 2461/3000 [2:45:48<19:36,  2.18s/it, lr: 1.0e-04 loss: 2.700e-02]mindexpander_qwen_v1:  82%|########2 | 2462/3000 [2:45:48<23:32,  2.63s/it, lr: 1.0e-04 loss: 2.700e-02]mindexpander_qwen_v1:  82%|########2 | 2462/3000 [2:45:48<23:32,  2.63s/it, lr: 1.0e-04 loss: 2.700e-02]mindexpander_qwen_v1:  82%|########2 | 2462/3000 [2:45:52<23:32,  2.63s/it, lr: 1.0e-04 loss: 1.399e-02]mindexpander_qwen_v1:  82%|########2 | 2462/3000 [2:45:52<23:32,  2.63s/it, lr: 1.0e-04 loss: 1.399e-02]mindexpander_qwen_v1:  82%|########2 | 2463/3000 [2:45:52<26:06,  2.92s/it, lr: 1.0e-04 loss: 1.399e-02]mindexpander_qwen_v1:  82%|########2 | 2463/3000 [2:45:52<26:06,  2.92s/it, lr: 1.0e-04 loss: 1.399e-02]mindexpander_qwen_v1:  82%|########2 | 2463/3000 [2:45:54<26:06,  2.92s/it, lr: 1.0e-04 loss: 6.475e-02]mindexpander_qwen_v1:  82%|########2 | 2463/3000 [2:45:54<26:06,  2.92s/it, lr: 1.0e-04 loss: 6.475e-02]mindexpander_qwen_v1:  82%|########2 | 2464/3000 [2:45:54<24:56,  2.79s/it, lr: 1.0e-04 loss: 6.475e-02]mindexpander_qwen_v1:  82%|########2 | 2464/3000 [2:45:54<24:56,  2.79s/it, lr: 1.0e-04 loss: 6.475e-02]mindexpander_qwen_v1:  82%|########2 | 2464/3000 [2:45:57<24:56,  2.79s/it, lr: 1.0e-04 loss: 3.702e-03]mindexpander_qwen_v1:  82%|########2 | 2464/3000 [2:45:57<24:56,  2.79s/it, lr: 1.0e-04 loss: 3.702e-03]mindexpander_qwen_v1:  82%|########2 | 2465/3000 [2:45:57<24:06,  2.70s/it, lr: 1.0e-04 loss: 3.702e-03]mindexpander_qwen_v1:  82%|########2 | 2465/3000 [2:45:57<24:06,  2.70s/it, lr: 1.0e-04 loss: 3.702e-03]mindexpander_qwen_v1:  82%|########2 | 2465/3000 [2:45:59<24:06,  2.70s/it, lr: 1.0e-04 loss: 1.538e-01]mindexpander_qwen_v1:  82%|########2 | 2465/3000 [2:45:59<24:06,  2.70s/it, lr: 1.0e-04 loss: 1.538e-01]mindexpander_qwen_v1:  82%|########2 | 2466/3000 [2:45:59<23:57,  2.69s/it, lr: 1.0e-04 loss: 1.538e-01]mindexpander_qwen_v1:  82%|########2 | 2466/3000 [2:45:59<23:57,  2.69s/it, lr: 1.0e-04 loss: 1.538e-01]mindexpander_qwen_v1:  82%|########2 | 2466/3000 [2:46:05<23:57,  2.69s/it, lr: 1.0e-04 loss: 1.824e-01]mindexpander_qwen_v1:  82%|########2 | 2466/3000 [2:46:05<23:57,  2.69s/it, lr: 1.0e-04 loss: 1.824e-01]mindexpander_qwen_v1:  82%|########2 | 2467/3000 [2:46:05<32:01,  3.61s/it, lr: 1.0e-04 loss: 1.824e-01]mindexpander_qwen_v1:  82%|########2 | 2467/3000 [2:46:05<32:01,  3.61s/it, lr: 1.0e-04 loss: 1.824e-01]mindexpander_qwen_v1:  82%|########2 | 2467/3000 [2:46:08<32:01,  3.61s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:  82%|########2 | 2467/3000 [2:46:08<32:01,  3.61s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:  82%|########2 | 2468/3000 [2:46:08<28:58,  3.27s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:  82%|########2 | 2468/3000 [2:46:08<28:58,  3.27s/it, lr: 1.0e-04 loss: 1.139e-01]mindexpander_qwen_v1:  82%|########2 | 2468/3000 [2:46:13<28:58,  3.27s/it, lr: 1.0e-04 loss: 1.809e-01]mindexpander_qwen_v1:  82%|########2 | 2468/3000 [2:46:13<28:58,  3.27s/it, lr: 1.0e-04 loss: 1.809e-01]mindexpander_qwen_v1:  82%|########2 | 2469/3000 [2:46:13<35:28,  4.01s/it, lr: 1.0e-04 loss: 1.809e-01]mindexpander_qwen_v1:  82%|########2 | 2469/3000 [2:46:13<35:28,  4.01s/it, lr: 1.0e-04 loss: 1.809e-01]mindexpander_qwen_v1:  82%|########2 | 2469/3000 [2:46:17<35:28,  4.01s/it, lr: 1.0e-04 loss: 1.177e-02]mindexpander_qwen_v1:  82%|########2 | 2469/3000 [2:46:17<35:28,  4.01s/it, lr: 1.0e-04 loss: 1.177e-02]mindexpander_qwen_v1:  82%|########2 | 2470/3000 [2:46:23<35:24,  4.01s/it, lr: 1.0e-04 loss: 1.790e-02]mindexpander_qwen_v1:  82%|########2 | 2470/3000 [2:46:23<35:24,  4.01s/it, lr: 1.0e-04 loss: 1.790e-02]mindexpander_qwen_v1:  82%|########2 | 2471/3000 [2:46:23<30:48,  3.50s/it, lr: 1.0e-04 loss: 1.790e-02]mindexpander_qwen_v1:  82%|########2 | 2471/3000 [2:46:23<30:48,  3.50s/it, lr: 1.0e-04 loss: 1.790e-02]mindexpander_qwen_v1:  82%|########2 | 2471/3000 [2:46:29<30:48,  3.50s/it, lr: 1.0e-04 loss: 1.790e-01]mindexpander_qwen_v1:  82%|########2 | 2471/3000 [2:46:29<30:48,  3.50s/it, lr: 1.0e-04 loss: 1.790e-01]mindexpander_qwen_v1:  82%|########2 | 2472/3000 [2:46:29<35:58,  4.09s/it, lr: 1.0e-04 loss: 1.790e-01]mindexpander_qwen_v1:  82%|########2 | 2472/3000 [2:46:29<35:58,  4.09s/it, lr: 1.0e-04 loss: 1.790e-01]mindexpander_qwen_v1:  82%|########2 | 2472/3000 [2:46:35<35:58,  4.09s/it, lr: 1.0e-04 loss: 3.173e-02]mindexpander_qwen_v1:  82%|########2 | 2472/3000 [2:46:35<35:58,  4.09s/it, lr: 1.0e-04 loss: 3.173e-02]mindexpander_qwen_v1:  82%|########2 | 2473/3000 [2:46:35<39:52,  4.54s/it, lr: 1.0e-04 loss: 3.173e-02]mindexpander_qwen_v1:  82%|########2 | 2473/3000 [2:46:35<39:52,  4.54s/it, lr: 1.0e-04 loss: 3.173e-02]mindexpander_qwen_v1:  82%|########2 | 2473/3000 [2:46:38<39:52,  4.54s/it, lr: 1.0e-04 loss: 3.692e-02]mindexpander_qwen_v1:  82%|########2 | 2473/3000 [2:46:38<39:52,  4.54s/it, lr: 1.0e-04 loss: 3.692e-02]mindexpander_qwen_v1:  82%|########2 | 2474/3000 [2:46:38<35:28,  4.05s/it, lr: 1.0e-04 loss: 3.692e-02]mindexpander_qwen_v1:  82%|########2 | 2474/3000 [2:46:38<35:28,  4.05s/it, lr: 1.0e-04 loss: 3.692e-02]mindexpander_qwen_v1:  82%|########2 | 2474/3000 [2:46:42<35:28,  4.05s/it, lr: 1.0e-04 loss: 1.661e-01]mindexpander_qwen_v1:  82%|########2 | 2474/3000 [2:46:42<35:28,  4.05s/it, lr: 1.0e-04 loss: 1.661e-01]mindexpander_qwen_v1:  82%|########2 | 2475/3000 [2:46:42<35:29,  4.06s/it, lr: 1.0e-04 loss: 1.661e-01]mindexpander_qwen_v1:  82%|########2 | 2475/3000 [2:46:42<35:29,  4.06s/it, lr: 1.0e-04 loss: 1.661e-01]mindexpander_qwen_v1:  82%|########2 | 2475/3000 [2:46:46<35:29,  4.06s/it, lr: 1.0e-04 loss: 7.896e-02]mindexpander_qwen_v1:  82%|########2 | 2475/3000 [2:46:46<35:29,  4.06s/it, lr: 1.0e-04 loss: 7.896e-02]mindexpander_qwen_v1:  83%|########2 | 2476/3000 [2:46:46<35:45,  4.10s/it, lr: 1.0e-04 loss: 7.896e-02]mindexpander_qwen_v1:  83%|########2 | 2476/3000 [2:46:46<35:45,  4.10s/it, lr: 1.0e-04 loss: 7.896e-02]mindexpander_qwen_v1:  83%|########2 | 2476/3000 [2:46:52<35:45,  4.10s/it, lr: 1.0e-04 loss: 1.492e-01]mindexpander_qwen_v1:  83%|########2 | 2476/3000 [2:46:52<35:45,  4.10s/it, lr: 1.0e-04 loss: 1.492e-01]mindexpander_qwen_v1:  83%|########2 | 2477/3000 [2:46:52<40:43,  4.67s/it, lr: 1.0e-04 loss: 1.492e-01]mindexpander_qwen_v1:  83%|########2 | 2477/3000 [2:46:52<40:43,  4.67s/it, lr: 1.0e-04 loss: 1.492e-01]mindexpander_qwen_v1:  83%|########2 | 2477/3000 [2:46:58<40:43,  4.67s/it, lr: 1.0e-04 loss: 4.780e-02]mindexpander_qwen_v1:  83%|########2 | 2477/3000 [2:46:58<40:43,  4.67s/it, lr: 1.0e-04 loss: 4.780e-02]mindexpander_qwen_v1:  83%|########2 | 2478/3000 [2:46:58<43:45,  5.03s/it, lr: 1.0e-04 loss: 4.780e-02]mindexpander_qwen_v1:  83%|########2 | 2478/3000 [2:46:58<43:45,  5.03s/it, lr: 1.0e-04 loss: 4.780e-02]mindexpander_qwen_v1:  83%|########2 | 2478/3000 [2:47:04<43:45,  5.03s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  83%|########2 | 2478/3000 [2:47:04<43:45,  5.03s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  83%|########2 | 2479/3000 [2:47:04<45:37,  5.25s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  83%|########2 | 2479/3000 [2:47:04<45:37,  5.25s/it, lr: 1.0e-04 loss: 1.310e-01]mindexpander_qwen_v1:  83%|########2 | 2479/3000 [2:47:06<45:37,  5.25s/it, lr: 1.0e-04 loss: 8.652e-02]mindexpander_qwen_v1:  83%|########2 | 2479/3000 [2:47:06<45:37,  5.25s/it, lr: 1.0e-04 loss: 8.652e-02]mindexpander_qwen_v1:  83%|########2 | 2480/3000 [2:47:08<45:32,  5.25s/it, lr: 1.0e-04 loss: 2.828e-02]mindexpander_qwen_v1:  83%|########2 | 2480/3000 [2:47:08<45:32,  5.25s/it, lr: 1.0e-04 loss: 2.828e-02]mindexpander_qwen_v1:  83%|########2 | 2481/3000 [2:47:08<29:30,  3.41s/it, lr: 1.0e-04 loss: 2.828e-02]mindexpander_qwen_v1:  83%|########2 | 2481/3000 [2:47:08<29:30,  3.41s/it, lr: 1.0e-04 loss: 2.828e-02]mindexpander_qwen_v1:  83%|########2 | 2481/3000 [2:47:12<29:30,  3.41s/it, lr: 1.0e-04 loss: 1.034e-02]mindexpander_qwen_v1:  83%|########2 | 2481/3000 [2:47:12<29:30,  3.41s/it, lr: 1.0e-04 loss: 1.034e-02]mindexpander_qwen_v1:  83%|########2 | 2482/3000 [2:47:12<30:31,  3.54s/it, lr: 1.0e-04 loss: 1.034e-02]mindexpander_qwen_v1:  83%|########2 | 2482/3000 [2:47:12<30:31,  3.54s/it, lr: 1.0e-04 loss: 1.034e-02]mindexpander_qwen_v1:  83%|########2 | 2482/3000 [2:47:16<30:31,  3.54s/it, lr: 1.0e-04 loss: 3.741e-02]mindexpander_qwen_v1:  83%|########2 | 2482/3000 [2:47:16<30:31,  3.54s/it, lr: 1.0e-04 loss: 3.741e-02]mindexpander_qwen_v1:  83%|########2 | 2483/3000 [2:47:16<30:54,  3.59s/it, lr: 1.0e-04 loss: 3.741e-02]mindexpander_qwen_v1:  83%|########2 | 2483/3000 [2:47:16<30:54,  3.59s/it, lr: 1.0e-04 loss: 3.741e-02]mindexpander_qwen_v1:  83%|########2 | 2483/3000 [2:47:20<30:54,  3.59s/it, lr: 1.0e-04 loss: 1.821e-01]mindexpander_qwen_v1:  83%|########2 | 2483/3000 [2:47:20<30:54,  3.59s/it, lr: 1.0e-04 loss: 1.821e-01]mindexpander_qwen_v1:  83%|########2 | 2484/3000 [2:47:20<31:12,  3.63s/it, lr: 1.0e-04 loss: 1.821e-01]mindexpander_qwen_v1:  83%|########2 | 2484/3000 [2:47:20<31:12,  3.63s/it, lr: 1.0e-04 loss: 1.821e-01]mindexpander_qwen_v1:  83%|########2 | 2484/3000 [2:47:24<31:12,  3.63s/it, lr: 1.0e-04 loss: 1.307e-02]mindexpander_qwen_v1:  83%|########2 | 2484/3000 [2:47:24<31:12,  3.63s/it, lr: 1.0e-04 loss: 1.307e-02]mindexpander_qwen_v1:  83%|########2 | 2485/3000 [2:47:24<31:23,  3.66s/it, lr: 1.0e-04 loss: 1.307e-02]mindexpander_qwen_v1:  83%|########2 | 2485/3000 [2:47:24<31:23,  3.66s/it, lr: 1.0e-04 loss: 1.307e-02]mindexpander_qwen_v1:  83%|########2 | 2485/3000 [2:47:30<31:23,  3.66s/it, lr: 1.0e-04 loss: 2.692e-02]mindexpander_qwen_v1:  83%|########2 | 2485/3000 [2:47:30<31:23,  3.66s/it, lr: 1.0e-04 loss: 2.692e-02]mindexpander_qwen_v1:  83%|########2 | 2486/3000 [2:47:30<36:47,  4.30s/it, lr: 1.0e-04 loss: 2.692e-02]mindexpander_qwen_v1:  83%|########2 | 2486/3000 [2:47:30<36:47,  4.30s/it, lr: 1.0e-04 loss: 2.692e-02]mindexpander_qwen_v1:  83%|########2 | 2486/3000 [2:47:35<36:47,  4.30s/it, lr: 1.0e-04 loss: 1.818e-01]mindexpander_qwen_v1:  83%|########2 | 2486/3000 [2:47:35<36:47,  4.30s/it, lr: 1.0e-04 loss: 1.818e-01]mindexpander_qwen_v1:  83%|########2 | 2487/3000 [2:47:35<40:19,  4.72s/it, lr: 1.0e-04 loss: 1.818e-01]mindexpander_qwen_v1:  83%|########2 | 2487/3000 [2:47:35<40:19,  4.72s/it, lr: 1.0e-04 loss: 1.818e-01]mindexpander_qwen_v1:  83%|########2 | 2487/3000 [2:47:38<40:19,  4.72s/it, lr: 1.0e-04 loss: 1.712e-01]mindexpander_qwen_v1:  83%|########2 | 2487/3000 [2:47:38<40:19,  4.72s/it, lr: 1.0e-04 loss: 1.712e-01]mindexpander_qwen_v1:  83%|########2 | 2488/3000 [2:47:38<34:34,  4.05s/it, lr: 1.0e-04 loss: 1.712e-01]mindexpander_qwen_v1:  83%|########2 | 2488/3000 [2:47:38<34:34,  4.05s/it, lr: 1.0e-04 loss: 1.712e-01]mindexpander_qwen_v1:  83%|########2 | 2488/3000 [2:47:41<34:34,  4.05s/it, lr: 1.0e-04 loss: 7.946e-02]mindexpander_qwen_v1:  83%|########2 | 2488/3000 [2:47:41<34:34,  4.05s/it, lr: 1.0e-04 loss: 7.946e-02]mindexpander_qwen_v1:  83%|########2 | 2489/3000 [2:47:41<33:43,  3.96s/it, lr: 1.0e-04 loss: 7.946e-02]mindexpander_qwen_v1:  83%|########2 | 2489/3000 [2:47:41<33:43,  3.96s/it, lr: 1.0e-04 loss: 7.946e-02]mindexpander_qwen_v1:  83%|########2 | 2489/3000 [2:47:45<33:43,  3.96s/it, lr: 1.0e-04 loss: 1.198e-02]mindexpander_qwen_v1:  83%|########2 | 2489/3000 [2:47:45<33:43,  3.96s/it, lr: 1.0e-04 loss: 1.198e-02]mindexpander_qwen_v1:  83%|########2 | 2490/3000 [2:47:48<33:39,  3.96s/it, lr: 1.0e-04 loss: 1.437e-01]mindexpander_qwen_v1:  83%|########2 | 2490/3000 [2:47:48<33:39,  3.96s/it, lr: 1.0e-04 loss: 1.437e-01]mindexpander_qwen_v1:  83%|########3 | 2491/3000 [2:47:48<25:29,  3.00s/it, lr: 1.0e-04 loss: 1.437e-01]mindexpander_qwen_v1:  83%|########3 | 2491/3000 [2:47:48<25:29,  3.00s/it, lr: 1.0e-04 loss: 1.437e-01]mindexpander_qwen_v1:  83%|########3 | 2491/3000 [2:47:54<25:29,  3.00s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  83%|########3 | 2491/3000 [2:47:54<25:29,  3.00s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  83%|########3 | 2492/3000 [2:47:54<31:12,  3.69s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  83%|########3 | 2492/3000 [2:47:54<31:12,  3.69s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  83%|########3 | 2492/3000 [2:47:56<31:12,  3.69s/it, lr: 1.0e-04 loss: 4.807e-03]mindexpander_qwen_v1:  83%|########3 | 2492/3000 [2:47:56<31:12,  3.69s/it, lr: 1.0e-04 loss: 4.807e-03]mindexpander_qwen_v1:  83%|########3 | 2493/3000 [2:47:56<28:25,  3.36s/it, lr: 1.0e-04 loss: 4.807e-03]mindexpander_qwen_v1:  83%|########3 | 2493/3000 [2:47:56<28:25,  3.36s/it, lr: 1.0e-04 loss: 4.807e-03]mindexpander_qwen_v1:  83%|########3 | 2493/3000 [2:48:02<28:25,  3.36s/it, lr: 1.0e-04 loss: 2.083e-02]mindexpander_qwen_v1:  83%|########3 | 2493/3000 [2:48:02<28:25,  3.36s/it, lr: 1.0e-04 loss: 2.083e-02]mindexpander_qwen_v1:  83%|########3 | 2494/3000 [2:48:02<34:09,  4.05s/it, lr: 1.0e-04 loss: 2.083e-02]mindexpander_qwen_v1:  83%|########3 | 2494/3000 [2:48:02<34:09,  4.05s/it, lr: 1.0e-04 loss: 2.083e-02]mindexpander_qwen_v1:  83%|########3 | 2494/3000 [2:48:05<34:09,  4.05s/it, lr: 1.0e-04 loss: 1.160e-02]mindexpander_qwen_v1:  83%|########3 | 2494/3000 [2:48:05<34:09,  4.05s/it, lr: 1.0e-04 loss: 1.160e-02]mindexpander_qwen_v1:  83%|########3 | 2495/3000 [2:48:05<30:20,  3.61s/it, lr: 1.0e-04 loss: 1.160e-02]mindexpander_qwen_v1:  83%|########3 | 2495/3000 [2:48:05<30:20,  3.61s/it, lr: 1.0e-04 loss: 1.160e-02]mindexpander_qwen_v1:  83%|########3 | 2495/3000 [2:48:07<30:20,  3.61s/it, lr: 1.0e-04 loss: 1.484e-02]mindexpander_qwen_v1:  83%|########3 | 2495/3000 [2:48:07<30:20,  3.61s/it, lr: 1.0e-04 loss: 1.484e-02]mindexpander_qwen_v1:  83%|########3 | 2496/3000 [2:48:07<27:33,  3.28s/it, lr: 1.0e-04 loss: 1.484e-02]mindexpander_qwen_v1:  83%|########3 | 2496/3000 [2:48:07<27:33,  3.28s/it, lr: 1.0e-04 loss: 1.484e-02]mindexpander_qwen_v1:  83%|########3 | 2496/3000 [2:48:11<27:33,  3.28s/it, lr: 1.0e-04 loss: 1.104e-01]mindexpander_qwen_v1:  83%|########3 | 2496/3000 [2:48:11<27:33,  3.28s/it, lr: 1.0e-04 loss: 1.104e-01]mindexpander_qwen_v1:  83%|########3 | 2497/3000 [2:48:11<28:37,  3.41s/it, lr: 1.0e-04 loss: 1.104e-01]mindexpander_qwen_v1:  83%|########3 | 2497/3000 [2:48:11<28:37,  3.41s/it, lr: 1.0e-04 loss: 1.104e-01]mindexpander_qwen_v1:  83%|########3 | 2497/3000 [2:48:15<28:37,  3.41s/it, lr: 1.0e-04 loss: 7.707e-02]mindexpander_qwen_v1:  83%|########3 | 2497/3000 [2:48:15<28:37,  3.41s/it, lr: 1.0e-04 loss: 7.707e-02]mindexpander_qwen_v1:  83%|########3 | 2498/3000 [2:48:15<29:48,  3.56s/it, lr: 1.0e-04 loss: 7.707e-02]mindexpander_qwen_v1:  83%|########3 | 2498/3000 [2:48:15<29:48,  3.56s/it, lr: 1.0e-04 loss: 7.707e-02]mindexpander_qwen_v1:  83%|########3 | 2498/3000 [2:48:19<29:48,  3.56s/it, lr: 1.0e-04 loss: 6.178e-02]mindexpander_qwen_v1:  83%|########3 | 2498/3000 [2:48:19<29:48,  3.56s/it, lr: 1.0e-04 loss: 6.178e-02]mindexpander_qwen_v1:  83%|########3 | 2499/3000 [2:48:19<30:12,  3.62s/it, lr: 1.0e-04 loss: 6.178e-02]mindexpander_qwen_v1:  83%|########3 | 2499/3000 [2:48:19<30:12,  3.62s/it, lr: 1.0e-04 loss: 6.178e-02]mindexpander_qwen_v1:  83%|########3 | 2499/3000 [2:48:21<30:12,  3.62s/it, lr: 1.0e-04 loss: 2.348e-02]mindexpander_qwen_v1:  83%|########3 | 2499/3000 [2:48:21<30:12,  3.62s/it, lr: 1.0e-04 loss: 2.348e-02]
+Saving at step 2500
+Saved checkpoint to /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000002500.safetensors
+Saved optimizer to /app/ai-toolkit/output/mindexpander_qwen_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000001500.safetensors
+
+
+Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:   0%|          | 0/2 [00:00<?, ?it/s][A[A
+
+Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.62s/it]Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.62s/it][A[A
+
+Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.62s/it]Generating Images: 100%|##########| 2/2 [02:55<00:00, 87.62s/it][A[A
+
+                                                                                                                                [A[Amindexpander_qwen_v1:  83%|########3 | 2500/3000 [2:48:27<30:08,  3.62s/it, lr: 1.0e-04 loss: 5.150e-02]mindexpander_qwen_v1:  83%|########3 | 2500/3000 [2:48:27<30:08,  3.62s/it, lr: 1.0e-04 loss: 5.150e-02]mindexpander_qwen_v1:  83%|########3 | 2501/3000 [2:48:27<27:35,  3.32s/it, lr: 1.0e-04 loss: 5.150e-02]mindexpander_qwen_v1:  83%|########3 | 2501/3000 [2:48:27<27:35,  3.32s/it, lr: 1.0e-04 loss: 5.150e-02]mindexpander_qwen_v1:  83%|########3 | 2501/3000 [2:48:31<27:35,  3.32s/it, lr: 1.0e-04 loss: 6.844e-03]mindexpander_qwen_v1:  83%|########3 | 2501/3000 [2:48:31<27:35,  3.32s/it, lr: 1.0e-04 loss: 6.844e-03]mindexpander_qwen_v1:  83%|########3 | 2502/3000 [2:48:31<28:20,  3.42s/it, lr: 1.0e-04 loss: 6.844e-03]mindexpander_qwen_v1:  83%|########3 | 2502/3000 [2:48:31<28:20,  3.42s/it, lr: 1.0e-04 loss: 6.844e-03]mindexpander_qwen_v1:  83%|########3 | 2502/3000 [2:48:36<28:20,  3.42s/it, lr: 1.0e-04 loss: 4.982e-03]mindexpander_qwen_v1:  83%|########3 | 2502/3000 [2:48:36<28:20,  3.42s/it, lr: 1.0e-04 loss: 4.982e-03]mindexpander_qwen_v1:  83%|########3 | 2503/3000 [2:48:37<33:12,  4.01s/it, lr: 1.0e-04 loss: 4.982e-03]mindexpander_qwen_v1:  83%|########3 | 2503/3000 [2:48:37<33:12,  4.01s/it, lr: 1.0e-04 loss: 4.982e-03]mindexpander_qwen_v1:  83%|########3 | 2503/3000 [2:48:39<33:12,  4.01s/it, lr: 1.0e-04 loss: 1.714e-01]mindexpander_qwen_v1:  83%|########3 | 2503/3000 [2:48:39<33:12,  4.01s/it, lr: 1.0e-04 loss: 1.714e-01]mindexpander_qwen_v1:  83%|########3 | 2504/3000 [2:48:39<30:02,  3.63s/it, lr: 1.0e-04 loss: 1.714e-01]mindexpander_qwen_v1:  83%|########3 | 2504/3000 [2:48:39<30:02,  3.63s/it, lr: 1.0e-04 loss: 1.714e-01]mindexpander_qwen_v1:  83%|########3 | 2504/3000 [2:48:42<30:02,  3.63s/it, lr: 1.0e-04 loss: 1.180e-02]mindexpander_qwen_v1:  83%|########3 | 2504/3000 [2:48:42<30:02,  3.63s/it, lr: 1.0e-04 loss: 1.180e-02]mindexpander_qwen_v1:  84%|########3 | 2505/3000 [2:48:42<27:12,  3.30s/it, lr: 1.0e-04 loss: 1.180e-02]mindexpander_qwen_v1:  84%|########3 | 2505/3000 [2:48:42<27:12,  3.30s/it, lr: 1.0e-04 loss: 1.180e-02]mindexpander_qwen_v1:  84%|########3 | 2505/3000 [2:48:45<27:12,  3.30s/it, lr: 1.0e-04 loss: 1.499e-01]mindexpander_qwen_v1:  84%|########3 | 2505/3000 [2:48:45<27:12,  3.30s/it, lr: 1.0e-04 loss: 1.499e-01]mindexpander_qwen_v1:  84%|########3 | 2506/3000 [2:48:45<28:06,  3.41s/it, lr: 1.0e-04 loss: 1.499e-01]mindexpander_qwen_v1:  84%|########3 | 2506/3000 [2:48:45<28:06,  3.41s/it, lr: 1.0e-04 loss: 1.499e-01]mindexpander_qwen_v1:  84%|########3 | 2506/3000 [2:48:49<28:06,  3.41s/it, lr: 1.0e-04 loss: 1.744e-01]mindexpander_qwen_v1:  84%|########3 | 2506/3000 [2:48:49<28:06,  3.41s/it, lr: 1.0e-04 loss: 1.744e-01]mindexpander_qwen_v1:  84%|########3 | 2507/3000 [2:48:49<28:45,  3.50s/it, lr: 1.0e-04 loss: 1.744e-01]mindexpander_qwen_v1:  84%|########3 | 2507/3000 [2:48:49<28:45,  3.50s/it, lr: 1.0e-04 loss: 1.744e-01]mindexpander_qwen_v1:  84%|########3 | 2507/3000 [2:48:53<28:45,  3.50s/it, lr: 1.0e-04 loss: 7.553e-02]mindexpander_qwen_v1:  84%|########3 | 2507/3000 [2:48:53<28:45,  3.50s/it, lr: 1.0e-04 loss: 7.553e-02]mindexpander_qwen_v1:  84%|########3 | 2508/3000 [2:48:53<29:37,  3.61s/it, lr: 1.0e-04 loss: 7.553e-02]mindexpander_qwen_v1:  84%|########3 | 2508/3000 [2:48:53<29:37,  3.61s/it, lr: 1.0e-04 loss: 7.553e-02]mindexpander_qwen_v1:  84%|########3 | 2508/3000 [2:48:59<29:37,  3.61s/it, lr: 1.0e-04 loss: 6.014e-02]mindexpander_qwen_v1:  84%|########3 | 2508/3000 [2:48:59<29:37,  3.61s/it, lr: 1.0e-04 loss: 6.014e-02]mindexpander_qwen_v1:  84%|########3 | 2509/3000 [2:48:59<34:36,  4.23s/it, lr: 1.0e-04 loss: 6.014e-02]mindexpander_qwen_v1:  84%|########3 | 2509/3000 [2:48:59<34:36,  4.23s/it, lr: 1.0e-04 loss: 6.014e-02]mindexpander_qwen_v1:  84%|########3 | 2509/3000 [2:49:04<34:36,  4.23s/it, lr: 1.0e-04 loss: 1.386e-01]mindexpander_qwen_v1:  84%|########3 | 2509/3000 [2:49:04<34:36,  4.23s/it, lr: 1.0e-04 loss: 1.386e-01]mindexpander_qwen_v1:  84%|########3 | 2510/3000 [2:49:10<34:32,  4.23s/it, lr: 1.0e-04 loss: 9.966e-03]mindexpander_qwen_v1:  84%|########3 | 2510/3000 [2:49:10<34:32,  4.23s/it, lr: 1.0e-04 loss: 9.966e-03]mindexpander_qwen_v1:  84%|########3 | 2511/3000 [2:49:10<29:20,  3.60s/it, lr: 1.0e-04 loss: 9.966e-03]mindexpander_qwen_v1:  84%|########3 | 2511/3000 [2:49:10<29:20,  3.60s/it, lr: 1.0e-04 loss: 9.966e-03]mindexpander_qwen_v1:  84%|########3 | 2511/3000 [2:49:16<29:20,  3.60s/it, lr: 1.0e-04 loss: 4.879e-02]mindexpander_qwen_v1:  84%|########3 | 2511/3000 [2:49:16<29:20,  3.60s/it, lr: 1.0e-04 loss: 4.879e-02]mindexpander_qwen_v1:  84%|########3 | 2512/3000 [2:49:16<33:44,  4.15s/it, lr: 1.0e-04 loss: 4.879e-02]mindexpander_qwen_v1:  84%|########3 | 2512/3000 [2:49:16<33:44,  4.15s/it, lr: 1.0e-04 loss: 4.879e-02]mindexpander_qwen_v1:  84%|########3 | 2512/3000 [2:49:18<33:44,  4.15s/it, lr: 1.0e-04 loss: 3.127e-02]mindexpander_qwen_v1:  84%|########3 | 2512/3000 [2:49:18<33:44,  4.15s/it, lr: 1.0e-04 loss: 3.127e-02]mindexpander_qwen_v1:  84%|########3 | 2513/3000 [2:49:18<30:03,  3.70s/it, lr: 1.0e-04 loss: 3.127e-02]mindexpander_qwen_v1:  84%|########3 | 2513/3000 [2:49:18<30:03,  3.70s/it, lr: 1.0e-04 loss: 3.127e-02]mindexpander_qwen_v1:  84%|########3 | 2513/3000 [2:49:21<30:03,  3.70s/it, lr: 1.0e-04 loss: 4.187e-02]mindexpander_qwen_v1:  84%|########3 | 2513/3000 [2:49:21<30:03,  3.70s/it, lr: 1.0e-04 loss: 4.187e-02]mindexpander_qwen_v1:  84%|########3 | 2514/3000 [2:49:21<27:12,  3.36s/it, lr: 1.0e-04 loss: 4.187e-02]mindexpander_qwen_v1:  84%|########3 | 2514/3000 [2:49:21<27:12,  3.36s/it, lr: 1.0e-04 loss: 4.187e-02]mindexpander_qwen_v1:  84%|########3 | 2514/3000 [2:49:23<27:12,  3.36s/it, lr: 1.0e-04 loss: 1.286e-02]mindexpander_qwen_v1:  84%|########3 | 2514/3000 [2:49:23<27:12,  3.36s/it, lr: 1.0e-04 loss: 1.286e-02]mindexpander_qwen_v1:  84%|########3 | 2515/3000 [2:49:23<25:03,  3.10s/it, lr: 1.0e-04 loss: 1.286e-02]mindexpander_qwen_v1:  84%|########3 | 2515/3000 [2:49:23<25:03,  3.10s/it, lr: 1.0e-04 loss: 1.286e-02]mindexpander_qwen_v1:  84%|########3 | 2515/3000 [2:49:29<25:03,  3.10s/it, lr: 1.0e-04 loss: 3.637e-02]mindexpander_qwen_v1:  84%|########3 | 2515/3000 [2:49:29<25:03,  3.10s/it, lr: 1.0e-04 loss: 3.637e-02]mindexpander_qwen_v1:  84%|########3 | 2516/3000 [2:49:29<31:18,  3.88s/it, lr: 1.0e-04 loss: 3.637e-02]mindexpander_qwen_v1:  84%|########3 | 2516/3000 [2:49:29<31:18,  3.88s/it, lr: 1.0e-04 loss: 3.637e-02]mindexpander_qwen_v1:  84%|########3 | 2516/3000 [2:49:35<31:18,  3.88s/it, lr: 1.0e-04 loss: 7.087e-02]mindexpander_qwen_v1:  84%|########3 | 2516/3000 [2:49:35<31:18,  3.88s/it, lr: 1.0e-04 loss: 7.087e-02]mindexpander_qwen_v1:  84%|########3 | 2517/3000 [2:49:35<35:31,  4.41s/it, lr: 1.0e-04 loss: 7.087e-02]mindexpander_qwen_v1:  84%|########3 | 2517/3000 [2:49:35<35:31,  4.41s/it, lr: 1.0e-04 loss: 7.087e-02]mindexpander_qwen_v1:  84%|########3 | 2517/3000 [2:49:38<35:31,  4.41s/it, lr: 1.0e-04 loss: 6.569e-02]mindexpander_qwen_v1:  84%|########3 | 2517/3000 [2:49:38<35:31,  4.41s/it, lr: 1.0e-04 loss: 6.569e-02]mindexpander_qwen_v1:  84%|########3 | 2518/3000 [2:49:38<33:48,  4.21s/it, lr: 1.0e-04 loss: 6.569e-02]mindexpander_qwen_v1:  84%|########3 | 2518/3000 [2:49:38<33:48,  4.21s/it, lr: 1.0e-04 loss: 6.569e-02]mindexpander_qwen_v1:  84%|########3 | 2518/3000 [2:49:42<33:48,  4.21s/it, lr: 1.0e-04 loss: 1.461e-02]mindexpander_qwen_v1:  84%|########3 | 2518/3000 [2:49:42<33:48,  4.21s/it, lr: 1.0e-04 loss: 1.461e-02]mindexpander_qwen_v1:  84%|########3 | 2519/3000 [2:49:42<32:33,  4.06s/it, lr: 1.0e-04 loss: 1.461e-02]mindexpander_qwen_v1:  84%|########3 | 2519/3000 [2:49:42<32:33,  4.06s/it, lr: 1.0e-04 loss: 1.461e-02]mindexpander_qwen_v1:  84%|########3 | 2519/3000 [2:49:45<32:33,  4.06s/it, lr: 1.0e-04 loss: 3.621e-03]mindexpander_qwen_v1:  84%|########3 | 2519/3000 [2:49:45<32:33,  4.06s/it, lr: 1.0e-04 loss: 3.621e-03]mindexpander_qwen_v1:  84%|########4 | 2520/3000 [2:49:51<32:29,  4.06s/it, lr: 1.0e-04 loss: 8.158e-02]mindexpander_qwen_v1:  84%|########4 | 2520/3000 [2:49:51<32:29,  4.06s/it, lr: 1.0e-04 loss: 8.158e-02]mindexpander_qwen_v1:  84%|########4 | 2521/3000 [2:49:51<28:01,  3.51s/it, lr: 1.0e-04 loss: 8.158e-02]mindexpander_qwen_v1:  84%|########4 | 2521/3000 [2:49:51<28:01,  3.51s/it, lr: 1.0e-04 loss: 8.158e-02]mindexpander_qwen_v1:  84%|########4 | 2521/3000 [2:49:57<28:01,  3.51s/it, lr: 1.0e-04 loss: 1.312e-02]mindexpander_qwen_v1:  84%|########4 | 2521/3000 [2:49:57<28:01,  3.51s/it, lr: 1.0e-04 loss: 1.312e-02]mindexpander_qwen_v1:  84%|########4 | 2522/3000 [2:49:57<32:16,  4.05s/it, lr: 1.0e-04 loss: 1.312e-02]mindexpander_qwen_v1:  84%|########4 | 2522/3000 [2:49:57<32:16,  4.05s/it, lr: 1.0e-04 loss: 1.312e-02]mindexpander_qwen_v1:  84%|########4 | 2522/3000 [2:50:00<32:16,  4.05s/it, lr: 1.0e-04 loss: 4.960e-02]mindexpander_qwen_v1:  84%|########4 | 2522/3000 [2:50:00<32:16,  4.05s/it, lr: 1.0e-04 loss: 4.960e-02]mindexpander_qwen_v1:  84%|########4 | 2523/3000 [2:50:00<31:32,  3.97s/it, lr: 1.0e-04 loss: 4.960e-02]mindexpander_qwen_v1:  84%|########4 | 2523/3000 [2:50:00<31:32,  3.97s/it, lr: 1.0e-04 loss: 4.960e-02]mindexpander_qwen_v1:  84%|########4 | 2523/3000 [2:50:04<31:32,  3.97s/it, lr: 1.0e-04 loss: 8.347e-02]mindexpander_qwen_v1:  84%|########4 | 2523/3000 [2:50:04<31:32,  3.97s/it, lr: 1.0e-04 loss: 8.347e-02]mindexpander_qwen_v1:  84%|########4 | 2524/3000 [2:50:04<31:17,  3.94s/it, lr: 1.0e-04 loss: 8.347e-02]mindexpander_qwen_v1:  84%|########4 | 2524/3000 [2:50:04<31:17,  3.94s/it, lr: 1.0e-04 loss: 8.347e-02]mindexpander_qwen_v1:  84%|########4 | 2524/3000 [2:50:08<31:17,  3.94s/it, lr: 1.0e-04 loss: 1.797e-02]mindexpander_qwen_v1:  84%|########4 | 2524/3000 [2:50:08<31:17,  3.94s/it, lr: 1.0e-04 loss: 1.797e-02]mindexpander_qwen_v1:  84%|########4 | 2525/3000 [2:50:08<30:42,  3.88s/it, lr: 1.0e-04 loss: 1.797e-02]mindexpander_qwen_v1:  84%|########4 | 2525/3000 [2:50:08<30:42,  3.88s/it, lr: 1.0e-04 loss: 1.797e-02]mindexpander_qwen_v1:  84%|########4 | 2525/3000 [2:50:14<30:42,  3.88s/it, lr: 1.0e-04 loss: 1.115e-01]mindexpander_qwen_v1:  84%|########4 | 2525/3000 [2:50:14<30:42,  3.88s/it, lr: 1.0e-04 loss: 1.115e-01]mindexpander_qwen_v1:  84%|########4 | 2526/3000 [2:50:14<34:45,  4.40s/it, lr: 1.0e-04 loss: 1.115e-01]mindexpander_qwen_v1:  84%|########4 | 2526/3000 [2:50:14<34:45,  4.40s/it, lr: 1.0e-04 loss: 1.115e-01]mindexpander_qwen_v1:  84%|########4 | 2526/3000 [2:50:16<34:45,  4.40s/it, lr: 1.0e-04 loss: 1.240e-01]mindexpander_qwen_v1:  84%|########4 | 2526/3000 [2:50:16<34:45,  4.40s/it, lr: 1.0e-04 loss: 1.240e-01]mindexpander_qwen_v1:  84%|########4 | 2527/3000 [2:50:16<30:11,  3.83s/it, lr: 1.0e-04 loss: 1.240e-01]mindexpander_qwen_v1:  84%|########4 | 2527/3000 [2:50:16<30:11,  3.83s/it, lr: 1.0e-04 loss: 1.240e-01]mindexpander_qwen_v1:  84%|########4 | 2527/3000 [2:50:22<30:11,  3.83s/it, lr: 1.0e-04 loss: 4.353e-02]mindexpander_qwen_v1:  84%|########4 | 2527/3000 [2:50:22<30:11,  3.83s/it, lr: 1.0e-04 loss: 4.353e-02]mindexpander_qwen_v1:  84%|########4 | 2528/3000 [2:50:22<34:46,  4.42s/it, lr: 1.0e-04 loss: 4.353e-02]mindexpander_qwen_v1:  84%|########4 | 2528/3000 [2:50:22<34:46,  4.42s/it, lr: 1.0e-04 loss: 4.353e-02]mindexpander_qwen_v1:  84%|########4 | 2528/3000 [2:50:28<34:46,  4.42s/it, lr: 1.0e-04 loss: 4.730e-02]mindexpander_qwen_v1:  84%|########4 | 2528/3000 [2:50:28<34:46,  4.42s/it, lr: 1.0e-04 loss: 4.730e-02]mindexpander_qwen_v1:  84%|########4 | 2529/3000 [2:50:28<37:39,  4.80s/it, lr: 1.0e-04 loss: 4.730e-02]mindexpander_qwen_v1:  84%|########4 | 2529/3000 [2:50:28<37:39,  4.80s/it, lr: 1.0e-04 loss: 4.730e-02]mindexpander_qwen_v1:  84%|########4 | 2529/3000 [2:50:30<37:39,  4.80s/it, lr: 1.0e-04 loss: 9.850e-02]mindexpander_qwen_v1:  84%|########4 | 2529/3000 [2:50:30<37:39,  4.80s/it, lr: 1.0e-04 loss: 9.850e-02]mindexpander_qwen_v1:  84%|########4 | 2530/3000 [2:50:36<37:35,  4.80s/it, lr: 1.0e-04 loss: 2.079e-03]mindexpander_qwen_v1:  84%|########4 | 2530/3000 [2:50:36<37:35,  4.80s/it, lr: 1.0e-04 loss: 2.079e-03]mindexpander_qwen_v1:  84%|########4 | 2531/3000 [2:50:36<30:33,  3.91s/it, lr: 1.0e-04 loss: 2.079e-03]mindexpander_qwen_v1:  84%|########4 | 2531/3000 [2:50:36<30:33,  3.91s/it, lr: 1.0e-04 loss: 2.079e-03]mindexpander_qwen_v1:  84%|########4 | 2531/3000 [2:50:40<30:33,  3.91s/it, lr: 1.0e-04 loss: 1.244e-01]mindexpander_qwen_v1:  84%|########4 | 2531/3000 [2:50:40<30:33,  3.91s/it, lr: 1.0e-04 loss: 1.244e-01]mindexpander_qwen_v1:  84%|########4 | 2532/3000 [2:50:40<30:26,  3.90s/it, lr: 1.0e-04 loss: 1.244e-01]mindexpander_qwen_v1:  84%|########4 | 2532/3000 [2:50:40<30:26,  3.90s/it, lr: 1.0e-04 loss: 1.244e-01]mindexpander_qwen_v1:  84%|########4 | 2532/3000 [2:50:42<30:26,  3.90s/it, lr: 1.0e-04 loss: 8.534e-02]mindexpander_qwen_v1:  84%|########4 | 2532/3000 [2:50:42<30:26,  3.90s/it, lr: 1.0e-04 loss: 8.534e-02]mindexpander_qwen_v1:  84%|########4 | 2533/3000 [2:50:42<27:24,  3.52s/it, lr: 1.0e-04 loss: 8.534e-02]mindexpander_qwen_v1:  84%|########4 | 2533/3000 [2:50:42<27:24,  3.52s/it, lr: 1.0e-04 loss: 8.534e-02]mindexpander_qwen_v1:  84%|########4 | 2533/3000 [2:50:46<27:24,  3.52s/it, lr: 1.0e-04 loss: 3.608e-02]mindexpander_qwen_v1:  84%|########4 | 2533/3000 [2:50:46<27:24,  3.52s/it, lr: 1.0e-04 loss: 3.608e-02]mindexpander_qwen_v1:  84%|########4 | 2534/3000 [2:50:46<27:45,  3.57s/it, lr: 1.0e-04 loss: 3.608e-02]mindexpander_qwen_v1:  84%|########4 | 2534/3000 [2:50:46<27:45,  3.57s/it, lr: 1.0e-04 loss: 3.608e-02]mindexpander_qwen_v1:  84%|########4 | 2534/3000 [2:50:48<27:45,  3.57s/it, lr: 1.0e-04 loss: 2.019e-02]mindexpander_qwen_v1:  84%|########4 | 2534/3000 [2:50:48<27:45,  3.57s/it, lr: 1.0e-04 loss: 2.019e-02]mindexpander_qwen_v1:  84%|########4 | 2535/3000 [2:50:48<25:14,  3.26s/it, lr: 1.0e-04 loss: 2.019e-02]mindexpander_qwen_v1:  84%|########4 | 2535/3000 [2:50:48<25:14,  3.26s/it, lr: 1.0e-04 loss: 2.019e-02]mindexpander_qwen_v1:  84%|########4 | 2535/3000 [2:50:54<25:14,  3.26s/it, lr: 1.0e-04 loss: 5.347e-02]mindexpander_qwen_v1:  84%|########4 | 2535/3000 [2:50:54<25:14,  3.26s/it, lr: 1.0e-04 loss: 5.347e-02]mindexpander_qwen_v1:  85%|########4 | 2536/3000 [2:50:54<30:52,  3.99s/it, lr: 1.0e-04 loss: 5.347e-02]mindexpander_qwen_v1:  85%|########4 | 2536/3000 [2:50:54<30:52,  3.99s/it, lr: 1.0e-04 loss: 5.347e-02]mindexpander_qwen_v1:  85%|########4 | 2536/3000 [2:50:58<30:52,  3.99s/it, lr: 1.0e-04 loss: 1.555e-03]mindexpander_qwen_v1:  85%|########4 | 2536/3000 [2:50:58<30:52,  3.99s/it, lr: 1.0e-04 loss: 1.555e-03]mindexpander_qwen_v1:  85%|########4 | 2537/3000 [2:50:58<30:11,  3.91s/it, lr: 1.0e-04 loss: 1.555e-03]mindexpander_qwen_v1:  85%|########4 | 2537/3000 [2:50:58<30:11,  3.91s/it, lr: 1.0e-04 loss: 1.555e-03]mindexpander_qwen_v1:  85%|########4 | 2537/3000 [2:51:03<30:11,  3.91s/it, lr: 1.0e-04 loss: 6.301e-02]mindexpander_qwen_v1:  85%|########4 | 2537/3000 [2:51:03<30:11,  3.91s/it, lr: 1.0e-04 loss: 6.301e-02]mindexpander_qwen_v1:  85%|########4 | 2538/3000 [2:51:03<34:10,  4.44s/it, lr: 1.0e-04 loss: 6.301e-02]mindexpander_qwen_v1:  85%|########4 | 2538/3000 [2:51:03<34:10,  4.44s/it, lr: 1.0e-04 loss: 6.301e-02]mindexpander_qwen_v1:  85%|########4 | 2538/3000 [2:51:06<34:10,  4.44s/it, lr: 1.0e-04 loss: 2.868e-02]mindexpander_qwen_v1:  85%|########4 | 2538/3000 [2:51:06<34:10,  4.44s/it, lr: 1.0e-04 loss: 2.868e-02]mindexpander_qwen_v1:  85%|########4 | 2539/3000 [2:51:06<29:33,  3.85s/it, lr: 1.0e-04 loss: 2.868e-02]mindexpander_qwen_v1:  85%|########4 | 2539/3000 [2:51:06<29:33,  3.85s/it, lr: 1.0e-04 loss: 2.868e-02]mindexpander_qwen_v1:  85%|########4 | 2539/3000 [2:51:10<29:33,  3.85s/it, lr: 1.0e-04 loss: 1.963e-02]mindexpander_qwen_v1:  85%|########4 | 2539/3000 [2:51:10<29:33,  3.85s/it, lr: 1.0e-04 loss: 1.963e-02]mindexpander_qwen_v1:  85%|########4 | 2540/3000 [2:51:16<29:29,  3.85s/it, lr: 1.0e-04 loss: 4.682e-02]mindexpander_qwen_v1:  85%|########4 | 2540/3000 [2:51:16<29:29,  3.85s/it, lr: 1.0e-04 loss: 4.682e-02]mindexpander_qwen_v1:  85%|########4 | 2541/3000 [2:51:16<25:57,  3.39s/it, lr: 1.0e-04 loss: 4.682e-02]mindexpander_qwen_v1:  85%|########4 | 2541/3000 [2:51:16<25:57,  3.39s/it, lr: 1.0e-04 loss: 4.682e-02]mindexpander_qwen_v1:  85%|########4 | 2541/3000 [2:51:19<25:57,  3.39s/it, lr: 1.0e-04 loss: 1.697e-01]mindexpander_qwen_v1:  85%|########4 | 2541/3000 [2:51:19<25:57,  3.39s/it, lr: 1.0e-04 loss: 1.697e-01]mindexpander_qwen_v1:  85%|########4 | 2542/3000 [2:51:19<26:30,  3.47s/it, lr: 1.0e-04 loss: 1.697e-01]mindexpander_qwen_v1:  85%|########4 | 2542/3000 [2:51:19<26:30,  3.47s/it, lr: 1.0e-04 loss: 1.697e-01]mindexpander_qwen_v1:  85%|########4 | 2542/3000 [2:51:22<26:30,  3.47s/it, lr: 1.0e-04 loss: 5.339e-02]mindexpander_qwen_v1:  85%|########4 | 2542/3000 [2:51:22<26:30,  3.47s/it, lr: 1.0e-04 loss: 5.339e-02]mindexpander_qwen_v1:  85%|########4 | 2543/3000 [2:51:22<24:23,  3.20s/it, lr: 1.0e-04 loss: 5.339e-02]mindexpander_qwen_v1:  85%|########4 | 2543/3000 [2:51:22<24:23,  3.20s/it, lr: 1.0e-04 loss: 5.339e-02]mindexpander_qwen_v1:  85%|########4 | 2543/3000 [2:51:24<24:23,  3.20s/it, lr: 1.0e-04 loss: 3.006e-02]mindexpander_qwen_v1:  85%|########4 | 2543/3000 [2:51:24<24:23,  3.20s/it, lr: 1.0e-04 loss: 3.006e-02]mindexpander_qwen_v1:  85%|########4 | 2544/3000 [2:51:24<23:08,  3.05s/it, lr: 1.0e-04 loss: 3.006e-02]mindexpander_qwen_v1:  85%|########4 | 2544/3000 [2:51:24<23:08,  3.05s/it, lr: 1.0e-04 loss: 3.006e-02]mindexpander_qwen_v1:  85%|########4 | 2544/3000 [2:51:28<23:08,  3.05s/it, lr: 1.0e-04 loss: 1.835e-01]mindexpander_qwen_v1:  85%|########4 | 2544/3000 [2:51:28<23:08,  3.05s/it, lr: 1.0e-04 loss: 1.835e-01]mindexpander_qwen_v1:  85%|########4 | 2545/3000 [2:51:28<24:30,  3.23s/it, lr: 1.0e-04 loss: 1.835e-01]mindexpander_qwen_v1:  85%|########4 | 2545/3000 [2:51:28<24:30,  3.23s/it, lr: 1.0e-04 loss: 1.835e-01]mindexpander_qwen_v1:  85%|########4 | 2545/3000 [2:51:32<24:30,  3.23s/it, lr: 1.0e-04 loss: 5.346e-02]mindexpander_qwen_v1:  85%|########4 | 2545/3000 [2:51:32<24:30,  3.23s/it, lr: 1.0e-04 loss: 5.346e-02]mindexpander_qwen_v1:  85%|########4 | 2546/3000 [2:51:32<25:30,  3.37s/it, lr: 1.0e-04 loss: 5.346e-02]mindexpander_qwen_v1:  85%|########4 | 2546/3000 [2:51:32<25:30,  3.37s/it, lr: 1.0e-04 loss: 5.346e-02]mindexpander_qwen_v1:  85%|########4 | 2546/3000 [2:51:34<25:30,  3.37s/it, lr: 1.0e-04 loss: 6.933e-02]mindexpander_qwen_v1:  85%|########4 | 2546/3000 [2:51:34<25:30,  3.37s/it, lr: 1.0e-04 loss: 6.933e-02]mindexpander_qwen_v1:  85%|########4 | 2547/3000 [2:51:34<23:23,  3.10s/it, lr: 1.0e-04 loss: 6.933e-02]mindexpander_qwen_v1:  85%|########4 | 2547/3000 [2:51:34<23:23,  3.10s/it, lr: 1.0e-04 loss: 6.933e-02]mindexpander_qwen_v1:  85%|########4 | 2547/3000 [2:51:40<23:23,  3.10s/it, lr: 1.0e-04 loss: 2.448e-02]mindexpander_qwen_v1:  85%|########4 | 2547/3000 [2:51:40<23:23,  3.10s/it, lr: 1.0e-04 loss: 2.448e-02]mindexpander_qwen_v1:  85%|########4 | 2548/3000 [2:51:40<29:22,  3.90s/it, lr: 1.0e-04 loss: 2.448e-02]mindexpander_qwen_v1:  85%|########4 | 2548/3000 [2:51:40<29:22,  3.90s/it, lr: 1.0e-04 loss: 2.448e-02]mindexpander_qwen_v1:  85%|########4 | 2548/3000 [2:51:42<29:22,  3.90s/it, lr: 1.0e-04 loss: 5.259e-02]mindexpander_qwen_v1:  85%|########4 | 2548/3000 [2:51:42<29:22,  3.90s/it, lr: 1.0e-04 loss: 5.259e-02]mindexpander_qwen_v1:  85%|########4 | 2549/3000 [2:51:42<26:03,  3.47s/it, lr: 1.0e-04 loss: 5.259e-02]mindexpander_qwen_v1:  85%|########4 | 2549/3000 [2:51:42<26:03,  3.47s/it, lr: 1.0e-04 loss: 5.259e-02]mindexpander_qwen_v1:  85%|########4 | 2549/3000 [2:51:45<26:03,  3.47s/it, lr: 1.0e-04 loss: 7.675e-02]mindexpander_qwen_v1:  85%|########4 | 2549/3000 [2:51:45<26:03,  3.47s/it, lr: 1.0e-04 loss: 7.675e-02]mindexpander_qwen_v1:  85%|########5 | 2550/3000 [2:51:49<25:59,  3.47s/it, lr: 1.0e-04 loss: 7.425e-02]mindexpander_qwen_v1:  85%|########5 | 2550/3000 [2:51:49<25:59,  3.47s/it, lr: 1.0e-04 loss: 7.425e-02]mindexpander_qwen_v1:  85%|########5 | 2551/3000 [2:51:49<20:25,  2.73s/it, lr: 1.0e-04 loss: 7.425e-02]mindexpander_qwen_v1:  85%|########5 | 2551/3000 [2:51:49<20:25,  2.73s/it, lr: 1.0e-04 loss: 7.425e-02]mindexpander_qwen_v1:  85%|########5 | 2551/3000 [2:51:52<20:25,  2.73s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  85%|########5 | 2551/3000 [2:51:52<20:25,  2.73s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  85%|########5 | 2552/3000 [2:51:52<20:18,  2.72s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  85%|########5 | 2552/3000 [2:51:52<20:18,  2.72s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  85%|########5 | 2552/3000 [2:51:57<20:18,  2.72s/it, lr: 1.0e-04 loss: 9.215e-02]mindexpander_qwen_v1:  85%|########5 | 2552/3000 [2:51:57<20:18,  2.72s/it, lr: 1.0e-04 loss: 9.215e-02]mindexpander_qwen_v1:  85%|########5 | 2553/3000 [2:51:57<26:02,  3.50s/it, lr: 1.0e-04 loss: 9.215e-02]mindexpander_qwen_v1:  85%|########5 | 2553/3000 [2:51:57<26:02,  3.50s/it, lr: 1.0e-04 loss: 9.215e-02]mindexpander_qwen_v1:  85%|########5 | 2553/3000 [2:52:03<26:02,  3.50s/it, lr: 1.0e-04 loss: 6.708e-02]mindexpander_qwen_v1:  85%|########5 | 2553/3000 [2:52:03<26:02,  3.50s/it, lr: 1.0e-04 loss: 6.708e-02]mindexpander_qwen_v1:  85%|########5 | 2554/3000 [2:52:03<30:24,  4.09s/it, lr: 1.0e-04 loss: 6.708e-02]mindexpander_qwen_v1:  85%|########5 | 2554/3000 [2:52:03<30:24,  4.09s/it, lr: 1.0e-04 loss: 6.708e-02]mindexpander_qwen_v1:  85%|########5 | 2554/3000 [2:52:09<30:24,  4.09s/it, lr: 1.0e-04 loss: 1.181e-01]mindexpander_qwen_v1:  85%|########5 | 2554/3000 [2:52:09<30:24,  4.09s/it, lr: 1.0e-04 loss: 1.181e-01]mindexpander_qwen_v1:  85%|########5 | 2555/3000 [2:52:09<33:39,  4.54s/it, lr: 1.0e-04 loss: 1.181e-01]mindexpander_qwen_v1:  85%|########5 | 2555/3000 [2:52:09<33:39,  4.54s/it, lr: 1.0e-04 loss: 1.181e-01]mindexpander_qwen_v1:  85%|########5 | 2555/3000 [2:52:11<33:39,  4.54s/it, lr: 1.0e-04 loss: 1.059e-01]mindexpander_qwen_v1:  85%|########5 | 2555/3000 [2:52:11<33:39,  4.54s/it, lr: 1.0e-04 loss: 1.059e-01]mindexpander_qwen_v1:  85%|########5 | 2556/3000 [2:52:11<29:31,  3.99s/it, lr: 1.0e-04 loss: 1.059e-01]mindexpander_qwen_v1:  85%|########5 | 2556/3000 [2:52:11<29:31,  3.99s/it, lr: 1.0e-04 loss: 1.059e-01]mindexpander_qwen_v1:  85%|########5 | 2556/3000 [2:52:14<29:31,  3.99s/it, lr: 1.0e-04 loss: 5.029e-02]mindexpander_qwen_v1:  85%|########5 | 2556/3000 [2:52:14<29:31,  3.99s/it, lr: 1.0e-04 loss: 5.029e-02]mindexpander_qwen_v1:  85%|########5 | 2557/3000 [2:52:14<26:06,  3.54s/it, lr: 1.0e-04 loss: 5.029e-02]mindexpander_qwen_v1:  85%|########5 | 2557/3000 [2:52:14<26:06,  3.54s/it, lr: 1.0e-04 loss: 5.029e-02]mindexpander_qwen_v1:  85%|########5 | 2557/3000 [2:52:19<26:06,  3.54s/it, lr: 1.0e-04 loss: 2.823e-02]mindexpander_qwen_v1:  85%|########5 | 2557/3000 [2:52:19<26:06,  3.54s/it, lr: 1.0e-04 loss: 2.823e-02]mindexpander_qwen_v1:  85%|########5 | 2558/3000 [2:52:19<30:41,  4.17s/it, lr: 1.0e-04 loss: 2.823e-02]mindexpander_qwen_v1:  85%|########5 | 2558/3000 [2:52:19<30:41,  4.17s/it, lr: 1.0e-04 loss: 2.823e-02]mindexpander_qwen_v1:  85%|########5 | 2558/3000 [2:52:22<30:41,  4.17s/it, lr: 1.0e-04 loss: 1.081e-01]mindexpander_qwen_v1:  85%|########5 | 2558/3000 [2:52:22<30:41,  4.17s/it, lr: 1.0e-04 loss: 1.081e-01]mindexpander_qwen_v1:  85%|########5 | 2559/3000 [2:52:22<26:51,  3.65s/it, lr: 1.0e-04 loss: 1.081e-01]mindexpander_qwen_v1:  85%|########5 | 2559/3000 [2:52:22<26:51,  3.65s/it, lr: 1.0e-04 loss: 1.081e-01]mindexpander_qwen_v1:  85%|########5 | 2559/3000 [2:52:26<26:51,  3.65s/it, lr: 1.0e-04 loss: 4.047e-02]mindexpander_qwen_v1:  85%|########5 | 2559/3000 [2:52:26<26:51,  3.65s/it, lr: 1.0e-04 loss: 4.047e-02]mindexpander_qwen_v1:  85%|########5 | 2560/3000 [2:52:29<26:47,  3.65s/it, lr: 1.0e-04 loss: 5.503e-02]mindexpander_qwen_v1:  85%|########5 | 2560/3000 [2:52:29<26:47,  3.65s/it, lr: 1.0e-04 loss: 5.503e-02]mindexpander_qwen_v1:  85%|########5 | 2561/3000 [2:52:29<20:43,  2.83s/it, lr: 1.0e-04 loss: 5.503e-02]mindexpander_qwen_v1:  85%|########5 | 2561/3000 [2:52:29<20:43,  2.83s/it, lr: 1.0e-04 loss: 5.503e-02]mindexpander_qwen_v1:  85%|########5 | 2561/3000 [2:52:32<20:43,  2.83s/it, lr: 1.0e-04 loss: 2.698e-02]mindexpander_qwen_v1:  85%|########5 | 2561/3000 [2:52:32<20:43,  2.83s/it, lr: 1.0e-04 loss: 2.698e-02]mindexpander_qwen_v1:  85%|########5 | 2562/3000 [2:52:32<19:57,  2.73s/it, lr: 1.0e-04 loss: 2.698e-02]mindexpander_qwen_v1:  85%|########5 | 2562/3000 [2:52:32<19:57,  2.73s/it, lr: 1.0e-04 loss: 2.698e-02]mindexpander_qwen_v1:  85%|########5 | 2562/3000 [2:52:36<19:57,  2.73s/it, lr: 1.0e-04 loss: 2.924e-02]mindexpander_qwen_v1:  85%|########5 | 2562/3000 [2:52:36<19:57,  2.73s/it, lr: 1.0e-04 loss: 2.924e-02]mindexpander_qwen_v1:  85%|########5 | 2563/3000 [2:52:36<21:47,  2.99s/it, lr: 1.0e-04 loss: 2.924e-02]mindexpander_qwen_v1:  85%|########5 | 2563/3000 [2:52:36<21:47,  2.99s/it, lr: 1.0e-04 loss: 2.924e-02]mindexpander_qwen_v1:  85%|########5 | 2563/3000 [2:52:38<21:47,  2.99s/it, lr: 1.0e-04 loss: 1.379e-02]mindexpander_qwen_v1:  85%|########5 | 2563/3000 [2:52:38<21:47,  2.99s/it, lr: 1.0e-04 loss: 1.379e-02]mindexpander_qwen_v1:  85%|########5 | 2564/3000 [2:52:38<20:39,  2.84s/it, lr: 1.0e-04 loss: 1.379e-02]mindexpander_qwen_v1:  85%|########5 | 2564/3000 [2:52:38<20:39,  2.84s/it, lr: 1.0e-04 loss: 1.379e-02]mindexpander_qwen_v1:  85%|########5 | 2564/3000 [2:52:42<20:39,  2.84s/it, lr: 1.0e-04 loss: 7.854e-02]mindexpander_qwen_v1:  85%|########5 | 2564/3000 [2:52:42<20:39,  2.84s/it, lr: 1.0e-04 loss: 7.854e-02]mindexpander_qwen_v1:  86%|########5 | 2565/3000 [2:52:42<22:41,  3.13s/it, lr: 1.0e-04 loss: 7.854e-02]mindexpander_qwen_v1:  86%|########5 | 2565/3000 [2:52:42<22:41,  3.13s/it, lr: 1.0e-04 loss: 7.854e-02]mindexpander_qwen_v1:  86%|########5 | 2565/3000 [2:52:44<22:41,  3.13s/it, lr: 1.0e-04 loss: 8.049e-02]mindexpander_qwen_v1:  86%|########5 | 2565/3000 [2:52:44<22:41,  3.13s/it, lr: 1.0e-04 loss: 8.049e-02]mindexpander_qwen_v1:  86%|########5 | 2566/3000 [2:52:44<21:10,  2.93s/it, lr: 1.0e-04 loss: 8.049e-02]mindexpander_qwen_v1:  86%|########5 | 2566/3000 [2:52:44<21:10,  2.93s/it, lr: 1.0e-04 loss: 8.049e-02]mindexpander_qwen_v1:  86%|########5 | 2566/3000 [2:52:50<21:10,  2.93s/it, lr: 1.0e-04 loss: 2.560e-02]mindexpander_qwen_v1:  86%|########5 | 2566/3000 [2:52:50<21:10,  2.93s/it, lr: 1.0e-04 loss: 2.560e-02]mindexpander_qwen_v1:  86%|########5 | 2567/3000 [2:52:50<26:54,  3.73s/it, lr: 1.0e-04 loss: 2.560e-02]mindexpander_qwen_v1:  86%|########5 | 2567/3000 [2:52:50<26:54,  3.73s/it, lr: 1.0e-04 loss: 2.560e-02]mindexpander_qwen_v1:  86%|########5 | 2567/3000 [2:52:56<26:54,  3.73s/it, lr: 1.0e-04 loss: 1.093e-01]mindexpander_qwen_v1:  86%|########5 | 2567/3000 [2:52:56<26:54,  3.73s/it, lr: 1.0e-04 loss: 1.093e-01]mindexpander_qwen_v1:  86%|########5 | 2568/3000 [2:52:56<30:59,  4.31s/it, lr: 1.0e-04 loss: 1.093e-01]mindexpander_qwen_v1:  86%|########5 | 2568/3000 [2:52:56<30:59,  4.31s/it, lr: 1.0e-04 loss: 1.093e-01]mindexpander_qwen_v1:  86%|########5 | 2568/3000 [2:53:02<30:59,  4.31s/it, lr: 1.0e-04 loss: 9.252e-02]mindexpander_qwen_v1:  86%|########5 | 2568/3000 [2:53:02<30:59,  4.31s/it, lr: 1.0e-04 loss: 9.252e-02]mindexpander_qwen_v1:  86%|########5 | 2569/3000 [2:53:02<34:19,  4.78s/it, lr: 1.0e-04 loss: 9.252e-02]mindexpander_qwen_v1:  86%|########5 | 2569/3000 [2:53:02<34:19,  4.78s/it, lr: 1.0e-04 loss: 9.252e-02]mindexpander_qwen_v1:  86%|########5 | 2569/3000 [2:53:05<34:19,  4.78s/it, lr: 1.0e-04 loss: 1.251e-01]mindexpander_qwen_v1:  86%|########5 | 2569/3000 [2:53:05<34:19,  4.78s/it, lr: 1.0e-04 loss: 1.251e-01]mindexpander_qwen_v1:  86%|########5 | 2570/3000 [2:53:09<34:14,  4.78s/it, lr: 1.0e-04 loss: 7.178e-02]mindexpander_qwen_v1:  86%|########5 | 2570/3000 [2:53:09<34:14,  4.78s/it, lr: 1.0e-04 loss: 7.178e-02]mindexpander_qwen_v1:  86%|########5 | 2571/3000 [2:53:09<24:36,  3.44s/it, lr: 1.0e-04 loss: 7.178e-02]mindexpander_qwen_v1:  86%|########5 | 2571/3000 [2:53:09<24:36,  3.44s/it, lr: 1.0e-04 loss: 7.178e-02]mindexpander_qwen_v1:  86%|########5 | 2571/3000 [2:53:15<24:36,  3.44s/it, lr: 1.0e-04 loss: 1.474e-01]mindexpander_qwen_v1:  86%|########5 | 2571/3000 [2:53:15<24:36,  3.44s/it, lr: 1.0e-04 loss: 1.474e-01]mindexpander_qwen_v1:  86%|########5 | 2572/3000 [2:53:15<28:45,  4.03s/it, lr: 1.0e-04 loss: 1.474e-01]mindexpander_qwen_v1:  86%|########5 | 2572/3000 [2:53:15<28:45,  4.03s/it, lr: 1.0e-04 loss: 1.474e-01]mindexpander_qwen_v1:  86%|########5 | 2572/3000 [2:53:21<28:45,  4.03s/it, lr: 1.0e-04 loss: 7.060e-02]mindexpander_qwen_v1:  86%|########5 | 2572/3000 [2:53:21<28:45,  4.03s/it, lr: 1.0e-04 loss: 7.060e-02]mindexpander_qwen_v1:  86%|########5 | 2573/3000 [2:53:21<31:47,  4.47s/it, lr: 1.0e-04 loss: 7.060e-02]mindexpander_qwen_v1:  86%|########5 | 2573/3000 [2:53:21<31:47,  4.47s/it, lr: 1.0e-04 loss: 7.060e-02]mindexpander_qwen_v1:  86%|########5 | 2573/3000 [2:53:23<31:47,  4.47s/it, lr: 1.0e-04 loss: 3.979e-02]mindexpander_qwen_v1:  86%|########5 | 2573/3000 [2:53:23<31:47,  4.47s/it, lr: 1.0e-04 loss: 3.979e-02]mindexpander_qwen_v1:  86%|########5 | 2574/3000 [2:53:23<27:49,  3.92s/it, lr: 1.0e-04 loss: 3.979e-02]mindexpander_qwen_v1:  86%|########5 | 2574/3000 [2:53:23<27:49,  3.92s/it, lr: 1.0e-04 loss: 3.979e-02]mindexpander_qwen_v1:  86%|########5 | 2574/3000 [2:53:29<27:49,  3.92s/it, lr: 1.0e-04 loss: 1.728e-01]mindexpander_qwen_v1:  86%|########5 | 2574/3000 [2:53:29<27:49,  3.92s/it, lr: 1.0e-04 loss: 1.728e-01]mindexpander_qwen_v1:  86%|########5 | 2575/3000 [2:53:29<31:19,  4.42s/it, lr: 1.0e-04 loss: 1.728e-01]mindexpander_qwen_v1:  86%|########5 | 2575/3000 [2:53:29<31:19,  4.42s/it, lr: 1.0e-04 loss: 1.728e-01]mindexpander_qwen_v1:  86%|########5 | 2575/3000 [2:53:32<31:19,  4.42s/it, lr: 1.0e-04 loss: 1.921e-01]mindexpander_qwen_v1:  86%|########5 | 2575/3000 [2:53:32<31:19,  4.42s/it, lr: 1.0e-04 loss: 1.921e-01]mindexpander_qwen_v1:  86%|########5 | 2576/3000 [2:53:32<29:49,  4.22s/it, lr: 1.0e-04 loss: 1.921e-01]mindexpander_qwen_v1:  86%|########5 | 2576/3000 [2:53:32<29:49,  4.22s/it, lr: 1.0e-04 loss: 1.921e-01]mindexpander_qwen_v1:  86%|########5 | 2576/3000 [2:53:35<29:49,  4.22s/it, lr: 1.0e-04 loss: 1.124e-01]mindexpander_qwen_v1:  86%|########5 | 2576/3000 [2:53:35<29:49,  4.22s/it, lr: 1.0e-04 loss: 1.124e-01]mindexpander_qwen_v1:  86%|########5 | 2577/3000 [2:53:35<26:31,  3.76s/it, lr: 1.0e-04 loss: 1.124e-01]mindexpander_qwen_v1:  86%|########5 | 2577/3000 [2:53:35<26:31,  3.76s/it, lr: 1.0e-04 loss: 1.124e-01]mindexpander_qwen_v1:  86%|########5 | 2577/3000 [2:53:39<26:31,  3.76s/it, lr: 1.0e-04 loss: 6.137e-02]mindexpander_qwen_v1:  86%|########5 | 2577/3000 [2:53:39<26:31,  3.76s/it, lr: 1.0e-04 loss: 6.137e-02]mindexpander_qwen_v1:  86%|########5 | 2578/3000 [2:53:39<26:22,  3.75s/it, lr: 1.0e-04 loss: 6.137e-02]mindexpander_qwen_v1:  86%|########5 | 2578/3000 [2:53:39<26:22,  3.75s/it, lr: 1.0e-04 loss: 6.137e-02]mindexpander_qwen_v1:  86%|########5 | 2578/3000 [2:53:42<26:22,  3.75s/it, lr: 1.0e-04 loss: 3.548e-02]mindexpander_qwen_v1:  86%|########5 | 2578/3000 [2:53:42<26:22,  3.75s/it, lr: 1.0e-04 loss: 3.548e-02]mindexpander_qwen_v1:  86%|########5 | 2579/3000 [2:53:42<26:12,  3.74s/it, lr: 1.0e-04 loss: 3.548e-02]mindexpander_qwen_v1:  86%|########5 | 2579/3000 [2:53:42<26:12,  3.74s/it, lr: 1.0e-04 loss: 3.548e-02]mindexpander_qwen_v1:  86%|########5 | 2579/3000 [2:53:49<26:12,  3.74s/it, lr: 1.0e-04 loss: 1.459e-02]mindexpander_qwen_v1:  86%|########5 | 2579/3000 [2:53:49<26:12,  3.74s/it, lr: 1.0e-04 loss: 1.459e-02]mindexpander_qwen_v1:  86%|########6 | 2580/3000 [2:53:54<26:09,  3.74s/it, lr: 1.0e-04 loss: 5.035e-02]mindexpander_qwen_v1:  86%|########6 | 2580/3000 [2:53:54<26:09,  3.74s/it, lr: 1.0e-04 loss: 5.035e-02]mindexpander_qwen_v1:  86%|########6 | 2581/3000 [2:53:54<23:16,  3.33s/it, lr: 1.0e-04 loss: 5.035e-02]mindexpander_qwen_v1:  86%|########6 | 2581/3000 [2:53:54<23:16,  3.33s/it, lr: 1.0e-04 loss: 5.035e-02]mindexpander_qwen_v1:  86%|########6 | 2581/3000 [2:53:58<23:16,  3.33s/it, lr: 1.0e-04 loss: 1.155e-01]mindexpander_qwen_v1:  86%|########6 | 2581/3000 [2:53:58<23:16,  3.33s/it, lr: 1.0e-04 loss: 1.155e-01]mindexpander_qwen_v1:  86%|########6 | 2582/3000 [2:53:58<23:51,  3.43s/it, lr: 1.0e-04 loss: 1.155e-01]mindexpander_qwen_v1:  86%|########6 | 2582/3000 [2:53:58<23:51,  3.43s/it, lr: 1.0e-04 loss: 1.155e-01]mindexpander_qwen_v1:  86%|########6 | 2582/3000 [2:54:01<23:51,  3.43s/it, lr: 1.0e-04 loss: 1.633e-02]mindexpander_qwen_v1:  86%|########6 | 2582/3000 [2:54:01<23:51,  3.43s/it, lr: 1.0e-04 loss: 1.633e-02]mindexpander_qwen_v1:  86%|########6 | 2583/3000 [2:54:01<22:01,  3.17s/it, lr: 1.0e-04 loss: 1.633e-02]mindexpander_qwen_v1:  86%|########6 | 2583/3000 [2:54:01<22:01,  3.17s/it, lr: 1.0e-04 loss: 1.633e-02]mindexpander_qwen_v1:  86%|########6 | 2583/3000 [2:54:03<22:01,  3.17s/it, lr: 1.0e-04 loss: 2.849e-02]mindexpander_qwen_v1:  86%|########6 | 2583/3000 [2:54:03<22:01,  3.17s/it, lr: 1.0e-04 loss: 2.849e-02]mindexpander_qwen_v1:  86%|########6 | 2584/3000 [2:54:03<20:58,  3.03s/it, lr: 1.0e-04 loss: 2.849e-02]mindexpander_qwen_v1:  86%|########6 | 2584/3000 [2:54:03<20:58,  3.03s/it, lr: 1.0e-04 loss: 2.849e-02]mindexpander_qwen_v1:  86%|########6 | 2584/3000 [2:54:07<20:58,  3.03s/it, lr: 1.0e-04 loss: 1.387e-01]mindexpander_qwen_v1:  86%|########6 | 2584/3000 [2:54:07<20:58,  3.03s/it, lr: 1.0e-04 loss: 1.387e-01]mindexpander_qwen_v1:  86%|########6 | 2585/3000 [2:54:07<22:14,  3.22s/it, lr: 1.0e-04 loss: 1.387e-01]mindexpander_qwen_v1:  86%|########6 | 2585/3000 [2:54:07<22:14,  3.22s/it, lr: 1.0e-04 loss: 1.387e-01]mindexpander_qwen_v1:  86%|########6 | 2585/3000 [2:54:13<22:14,  3.22s/it, lr: 1.0e-04 loss: 5.680e-02]mindexpander_qwen_v1:  86%|########6 | 2585/3000 [2:54:13<22:14,  3.22s/it, lr: 1.0e-04 loss: 5.680e-02]mindexpander_qwen_v1:  86%|########6 | 2586/3000 [2:54:13<27:04,  3.92s/it, lr: 1.0e-04 loss: 5.680e-02]mindexpander_qwen_v1:  86%|########6 | 2586/3000 [2:54:13<27:04,  3.92s/it, lr: 1.0e-04 loss: 5.680e-02]mindexpander_qwen_v1:  86%|########6 | 2586/3000 [2:54:16<27:04,  3.92s/it, lr: 1.0e-04 loss: 7.206e-02]mindexpander_qwen_v1:  86%|########6 | 2586/3000 [2:54:16<27:04,  3.92s/it, lr: 1.0e-04 loss: 7.206e-02]mindexpander_qwen_v1:  86%|########6 | 2587/3000 [2:54:16<26:37,  3.87s/it, lr: 1.0e-04 loss: 7.206e-02]mindexpander_qwen_v1:  86%|########6 | 2587/3000 [2:54:16<26:37,  3.87s/it, lr: 1.0e-04 loss: 7.206e-02]mindexpander_qwen_v1:  86%|########6 | 2587/3000 [2:54:20<26:37,  3.87s/it, lr: 1.0e-04 loss: 4.562e-02]mindexpander_qwen_v1:  86%|########6 | 2587/3000 [2:54:20<26:37,  3.87s/it, lr: 1.0e-04 loss: 4.562e-02]mindexpander_qwen_v1:  86%|########6 | 2588/3000 [2:54:20<26:15,  3.82s/it, lr: 1.0e-04 loss: 4.562e-02]mindexpander_qwen_v1:  86%|########6 | 2588/3000 [2:54:20<26:15,  3.82s/it, lr: 1.0e-04 loss: 4.562e-02]mindexpander_qwen_v1:  86%|########6 | 2588/3000 [2:54:23<26:15,  3.82s/it, lr: 1.0e-04 loss: 1.656e-01]mindexpander_qwen_v1:  86%|########6 | 2588/3000 [2:54:23<26:15,  3.82s/it, lr: 1.0e-04 loss: 1.656e-01]mindexpander_qwen_v1:  86%|########6 | 2589/3000 [2:54:23<23:49,  3.48s/it, lr: 1.0e-04 loss: 1.656e-01]mindexpander_qwen_v1:  86%|########6 | 2589/3000 [2:54:23<23:49,  3.48s/it, lr: 1.0e-04 loss: 1.656e-01]mindexpander_qwen_v1:  86%|########6 | 2589/3000 [2:54:28<23:49,  3.48s/it, lr: 1.0e-04 loss: 1.322e-01]mindexpander_qwen_v1:  86%|########6 | 2589/3000 [2:54:28<23:49,  3.48s/it, lr: 1.0e-04 loss: 1.322e-01]mindexpander_qwen_v1:  86%|########6 | 2590/3000 [2:54:34<23:45,  3.48s/it, lr: 1.0e-04 loss: 4.450e-02]mindexpander_qwen_v1:  86%|########6 | 2590/3000 [2:54:34<23:45,  3.48s/it, lr: 1.0e-04 loss: 4.450e-02]mindexpander_qwen_v1:  86%|########6 | 2591/3000 [2:54:34<21:47,  3.20s/it, lr: 1.0e-04 loss: 4.450e-02]mindexpander_qwen_v1:  86%|########6 | 2591/3000 [2:54:34<21:47,  3.20s/it, lr: 1.0e-04 loss: 4.450e-02]mindexpander_qwen_v1:  86%|########6 | 2591/3000 [2:54:37<21:47,  3.20s/it, lr: 1.0e-04 loss: 1.949e-02]mindexpander_qwen_v1:  86%|########6 | 2591/3000 [2:54:37<21:47,  3.20s/it, lr: 1.0e-04 loss: 1.949e-02]mindexpander_qwen_v1:  86%|########6 | 2592/3000 [2:54:37<20:50,  3.07s/it, lr: 1.0e-04 loss: 1.949e-02]mindexpander_qwen_v1:  86%|########6 | 2592/3000 [2:54:37<20:50,  3.07s/it, lr: 1.0e-04 loss: 1.949e-02]mindexpander_qwen_v1:  86%|########6 | 2592/3000 [2:54:39<20:50,  3.07s/it, lr: 1.0e-04 loss: 6.658e-02]mindexpander_qwen_v1:  86%|########6 | 2592/3000 [2:54:39<20:50,  3.07s/it, lr: 1.0e-04 loss: 6.658e-02]mindexpander_qwen_v1:  86%|########6 | 2593/3000 [2:54:39<19:43,  2.91s/it, lr: 1.0e-04 loss: 6.658e-02]mindexpander_qwen_v1:  86%|########6 | 2593/3000 [2:54:39<19:43,  2.91s/it, lr: 1.0e-04 loss: 6.658e-02]mindexpander_qwen_v1:  86%|########6 | 2593/3000 [2:54:43<19:43,  2.91s/it, lr: 1.0e-04 loss: 5.598e-02]mindexpander_qwen_v1:  86%|########6 | 2593/3000 [2:54:43<19:43,  2.91s/it, lr: 1.0e-04 loss: 5.598e-02]mindexpander_qwen_v1:  86%|########6 | 2594/3000 [2:54:43<21:12,  3.14s/it, lr: 1.0e-04 loss: 5.598e-02]mindexpander_qwen_v1:  86%|########6 | 2594/3000 [2:54:43<21:12,  3.14s/it, lr: 1.0e-04 loss: 5.598e-02]mindexpander_qwen_v1:  86%|########6 | 2594/3000 [2:54:49<21:12,  3.14s/it, lr: 1.0e-04 loss: 1.253e-01]mindexpander_qwen_v1:  86%|########6 | 2594/3000 [2:54:49<21:12,  3.14s/it, lr: 1.0e-04 loss: 1.253e-01]mindexpander_qwen_v1:  86%|########6 | 2595/3000 [2:54:49<26:00,  3.85s/it, lr: 1.0e-04 loss: 1.253e-01]mindexpander_qwen_v1:  86%|########6 | 2595/3000 [2:54:49<26:00,  3.85s/it, lr: 1.0e-04 loss: 1.253e-01]mindexpander_qwen_v1:  86%|########6 | 2595/3000 [2:54:51<26:00,  3.85s/it, lr: 1.0e-04 loss: 9.842e-02]mindexpander_qwen_v1:  86%|########6 | 2595/3000 [2:54:51<26:00,  3.85s/it, lr: 1.0e-04 loss: 9.842e-02]mindexpander_qwen_v1:  87%|########6 | 2596/3000 [2:54:51<23:38,  3.51s/it, lr: 1.0e-04 loss: 9.842e-02]mindexpander_qwen_v1:  87%|########6 | 2596/3000 [2:54:51<23:38,  3.51s/it, lr: 1.0e-04 loss: 9.842e-02]mindexpander_qwen_v1:  87%|########6 | 2596/3000 [2:54:54<23:38,  3.51s/it, lr: 1.0e-04 loss: 3.542e-02]mindexpander_qwen_v1:  87%|########6 | 2596/3000 [2:54:54<23:38,  3.51s/it, lr: 1.0e-04 loss: 3.542e-02]mindexpander_qwen_v1:  87%|########6 | 2597/3000 [2:54:54<21:29,  3.20s/it, lr: 1.0e-04 loss: 3.542e-02]mindexpander_qwen_v1:  87%|########6 | 2597/3000 [2:54:54<21:29,  3.20s/it, lr: 1.0e-04 loss: 3.542e-02]mindexpander_qwen_v1:  87%|########6 | 2597/3000 [2:55:00<21:29,  3.20s/it, lr: 1.0e-04 loss: 1.695e-02]mindexpander_qwen_v1:  87%|########6 | 2597/3000 [2:55:00<21:29,  3.20s/it, lr: 1.0e-04 loss: 1.695e-02]mindexpander_qwen_v1:  87%|########6 | 2598/3000 [2:55:00<26:23,  3.94s/it, lr: 1.0e-04 loss: 1.695e-02]mindexpander_qwen_v1:  87%|########6 | 2598/3000 [2:55:00<26:23,  3.94s/it, lr: 1.0e-04 loss: 1.695e-02]mindexpander_qwen_v1:  87%|########6 | 2598/3000 [2:55:03<26:23,  3.94s/it, lr: 1.0e-04 loss: 1.693e-02]mindexpander_qwen_v1:  87%|########6 | 2598/3000 [2:55:03<26:23,  3.94s/it, lr: 1.0e-04 loss: 1.693e-02]mindexpander_qwen_v1:  87%|########6 | 2599/3000 [2:55:03<25:54,  3.88s/it, lr: 1.0e-04 loss: 1.693e-02]mindexpander_qwen_v1:  87%|########6 | 2599/3000 [2:55:03<25:54,  3.88s/it, lr: 1.0e-04 loss: 1.693e-02]mindexpander_qwen_v1:  87%|########6 | 2599/3000 [2:55:07<25:54,  3.88s/it, lr: 1.0e-04 loss: 1.922e-01]mindexpander_qwen_v1:  87%|########6 | 2599/3000 [2:55:07<25:54,  3.88s/it, lr: 1.0e-04 loss: 1.922e-01]mindexpander_qwen_v1:  87%|########6 | 2600/3000 [2:55:10<25:50,  3.88s/it, lr: 1.0e-04 loss: 1.048e-01]mindexpander_qwen_v1:  87%|########6 | 2600/3000 [2:55:10<25:50,  3.88s/it, lr: 1.0e-04 loss: 1.048e-01]mindexpander_qwen_v1:  87%|########6 | 2601/3000 [2:55:10<18:04,  2.72s/it, lr: 1.0e-04 loss: 1.048e-01]mindexpander_qwen_v1:  87%|########6 | 2601/3000 [2:55:10<18:04,  2.72s/it, lr: 1.0e-04 loss: 1.048e-01]mindexpander_qwen_v1:  87%|########6 | 2601/3000 [2:55:13<18:04,  2.72s/it, lr: 1.0e-04 loss: 1.413e-02]mindexpander_qwen_v1:  87%|########6 | 2601/3000 [2:55:13<18:04,  2.72s/it, lr: 1.0e-04 loss: 1.413e-02]mindexpander_qwen_v1:  87%|########6 | 2602/3000 [2:55:13<19:39,  2.96s/it, lr: 1.0e-04 loss: 1.413e-02]mindexpander_qwen_v1:  87%|########6 | 2602/3000 [2:55:13<19:39,  2.96s/it, lr: 1.0e-04 loss: 1.413e-02]mindexpander_qwen_v1:  87%|########6 | 2602/3000 [2:55:19<19:39,  2.96s/it, lr: 1.0e-04 loss: 8.618e-02]mindexpander_qwen_v1:  87%|########6 | 2602/3000 [2:55:19<19:39,  2.96s/it, lr: 1.0e-04 loss: 8.618e-02]mindexpander_qwen_v1:  87%|########6 | 2603/3000 [2:55:19<24:20,  3.68s/it, lr: 1.0e-04 loss: 8.618e-02]mindexpander_qwen_v1:  87%|########6 | 2603/3000 [2:55:19<24:20,  3.68s/it, lr: 1.0e-04 loss: 8.618e-02]mindexpander_qwen_v1:  87%|########6 | 2603/3000 [2:55:22<24:20,  3.68s/it, lr: 1.0e-04 loss: 1.339e-01]mindexpander_qwen_v1:  87%|########6 | 2603/3000 [2:55:22<24:20,  3.68s/it, lr: 1.0e-04 loss: 1.339e-01]mindexpander_qwen_v1:  87%|########6 | 2604/3000 [2:55:22<22:25,  3.40s/it, lr: 1.0e-04 loss: 1.339e-01]mindexpander_qwen_v1:  87%|########6 | 2604/3000 [2:55:22<22:25,  3.40s/it, lr: 1.0e-04 loss: 1.339e-01]mindexpander_qwen_v1:  87%|########6 | 2604/3000 [2:55:25<22:25,  3.40s/it, lr: 1.0e-04 loss: 1.725e-01]mindexpander_qwen_v1:  87%|########6 | 2604/3000 [2:55:25<22:25,  3.40s/it, lr: 1.0e-04 loss: 1.725e-01]mindexpander_qwen_v1:  87%|########6 | 2605/3000 [2:55:25<22:56,  3.49s/it, lr: 1.0e-04 loss: 1.725e-01]mindexpander_qwen_v1:  87%|########6 | 2605/3000 [2:55:25<22:56,  3.49s/it, lr: 1.0e-04 loss: 1.725e-01]mindexpander_qwen_v1:  87%|########6 | 2605/3000 [2:55:31<22:56,  3.49s/it, lr: 1.0e-04 loss: 1.604e-02]mindexpander_qwen_v1:  87%|########6 | 2605/3000 [2:55:31<22:56,  3.49s/it, lr: 1.0e-04 loss: 1.604e-02]mindexpander_qwen_v1:  87%|########6 | 2606/3000 [2:55:31<27:04,  4.12s/it, lr: 1.0e-04 loss: 1.604e-02]mindexpander_qwen_v1:  87%|########6 | 2606/3000 [2:55:31<27:04,  4.12s/it, lr: 1.0e-04 loss: 1.604e-02]mindexpander_qwen_v1:  87%|########6 | 2606/3000 [2:55:37<27:04,  4.12s/it, lr: 1.0e-04 loss: 1.658e-01]mindexpander_qwen_v1:  87%|########6 | 2606/3000 [2:55:37<27:04,  4.12s/it, lr: 1.0e-04 loss: 1.658e-01]mindexpander_qwen_v1:  87%|########6 | 2607/3000 [2:55:37<30:00,  4.58s/it, lr: 1.0e-04 loss: 1.658e-01]mindexpander_qwen_v1:  87%|########6 | 2607/3000 [2:55:37<30:00,  4.58s/it, lr: 1.0e-04 loss: 1.658e-01]mindexpander_qwen_v1:  87%|########6 | 2607/3000 [2:55:40<30:00,  4.58s/it, lr: 1.0e-04 loss: 5.238e-02]mindexpander_qwen_v1:  87%|########6 | 2607/3000 [2:55:40<30:00,  4.58s/it, lr: 1.0e-04 loss: 5.238e-02]mindexpander_qwen_v1:  87%|########6 | 2608/3000 [2:55:40<26:11,  4.01s/it, lr: 1.0e-04 loss: 5.238e-02]mindexpander_qwen_v1:  87%|########6 | 2608/3000 [2:55:40<26:11,  4.01s/it, lr: 1.0e-04 loss: 5.238e-02]mindexpander_qwen_v1:  87%|########6 | 2608/3000 [2:55:43<26:11,  4.01s/it, lr: 1.0e-04 loss: 6.924e-02]mindexpander_qwen_v1:  87%|########6 | 2608/3000 [2:55:43<26:11,  4.01s/it, lr: 1.0e-04 loss: 6.924e-02]mindexpander_qwen_v1:  87%|########6 | 2609/3000 [2:55:43<25:33,  3.92s/it, lr: 1.0e-04 loss: 6.924e-02]mindexpander_qwen_v1:  87%|########6 | 2609/3000 [2:55:43<25:33,  3.92s/it, lr: 1.0e-04 loss: 6.924e-02]mindexpander_qwen_v1:  87%|########6 | 2609/3000 [2:55:46<25:33,  3.92s/it, lr: 1.0e-04 loss: 4.069e-02]mindexpander_qwen_v1:  87%|########6 | 2609/3000 [2:55:46<25:33,  3.92s/it, lr: 1.0e-04 loss: 4.069e-02]mindexpander_qwen_v1:  87%|########7 | 2610/3000 [2:55:50<25:29,  3.92s/it, lr: 1.0e-04 loss: 1.774e-02]mindexpander_qwen_v1:  87%|########7 | 2610/3000 [2:55:50<25:29,  3.92s/it, lr: 1.0e-04 loss: 1.774e-02]mindexpander_qwen_v1:  87%|########7 | 2611/3000 [2:55:50<19:18,  2.98s/it, lr: 1.0e-04 loss: 1.774e-02]mindexpander_qwen_v1:  87%|########7 | 2611/3000 [2:55:50<19:18,  2.98s/it, lr: 1.0e-04 loss: 1.774e-02]mindexpander_qwen_v1:  87%|########7 | 2611/3000 [2:55:56<19:18,  2.98s/it, lr: 1.0e-04 loss: 9.825e-02]mindexpander_qwen_v1:  87%|########7 | 2611/3000 [2:55:56<19:18,  2.98s/it, lr: 1.0e-04 loss: 9.825e-02]mindexpander_qwen_v1:  87%|########7 | 2612/3000 [2:55:56<23:56,  3.70s/it, lr: 1.0e-04 loss: 9.825e-02]mindexpander_qwen_v1:  87%|########7 | 2612/3000 [2:55:56<23:56,  3.70s/it, lr: 1.0e-04 loss: 9.825e-02]mindexpander_qwen_v1:  87%|########7 | 2612/3000 [2:55:59<23:56,  3.70s/it, lr: 1.0e-04 loss: 1.020e-01]mindexpander_qwen_v1:  87%|########7 | 2612/3000 [2:55:59<23:56,  3.70s/it, lr: 1.0e-04 loss: 1.020e-01]mindexpander_qwen_v1:  87%|########7 | 2613/3000 [2:55:59<23:53,  3.70s/it, lr: 1.0e-04 loss: 1.020e-01]mindexpander_qwen_v1:  87%|########7 | 2613/3000 [2:55:59<23:53,  3.70s/it, lr: 1.0e-04 loss: 1.020e-01]mindexpander_qwen_v1:  87%|########7 | 2613/3000 [2:56:05<23:53,  3.70s/it, lr: 1.0e-04 loss: 9.998e-02]mindexpander_qwen_v1:  87%|########7 | 2613/3000 [2:56:05<23:53,  3.70s/it, lr: 1.0e-04 loss: 9.998e-02]mindexpander_qwen_v1:  87%|########7 | 2614/3000 [2:56:05<27:18,  4.25s/it, lr: 1.0e-04 loss: 9.998e-02]mindexpander_qwen_v1:  87%|########7 | 2614/3000 [2:56:05<27:18,  4.25s/it, lr: 1.0e-04 loss: 9.998e-02]mindexpander_qwen_v1:  87%|########7 | 2614/3000 [2:56:09<27:18,  4.25s/it, lr: 1.0e-04 loss: 7.709e-02]mindexpander_qwen_v1:  87%|########7 | 2614/3000 [2:56:09<27:18,  4.25s/it, lr: 1.0e-04 loss: 7.709e-02]mindexpander_qwen_v1:  87%|########7 | 2615/3000 [2:56:09<26:17,  4.10s/it, lr: 1.0e-04 loss: 7.709e-02]mindexpander_qwen_v1:  87%|########7 | 2615/3000 [2:56:09<26:17,  4.10s/it, lr: 1.0e-04 loss: 7.709e-02]mindexpander_qwen_v1:  87%|########7 | 2615/3000 [2:56:15<26:17,  4.10s/it, lr: 1.0e-04 loss: 3.987e-02]mindexpander_qwen_v1:  87%|########7 | 2615/3000 [2:56:15<26:17,  4.10s/it, lr: 1.0e-04 loss: 3.987e-02]mindexpander_qwen_v1:  87%|########7 | 2616/3000 [2:56:15<29:23,  4.59s/it, lr: 1.0e-04 loss: 3.987e-02]mindexpander_qwen_v1:  87%|########7 | 2616/3000 [2:56:15<29:23,  4.59s/it, lr: 1.0e-04 loss: 3.987e-02]mindexpander_qwen_v1:  87%|########7 | 2616/3000 [2:56:18<29:23,  4.59s/it, lr: 1.0e-04 loss: 1.287e-01]mindexpander_qwen_v1:  87%|########7 | 2616/3000 [2:56:18<29:23,  4.59s/it, lr: 1.0e-04 loss: 1.287e-01]mindexpander_qwen_v1:  87%|########7 | 2617/3000 [2:56:18<27:41,  4.34s/it, lr: 1.0e-04 loss: 1.287e-01]mindexpander_qwen_v1:  87%|########7 | 2617/3000 [2:56:18<27:41,  4.34s/it, lr: 1.0e-04 loss: 1.287e-01]mindexpander_qwen_v1:  87%|########7 | 2617/3000 [2:56:24<27:41,  4.34s/it, lr: 1.0e-04 loss: 1.630e-01]mindexpander_qwen_v1:  87%|########7 | 2617/3000 [2:56:24<27:41,  4.34s/it, lr: 1.0e-04 loss: 1.630e-01]mindexpander_qwen_v1:  87%|########7 | 2618/3000 [2:56:24<30:10,  4.74s/it, lr: 1.0e-04 loss: 1.630e-01]mindexpander_qwen_v1:  87%|########7 | 2618/3000 [2:56:24<30:10,  4.74s/it, lr: 1.0e-04 loss: 1.630e-01]mindexpander_qwen_v1:  87%|########7 | 2618/3000 [2:56:26<30:10,  4.74s/it, lr: 1.0e-04 loss: 2.947e-02]mindexpander_qwen_v1:  87%|########7 | 2618/3000 [2:56:26<30:10,  4.74s/it, lr: 1.0e-04 loss: 2.947e-02]mindexpander_qwen_v1:  87%|########7 | 2619/3000 [2:56:26<25:47,  4.06s/it, lr: 1.0e-04 loss: 2.947e-02]mindexpander_qwen_v1:  87%|########7 | 2619/3000 [2:56:26<25:47,  4.06s/it, lr: 1.0e-04 loss: 2.947e-02]mindexpander_qwen_v1:  87%|########7 | 2619/3000 [2:56:30<25:47,  4.06s/it, lr: 1.0e-04 loss: 1.178e-01]mindexpander_qwen_v1:  87%|########7 | 2619/3000 [2:56:30<25:47,  4.06s/it, lr: 1.0e-04 loss: 1.178e-01]mindexpander_qwen_v1:  87%|########7 | 2620/3000 [2:56:33<25:43,  4.06s/it, lr: 1.0e-04 loss: 7.266e-02]mindexpander_qwen_v1:  87%|########7 | 2620/3000 [2:56:33<25:43,  4.06s/it, lr: 1.0e-04 loss: 7.266e-02]mindexpander_qwen_v1:  87%|########7 | 2621/3000 [2:56:33<17:26,  2.76s/it, lr: 1.0e-04 loss: 7.266e-02]mindexpander_qwen_v1:  87%|########7 | 2621/3000 [2:56:33<17:26,  2.76s/it, lr: 1.0e-04 loss: 7.266e-02]mindexpander_qwen_v1:  87%|########7 | 2621/3000 [2:56:35<17:26,  2.76s/it, lr: 1.0e-04 loss: 1.765e-01]mindexpander_qwen_v1:  87%|########7 | 2621/3000 [2:56:35<17:26,  2.76s/it, lr: 1.0e-04 loss: 1.765e-01]mindexpander_qwen_v1:  87%|########7 | 2622/3000 [2:56:35<16:52,  2.68s/it, lr: 1.0e-04 loss: 1.765e-01]mindexpander_qwen_v1:  87%|########7 | 2622/3000 [2:56:35<16:52,  2.68s/it, lr: 1.0e-04 loss: 1.765e-01]mindexpander_qwen_v1:  87%|########7 | 2622/3000 [2:56:38<16:52,  2.68s/it, lr: 1.0e-04 loss: 6.189e-02]mindexpander_qwen_v1:  87%|########7 | 2622/3000 [2:56:38<16:52,  2.68s/it, lr: 1.0e-04 loss: 6.189e-02]mindexpander_qwen_v1:  87%|########7 | 2623/3000 [2:56:38<16:26,  2.62s/it, lr: 1.0e-04 loss: 6.189e-02]mindexpander_qwen_v1:  87%|########7 | 2623/3000 [2:56:38<16:26,  2.62s/it, lr: 1.0e-04 loss: 6.189e-02]mindexpander_qwen_v1:  87%|########7 | 2623/3000 [2:56:42<16:26,  2.62s/it, lr: 1.0e-04 loss: 6.376e-02]mindexpander_qwen_v1:  87%|########7 | 2623/3000 [2:56:42<16:26,  2.62s/it, lr: 1.0e-04 loss: 6.376e-02]mindexpander_qwen_v1:  87%|########7 | 2624/3000 [2:56:42<18:35,  2.97s/it, lr: 1.0e-04 loss: 6.376e-02]mindexpander_qwen_v1:  87%|########7 | 2624/3000 [2:56:42<18:35,  2.97s/it, lr: 1.0e-04 loss: 6.376e-02]mindexpander_qwen_v1:  87%|########7 | 2624/3000 [2:56:44<18:35,  2.97s/it, lr: 1.0e-04 loss: 7.663e-02]mindexpander_qwen_v1:  87%|########7 | 2624/3000 [2:56:44<18:35,  2.97s/it, lr: 1.0e-04 loss: 7.663e-02]mindexpander_qwen_v1:  88%|########7 | 2625/3000 [2:56:44<17:36,  2.82s/it, lr: 1.0e-04 loss: 7.663e-02]mindexpander_qwen_v1:  88%|########7 | 2625/3000 [2:56:44<17:36,  2.82s/it, lr: 1.0e-04 loss: 7.663e-02]mindexpander_qwen_v1:  88%|########7 | 2625/3000 [2:56:50<17:36,  2.82s/it, lr: 1.0e-04 loss: 1.102e-01]mindexpander_qwen_v1:  88%|########7 | 2625/3000 [2:56:50<17:36,  2.82s/it, lr: 1.0e-04 loss: 1.102e-01]mindexpander_qwen_v1:  88%|########7 | 2626/3000 [2:56:50<22:40,  3.64s/it, lr: 1.0e-04 loss: 1.102e-01]mindexpander_qwen_v1:  88%|########7 | 2626/3000 [2:56:50<22:40,  3.64s/it, lr: 1.0e-04 loss: 1.102e-01]mindexpander_qwen_v1:  88%|########7 | 2626/3000 [2:56:52<22:40,  3.64s/it, lr: 1.0e-04 loss: 1.782e-01]mindexpander_qwen_v1:  88%|########7 | 2626/3000 [2:56:52<22:40,  3.64s/it, lr: 1.0e-04 loss: 1.782e-01]mindexpander_qwen_v1:  88%|########7 | 2627/3000 [2:56:52<20:26,  3.29s/it, lr: 1.0e-04 loss: 1.782e-01]mindexpander_qwen_v1:  88%|########7 | 2627/3000 [2:56:52<20:26,  3.29s/it, lr: 1.0e-04 loss: 1.782e-01]mindexpander_qwen_v1:  88%|########7 | 2627/3000 [2:56:55<20:26,  3.29s/it, lr: 1.0e-04 loss: 1.836e-02]mindexpander_qwen_v1:  88%|########7 | 2627/3000 [2:56:55<20:26,  3.29s/it, lr: 1.0e-04 loss: 1.836e-02]mindexpander_qwen_v1:  88%|########7 | 2628/3000 [2:56:55<19:13,  3.10s/it, lr: 1.0e-04 loss: 1.836e-02]mindexpander_qwen_v1:  88%|########7 | 2628/3000 [2:56:55<19:13,  3.10s/it, lr: 1.0e-04 loss: 1.836e-02]mindexpander_qwen_v1:  88%|########7 | 2628/3000 [2:56:57<19:13,  3.10s/it, lr: 1.0e-04 loss: 6.114e-02]mindexpander_qwen_v1:  88%|########7 | 2628/3000 [2:56:57<19:13,  3.10s/it, lr: 1.0e-04 loss: 6.114e-02]mindexpander_qwen_v1:  88%|########7 | 2629/3000 [2:56:57<17:58,  2.91s/it, lr: 1.0e-04 loss: 6.114e-02]mindexpander_qwen_v1:  88%|########7 | 2629/3000 [2:56:57<17:58,  2.91s/it, lr: 1.0e-04 loss: 6.114e-02]mindexpander_qwen_v1:  88%|########7 | 2629/3000 [2:57:03<17:58,  2.91s/it, lr: 1.0e-04 loss: 3.404e-02]mindexpander_qwen_v1:  88%|########7 | 2629/3000 [2:57:03<17:58,  2.91s/it, lr: 1.0e-04 loss: 3.404e-02]mindexpander_qwen_v1:  88%|########7 | 2630/3000 [2:57:09<17:55,  2.91s/it, lr: 1.0e-04 loss: 1.361e-01]mindexpander_qwen_v1:  88%|########7 | 2630/3000 [2:57:09<17:55,  2.91s/it, lr: 1.0e-04 loss: 1.361e-01]mindexpander_qwen_v1:  88%|########7 | 2631/3000 [2:57:09<17:43,  2.88s/it, lr: 1.0e-04 loss: 1.361e-01]mindexpander_qwen_v1:  88%|########7 | 2631/3000 [2:57:09<17:43,  2.88s/it, lr: 1.0e-04 loss: 1.361e-01]mindexpander_qwen_v1:  88%|########7 | 2631/3000 [2:57:14<17:43,  2.88s/it, lr: 1.0e-04 loss: 4.203e-02]mindexpander_qwen_v1:  88%|########7 | 2631/3000 [2:57:14<17:43,  2.88s/it, lr: 1.0e-04 loss: 4.203e-02]mindexpander_qwen_v1:  88%|########7 | 2632/3000 [2:57:14<22:09,  3.61s/it, lr: 1.0e-04 loss: 4.203e-02]mindexpander_qwen_v1:  88%|########7 | 2632/3000 [2:57:14<22:09,  3.61s/it, lr: 1.0e-04 loss: 4.203e-02]mindexpander_qwen_v1:  88%|########7 | 2632/3000 [2:57:18<22:09,  3.61s/it, lr: 1.0e-04 loss: 1.518e-01]mindexpander_qwen_v1:  88%|########7 | 2632/3000 [2:57:18<22:09,  3.61s/it, lr: 1.0e-04 loss: 1.518e-01]mindexpander_qwen_v1:  88%|########7 | 2633/3000 [2:57:18<22:16,  3.64s/it, lr: 1.0e-04 loss: 1.518e-01]mindexpander_qwen_v1:  88%|########7 | 2633/3000 [2:57:18<22:16,  3.64s/it, lr: 1.0e-04 loss: 1.518e-01]mindexpander_qwen_v1:  88%|########7 | 2633/3000 [2:57:21<22:16,  3.64s/it, lr: 1.0e-04 loss: 1.909e-02]mindexpander_qwen_v1:  88%|########7 | 2633/3000 [2:57:21<22:16,  3.64s/it, lr: 1.0e-04 loss: 1.909e-02]mindexpander_qwen_v1:  88%|########7 | 2634/3000 [2:57:21<20:12,  3.31s/it, lr: 1.0e-04 loss: 1.909e-02]mindexpander_qwen_v1:  88%|########7 | 2634/3000 [2:57:21<20:12,  3.31s/it, lr: 1.0e-04 loss: 1.909e-02]mindexpander_qwen_v1:  88%|########7 | 2634/3000 [2:57:24<20:12,  3.31s/it, lr: 1.0e-04 loss: 8.889e-03]mindexpander_qwen_v1:  88%|########7 | 2634/3000 [2:57:24<20:12,  3.31s/it, lr: 1.0e-04 loss: 8.889e-03]mindexpander_qwen_v1:  88%|########7 | 2635/3000 [2:57:24<20:50,  3.43s/it, lr: 1.0e-04 loss: 8.889e-03]mindexpander_qwen_v1:  88%|########7 | 2635/3000 [2:57:24<20:50,  3.43s/it, lr: 1.0e-04 loss: 8.889e-03]mindexpander_qwen_v1:  88%|########7 | 2635/3000 [2:57:30<20:50,  3.43s/it, lr: 1.0e-04 loss: 1.761e-02]mindexpander_qwen_v1:  88%|########7 | 2635/3000 [2:57:30<20:50,  3.43s/it, lr: 1.0e-04 loss: 1.761e-02]mindexpander_qwen_v1:  88%|########7 | 2636/3000 [2:57:30<25:00,  4.12s/it, lr: 1.0e-04 loss: 1.761e-02]mindexpander_qwen_v1:  88%|########7 | 2636/3000 [2:57:30<25:00,  4.12s/it, lr: 1.0e-04 loss: 1.761e-02]mindexpander_qwen_v1:  88%|########7 | 2636/3000 [2:57:34<25:00,  4.12s/it, lr: 1.0e-04 loss: 9.009e-02]mindexpander_qwen_v1:  88%|########7 | 2636/3000 [2:57:34<25:00,  4.12s/it, lr: 1.0e-04 loss: 9.009e-02]mindexpander_qwen_v1:  88%|########7 | 2637/3000 [2:57:34<24:13,  4.00s/it, lr: 1.0e-04 loss: 9.009e-02]mindexpander_qwen_v1:  88%|########7 | 2637/3000 [2:57:34<24:13,  4.00s/it, lr: 1.0e-04 loss: 9.009e-02]mindexpander_qwen_v1:  88%|########7 | 2637/3000 [2:57:40<24:13,  4.00s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  88%|########7 | 2637/3000 [2:57:40<24:13,  4.00s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  88%|########7 | 2638/3000 [2:57:40<27:09,  4.50s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  88%|########7 | 2638/3000 [2:57:40<27:09,  4.50s/it, lr: 1.0e-04 loss: 1.856e-01]mindexpander_qwen_v1:  88%|########7 | 2638/3000 [2:57:43<27:09,  4.50s/it, lr: 1.0e-04 loss: 5.102e-02]mindexpander_qwen_v1:  88%|########7 | 2638/3000 [2:57:43<27:09,  4.50s/it, lr: 1.0e-04 loss: 5.102e-02]mindexpander_qwen_v1:  88%|########7 | 2639/3000 [2:57:43<25:41,  4.27s/it, lr: 1.0e-04 loss: 5.102e-02]mindexpander_qwen_v1:  88%|########7 | 2639/3000 [2:57:43<25:41,  4.27s/it, lr: 1.0e-04 loss: 5.102e-02]mindexpander_qwen_v1:  88%|########7 | 2639/3000 [2:57:46<25:41,  4.27s/it, lr: 1.0e-04 loss: 1.278e-01]mindexpander_qwen_v1:  88%|########7 | 2639/3000 [2:57:46<25:41,  4.27s/it, lr: 1.0e-04 loss: 1.278e-01]mindexpander_qwen_v1:  88%|########8 | 2640/3000 [2:57:49<25:37,  4.27s/it, lr: 1.0e-04 loss: 4.420e-02]mindexpander_qwen_v1:  88%|########8 | 2640/3000 [2:57:49<25:37,  4.27s/it, lr: 1.0e-04 loss: 4.420e-02]mindexpander_qwen_v1:  88%|########8 | 2641/3000 [2:57:49<17:11,  2.87s/it, lr: 1.0e-04 loss: 4.420e-02]mindexpander_qwen_v1:  88%|########8 | 2641/3000 [2:57:49<17:11,  2.87s/it, lr: 1.0e-04 loss: 4.420e-02]mindexpander_qwen_v1:  88%|########8 | 2641/3000 [2:57:53<17:11,  2.87s/it, lr: 1.0e-04 loss: 1.434e-02]mindexpander_qwen_v1:  88%|########8 | 2641/3000 [2:57:53<17:11,  2.87s/it, lr: 1.0e-04 loss: 1.434e-02]mindexpander_qwen_v1:  88%|########8 | 2642/3000 [2:57:53<18:22,  3.08s/it, lr: 1.0e-04 loss: 1.434e-02]mindexpander_qwen_v1:  88%|########8 | 2642/3000 [2:57:53<18:22,  3.08s/it, lr: 1.0e-04 loss: 1.434e-02]mindexpander_qwen_v1:  88%|########8 | 2642/3000 [2:57:58<18:22,  3.08s/it, lr: 1.0e-04 loss: 7.851e-02]mindexpander_qwen_v1:  88%|########8 | 2642/3000 [2:57:58<18:22,  3.08s/it, lr: 1.0e-04 loss: 7.851e-02]mindexpander_qwen_v1:  88%|########8 | 2643/3000 [2:57:58<22:23,  3.76s/it, lr: 1.0e-04 loss: 7.851e-02]mindexpander_qwen_v1:  88%|########8 | 2643/3000 [2:57:58<22:23,  3.76s/it, lr: 1.0e-04 loss: 7.851e-02]mindexpander_qwen_v1:  88%|########8 | 2643/3000 [2:58:04<22:23,  3.76s/it, lr: 1.0e-04 loss: 5.126e-02]mindexpander_qwen_v1:  88%|########8 | 2643/3000 [2:58:04<22:23,  3.76s/it, lr: 1.0e-04 loss: 5.126e-02]mindexpander_qwen_v1:  88%|########8 | 2644/3000 [2:58:04<25:40,  4.33s/it, lr: 1.0e-04 loss: 5.126e-02]mindexpander_qwen_v1:  88%|########8 | 2644/3000 [2:58:04<25:40,  4.33s/it, lr: 1.0e-04 loss: 5.126e-02]mindexpander_qwen_v1:  88%|########8 | 2644/3000 [2:58:08<25:40,  4.33s/it, lr: 1.0e-04 loss: 1.548e-01]mindexpander_qwen_v1:  88%|########8 | 2644/3000 [2:58:08<25:40,  4.33s/it, lr: 1.0e-04 loss: 1.548e-01]mindexpander_qwen_v1:  88%|########8 | 2645/3000 [2:58:08<24:35,  4.16s/it, lr: 1.0e-04 loss: 1.548e-01]mindexpander_qwen_v1:  88%|########8 | 2645/3000 [2:58:08<24:35,  4.16s/it, lr: 1.0e-04 loss: 1.548e-01]mindexpander_qwen_v1:  88%|########8 | 2645/3000 [2:58:10<24:35,  4.16s/it, lr: 1.0e-04 loss: 1.515e-01]mindexpander_qwen_v1:  88%|########8 | 2645/3000 [2:58:10<24:35,  4.16s/it, lr: 1.0e-04 loss: 1.515e-01]mindexpander_qwen_v1:  88%|########8 | 2646/3000 [2:58:10<21:38,  3.67s/it, lr: 1.0e-04 loss: 1.515e-01]mindexpander_qwen_v1:  88%|########8 | 2646/3000 [2:58:10<21:38,  3.67s/it, lr: 1.0e-04 loss: 1.515e-01]mindexpander_qwen_v1:  88%|########8 | 2646/3000 [2:58:13<21:38,  3.67s/it, lr: 1.0e-04 loss: 1.930e-02]mindexpander_qwen_v1:  88%|########8 | 2646/3000 [2:58:13<21:38,  3.67s/it, lr: 1.0e-04 loss: 1.930e-02]mindexpander_qwen_v1:  88%|########8 | 2647/3000 [2:58:13<19:28,  3.31s/it, lr: 1.0e-04 loss: 1.930e-02]mindexpander_qwen_v1:  88%|########8 | 2647/3000 [2:58:13<19:28,  3.31s/it, lr: 1.0e-04 loss: 1.930e-02]mindexpander_qwen_v1:  88%|########8 | 2647/3000 [2:58:19<19:28,  3.31s/it, lr: 1.0e-04 loss: 3.201e-02]mindexpander_qwen_v1:  88%|########8 | 2647/3000 [2:58:19<19:28,  3.31s/it, lr: 1.0e-04 loss: 3.201e-02]mindexpander_qwen_v1:  88%|########8 | 2648/3000 [2:58:19<23:46,  4.05s/it, lr: 1.0e-04 loss: 3.201e-02]mindexpander_qwen_v1:  88%|########8 | 2648/3000 [2:58:19<23:46,  4.05s/it, lr: 1.0e-04 loss: 3.201e-02]mindexpander_qwen_v1:  88%|########8 | 2648/3000 [2:58:21<23:46,  4.05s/it, lr: 1.0e-04 loss: 1.916e-01]mindexpander_qwen_v1:  88%|########8 | 2648/3000 [2:58:21<23:46,  4.05s/it, lr: 1.0e-04 loss: 1.916e-01]mindexpander_qwen_v1:  88%|########8 | 2649/3000 [2:58:21<20:56,  3.58s/it, lr: 1.0e-04 loss: 1.916e-01]mindexpander_qwen_v1:  88%|########8 | 2649/3000 [2:58:21<20:56,  3.58s/it, lr: 1.0e-04 loss: 1.916e-01]mindexpander_qwen_v1:  88%|########8 | 2649/3000 [2:58:25<20:56,  3.58s/it, lr: 1.0e-04 loss: 4.293e-02]mindexpander_qwen_v1:  88%|########8 | 2649/3000 [2:58:25<20:56,  3.58s/it, lr: 1.0e-04 loss: 4.293e-02]mindexpander_qwen_v1:  88%|########8 | 2650/3000 [2:58:28<20:52,  3.58s/it, lr: 1.0e-04 loss: 1.689e-01]mindexpander_qwen_v1:  88%|########8 | 2650/3000 [2:58:28<20:52,  3.58s/it, lr: 1.0e-04 loss: 1.689e-01]mindexpander_qwen_v1:  88%|########8 | 2651/3000 [2:58:28<16:14,  2.79s/it, lr: 1.0e-04 loss: 1.689e-01]mindexpander_qwen_v1:  88%|########8 | 2651/3000 [2:58:28<16:14,  2.79s/it, lr: 1.0e-04 loss: 1.689e-01]mindexpander_qwen_v1:  88%|########8 | 2651/3000 [2:58:34<16:14,  2.79s/it, lr: 1.0e-04 loss: 8.549e-02]mindexpander_qwen_v1:  88%|########8 | 2651/3000 [2:58:34<16:14,  2.79s/it, lr: 1.0e-04 loss: 8.549e-02]mindexpander_qwen_v1:  88%|########8 | 2652/3000 [2:58:34<20:33,  3.54s/it, lr: 1.0e-04 loss: 8.549e-02]mindexpander_qwen_v1:  88%|########8 | 2652/3000 [2:58:34<20:33,  3.54s/it, lr: 1.0e-04 loss: 8.549e-02]mindexpander_qwen_v1:  88%|########8 | 2652/3000 [2:58:40<20:33,  3.54s/it, lr: 1.0e-04 loss: 1.279e-01]mindexpander_qwen_v1:  88%|########8 | 2652/3000 [2:58:40<20:33,  3.54s/it, lr: 1.0e-04 loss: 1.279e-01]mindexpander_qwen_v1:  88%|########8 | 2653/3000 [2:58:40<23:47,  4.11s/it, lr: 1.0e-04 loss: 1.279e-01]mindexpander_qwen_v1:  88%|########8 | 2653/3000 [2:58:40<23:47,  4.11s/it, lr: 1.0e-04 loss: 1.279e-01]mindexpander_qwen_v1:  88%|########8 | 2653/3000 [2:58:42<23:47,  4.11s/it, lr: 1.0e-04 loss: 1.249e-01]mindexpander_qwen_v1:  88%|########8 | 2653/3000 [2:58:42<23:47,  4.11s/it, lr: 1.0e-04 loss: 1.249e-01]mindexpander_qwen_v1:  88%|########8 | 2654/3000 [2:58:42<21:08,  3.67s/it, lr: 1.0e-04 loss: 1.249e-01]mindexpander_qwen_v1:  88%|########8 | 2654/3000 [2:58:42<21:08,  3.67s/it, lr: 1.0e-04 loss: 1.249e-01]mindexpander_qwen_v1:  88%|########8 | 2654/3000 [2:58:46<21:08,  3.67s/it, lr: 1.0e-04 loss: 1.108e-01]mindexpander_qwen_v1:  88%|########8 | 2654/3000 [2:58:46<21:08,  3.67s/it, lr: 1.0e-04 loss: 1.108e-01]mindexpander_qwen_v1:  88%|########8 | 2655/3000 [2:58:46<21:12,  3.69s/it, lr: 1.0e-04 loss: 1.108e-01]mindexpander_qwen_v1:  88%|########8 | 2655/3000 [2:58:46<21:12,  3.69s/it, lr: 1.0e-04 loss: 1.108e-01]mindexpander_qwen_v1:  88%|########8 | 2655/3000 [2:58:49<21:12,  3.69s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  88%|########8 | 2655/3000 [2:58:49<21:12,  3.69s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  89%|########8 | 2656/3000 [2:58:49<19:27,  3.39s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  89%|########8 | 2656/3000 [2:58:49<19:27,  3.39s/it, lr: 1.0e-04 loss: 1.761e-01]mindexpander_qwen_v1:  89%|########8 | 2656/3000 [2:58:55<19:27,  3.39s/it, lr: 1.0e-04 loss: 3.715e-02]mindexpander_qwen_v1:  89%|########8 | 2656/3000 [2:58:55<19:27,  3.39s/it, lr: 1.0e-04 loss: 3.715e-02]mindexpander_qwen_v1:  89%|########8 | 2657/3000 [2:58:55<23:14,  4.07s/it, lr: 1.0e-04 loss: 3.715e-02]mindexpander_qwen_v1:  89%|########8 | 2657/3000 [2:58:55<23:14,  4.07s/it, lr: 1.0e-04 loss: 3.715e-02]mindexpander_qwen_v1:  89%|########8 | 2657/3000 [2:58:58<23:14,  4.07s/it, lr: 1.0e-04 loss: 7.665e-02]mindexpander_qwen_v1:  89%|########8 | 2657/3000 [2:58:58<23:14,  4.07s/it, lr: 1.0e-04 loss: 7.665e-02]mindexpander_qwen_v1:  89%|########8 | 2658/3000 [2:58:58<22:36,  3.97s/it, lr: 1.0e-04 loss: 7.665e-02]mindexpander_qwen_v1:  89%|########8 | 2658/3000 [2:58:58<22:36,  3.97s/it, lr: 1.0e-04 loss: 7.665e-02]mindexpander_qwen_v1:  89%|########8 | 2658/3000 [2:59:04<22:36,  3.97s/it, lr: 1.0e-04 loss: 7.201e-02]mindexpander_qwen_v1:  89%|########8 | 2658/3000 [2:59:04<22:36,  3.97s/it, lr: 1.0e-04 loss: 7.201e-02]mindexpander_qwen_v1:  89%|########8 | 2659/3000 [2:59:04<25:29,  4.48s/it, lr: 1.0e-04 loss: 7.201e-02]mindexpander_qwen_v1:  89%|########8 | 2659/3000 [2:59:04<25:29,  4.48s/it, lr: 1.0e-04 loss: 7.201e-02]mindexpander_qwen_v1:  89%|########8 | 2659/3000 [2:59:08<25:29,  4.48s/it, lr: 1.0e-04 loss: 5.630e-02]mindexpander_qwen_v1:  89%|########8 | 2659/3000 [2:59:08<25:29,  4.48s/it, lr: 1.0e-04 loss: 5.630e-02]mindexpander_qwen_v1:  89%|########8 | 2660/3000 [2:59:12<25:24,  4.48s/it, lr: 1.0e-04 loss: 3.084e-02]mindexpander_qwen_v1:  89%|########8 | 2660/3000 [2:59:12<25:24,  4.48s/it, lr: 1.0e-04 loss: 3.084e-02]mindexpander_qwen_v1:  89%|########8 | 2661/3000 [2:59:12<18:33,  3.28s/it, lr: 1.0e-04 loss: 3.084e-02]mindexpander_qwen_v1:  89%|########8 | 2661/3000 [2:59:12<18:33,  3.28s/it, lr: 1.0e-04 loss: 3.084e-02]mindexpander_qwen_v1:  89%|########8 | 2661/3000 [2:59:15<18:33,  3.28s/it, lr: 1.0e-04 loss: 1.813e-01]mindexpander_qwen_v1:  89%|########8 | 2661/3000 [2:59:15<18:33,  3.28s/it, lr: 1.0e-04 loss: 1.813e-01]mindexpander_qwen_v1:  89%|########8 | 2662/3000 [2:59:15<19:05,  3.39s/it, lr: 1.0e-04 loss: 1.813e-01]mindexpander_qwen_v1:  89%|########8 | 2662/3000 [2:59:15<19:05,  3.39s/it, lr: 1.0e-04 loss: 1.813e-01]mindexpander_qwen_v1:  89%|########8 | 2662/3000 [2:59:18<19:05,  3.39s/it, lr: 1.0e-04 loss: 4.448e-02]mindexpander_qwen_v1:  89%|########8 | 2662/3000 [2:59:18<19:05,  3.39s/it, lr: 1.0e-04 loss: 4.448e-02]mindexpander_qwen_v1:  89%|########8 | 2663/3000 [2:59:18<17:38,  3.14s/it, lr: 1.0e-04 loss: 4.448e-02]mindexpander_qwen_v1:  89%|########8 | 2663/3000 [2:59:18<17:38,  3.14s/it, lr: 1.0e-04 loss: 4.448e-02]mindexpander_qwen_v1:  89%|########8 | 2663/3000 [2:59:20<17:38,  3.14s/it, lr: 1.0e-04 loss: 5.192e-02]mindexpander_qwen_v1:  89%|########8 | 2663/3000 [2:59:20<17:38,  3.14s/it, lr: 1.0e-04 loss: 5.192e-02]mindexpander_qwen_v1:  89%|########8 | 2664/3000 [2:59:20<16:50,  3.01s/it, lr: 1.0e-04 loss: 5.192e-02]mindexpander_qwen_v1:  89%|########8 | 2664/3000 [2:59:20<16:50,  3.01s/it, lr: 1.0e-04 loss: 5.192e-02]mindexpander_qwen_v1:  89%|########8 | 2664/3000 [2:59:24<16:50,  3.01s/it, lr: 1.0e-04 loss: 8.210e-02]mindexpander_qwen_v1:  89%|########8 | 2664/3000 [2:59:24<16:50,  3.01s/it, lr: 1.0e-04 loss: 8.210e-02]mindexpander_qwen_v1:  89%|########8 | 2665/3000 [2:59:24<17:54,  3.21s/it, lr: 1.0e-04 loss: 8.210e-02]mindexpander_qwen_v1:  89%|########8 | 2665/3000 [2:59:24<17:54,  3.21s/it, lr: 1.0e-04 loss: 8.210e-02]mindexpander_qwen_v1:  89%|########8 | 2665/3000 [2:59:30<17:54,  3.21s/it, lr: 1.0e-04 loss: 1.619e-01]mindexpander_qwen_v1:  89%|########8 | 2665/3000 [2:59:30<17:54,  3.21s/it, lr: 1.0e-04 loss: 1.619e-01]mindexpander_qwen_v1:  89%|########8 | 2666/3000 [2:59:30<21:51,  3.93s/it, lr: 1.0e-04 loss: 1.619e-01]mindexpander_qwen_v1:  89%|########8 | 2666/3000 [2:59:30<21:51,  3.93s/it, lr: 1.0e-04 loss: 1.619e-01]mindexpander_qwen_v1:  89%|########8 | 2666/3000 [2:59:36<21:51,  3.93s/it, lr: 1.0e-04 loss: 1.793e-01]mindexpander_qwen_v1:  89%|########8 | 2666/3000 [2:59:36<21:51,  3.93s/it, lr: 1.0e-04 loss: 1.793e-01]mindexpander_qwen_v1:  89%|########8 | 2667/3000 [2:59:36<24:39,  4.44s/it, lr: 1.0e-04 loss: 1.793e-01]mindexpander_qwen_v1:  89%|########8 | 2667/3000 [2:59:36<24:39,  4.44s/it, lr: 1.0e-04 loss: 1.793e-01]mindexpander_qwen_v1:  89%|########8 | 2667/3000 [2:59:38<24:39,  4.44s/it, lr: 1.0e-04 loss: 8.164e-02]mindexpander_qwen_v1:  89%|########8 | 2667/3000 [2:59:38<24:39,  4.44s/it, lr: 1.0e-04 loss: 8.164e-02]mindexpander_qwen_v1:  89%|########8 | 2668/3000 [2:59:38<21:38,  3.91s/it, lr: 1.0e-04 loss: 8.164e-02]mindexpander_qwen_v1:  89%|########8 | 2668/3000 [2:59:38<21:38,  3.91s/it, lr: 1.0e-04 loss: 8.164e-02]mindexpander_qwen_v1:  89%|########8 | 2668/3000 [2:59:44<21:38,  3.91s/it, lr: 1.0e-04 loss: 1.763e-01]mindexpander_qwen_v1:  89%|########8 | 2668/3000 [2:59:44<21:38,  3.91s/it, lr: 1.0e-04 loss: 1.763e-01]mindexpander_qwen_v1:  89%|########8 | 2669/3000 [2:59:44<24:30,  4.44s/it, lr: 1.0e-04 loss: 1.763e-01]mindexpander_qwen_v1:  89%|########8 | 2669/3000 [2:59:44<24:30,  4.44s/it, lr: 1.0e-04 loss: 1.763e-01]mindexpander_qwen_v1:  89%|########8 | 2669/3000 [2:59:47<24:30,  4.44s/it, lr: 1.0e-04 loss: 2.567e-02]mindexpander_qwen_v1:  89%|########8 | 2669/3000 [2:59:47<24:30,  4.44s/it, lr: 1.0e-04 loss: 2.567e-02]mindexpander_qwen_v1:  89%|########9 | 2670/3000 [2:59:52<24:25,  4.44s/it, lr: 1.0e-04 loss: 5.355e-02]mindexpander_qwen_v1:  89%|########9 | 2670/3000 [2:59:52<24:25,  4.44s/it, lr: 1.0e-04 loss: 5.355e-02]mindexpander_qwen_v1:  89%|########9 | 2671/3000 [2:59:52<20:23,  3.72s/it, lr: 1.0e-04 loss: 5.355e-02]mindexpander_qwen_v1:  89%|########9 | 2671/3000 [2:59:52<20:23,  3.72s/it, lr: 1.0e-04 loss: 5.355e-02]mindexpander_qwen_v1:  89%|########9 | 2671/3000 [2:59:56<20:23,  3.72s/it, lr: 1.0e-04 loss: 7.706e-02]mindexpander_qwen_v1:  89%|########9 | 2671/3000 [2:59:56<20:23,  3.72s/it, lr: 1.0e-04 loss: 7.706e-02]mindexpander_qwen_v1:  89%|########9 | 2672/3000 [2:59:56<20:40,  3.78s/it, lr: 1.0e-04 loss: 7.706e-02]mindexpander_qwen_v1:  89%|########9 | 2672/3000 [2:59:56<20:40,  3.78s/it, lr: 1.0e-04 loss: 7.706e-02]mindexpander_qwen_v1:  89%|########9 | 2672/3000 [3:00:00<20:40,  3.78s/it, lr: 1.0e-04 loss: 1.915e-01]mindexpander_qwen_v1:  89%|########9 | 2672/3000 [3:00:00<20:40,  3.78s/it, lr: 1.0e-04 loss: 1.915e-01]mindexpander_qwen_v1:  89%|########9 | 2673/3000 [3:00:00<20:31,  3.76s/it, lr: 1.0e-04 loss: 1.915e-01]mindexpander_qwen_v1:  89%|########9 | 2673/3000 [3:00:00<20:31,  3.76s/it, lr: 1.0e-04 loss: 1.915e-01]mindexpander_qwen_v1:  89%|########9 | 2673/3000 [3:00:03<20:31,  3.76s/it, lr: 1.0e-04 loss: 2.122e-02]mindexpander_qwen_v1:  89%|########9 | 2673/3000 [3:00:03<20:31,  3.76s/it, lr: 1.0e-04 loss: 2.122e-02]mindexpander_qwen_v1:  89%|########9 | 2674/3000 [3:00:03<18:29,  3.40s/it, lr: 1.0e-04 loss: 2.122e-02]mindexpander_qwen_v1:  89%|########9 | 2674/3000 [3:00:03<18:29,  3.40s/it, lr: 1.0e-04 loss: 2.122e-02]mindexpander_qwen_v1:  89%|########9 | 2674/3000 [3:00:08<18:29,  3.40s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  89%|########9 | 2674/3000 [3:00:08<18:29,  3.40s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  89%|########9 | 2675/3000 [3:00:08<21:54,  4.05s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  89%|########9 | 2675/3000 [3:00:08<21:54,  4.05s/it, lr: 1.0e-04 loss: 1.720e-01]mindexpander_qwen_v1:  89%|########9 | 2675/3000 [3:00:12<21:54,  4.05s/it, lr: 1.0e-04 loss: 9.153e-02]mindexpander_qwen_v1:  89%|########9 | 2675/3000 [3:00:12<21:54,  4.05s/it, lr: 1.0e-04 loss: 9.153e-02]mindexpander_qwen_v1:  89%|########9 | 2676/3000 [3:00:12<21:35,  4.00s/it, lr: 1.0e-04 loss: 9.153e-02]mindexpander_qwen_v1:  89%|########9 | 2676/3000 [3:00:12<21:35,  4.00s/it, lr: 1.0e-04 loss: 9.153e-02]mindexpander_qwen_v1:  89%|########9 | 2676/3000 [3:00:18<21:35,  4.00s/it, lr: 1.0e-04 loss: 1.601e-01]mindexpander_qwen_v1:  89%|########9 | 2676/3000 [3:00:18<21:35,  4.00s/it, lr: 1.0e-04 loss: 1.601e-01]mindexpander_qwen_v1:  89%|########9 | 2677/3000 [3:00:18<24:12,  4.50s/it, lr: 1.0e-04 loss: 1.601e-01]mindexpander_qwen_v1:  89%|########9 | 2677/3000 [3:00:18<24:12,  4.50s/it, lr: 1.0e-04 loss: 1.601e-01]mindexpander_qwen_v1:  89%|########9 | 2677/3000 [3:00:22<24:12,  4.50s/it, lr: 1.0e-04 loss: 2.540e-02]mindexpander_qwen_v1:  89%|########9 | 2677/3000 [3:00:22<24:12,  4.50s/it, lr: 1.0e-04 loss: 2.540e-02]mindexpander_qwen_v1:  89%|########9 | 2678/3000 [3:00:22<22:54,  4.27s/it, lr: 1.0e-04 loss: 2.540e-02]mindexpander_qwen_v1:  89%|########9 | 2678/3000 [3:00:22<22:54,  4.27s/it, lr: 1.0e-04 loss: 2.540e-02]mindexpander_qwen_v1:  89%|########9 | 2678/3000 [3:00:27<22:54,  4.27s/it, lr: 1.0e-04 loss: 2.696e-02]mindexpander_qwen_v1:  89%|########9 | 2678/3000 [3:00:27<22:54,  4.27s/it, lr: 1.0e-04 loss: 2.696e-02]mindexpander_qwen_v1:  89%|########9 | 2679/3000 [3:00:27<25:05,  4.69s/it, lr: 1.0e-04 loss: 2.696e-02]mindexpander_qwen_v1:  89%|########9 | 2679/3000 [3:00:27<25:05,  4.69s/it, lr: 1.0e-04 loss: 2.696e-02]mindexpander_qwen_v1:  89%|########9 | 2679/3000 [3:00:30<25:05,  4.69s/it, lr: 1.0e-04 loss: 1.001e-01]mindexpander_qwen_v1:  89%|########9 | 2679/3000 [3:00:30<25:05,  4.69s/it, lr: 1.0e-04 loss: 1.001e-01]mindexpander_qwen_v1:  89%|########9 | 2680/3000 [3:00:34<25:01,  4.69s/it, lr: 1.0e-04 loss: 2.067e-02]mindexpander_qwen_v1:  89%|########9 | 2680/3000 [3:00:34<25:01,  4.69s/it, lr: 1.0e-04 loss: 2.067e-02]mindexpander_qwen_v1:  89%|########9 | 2681/3000 [3:00:34<18:03,  3.40s/it, lr: 1.0e-04 loss: 2.067e-02]mindexpander_qwen_v1:  89%|########9 | 2681/3000 [3:00:34<18:03,  3.40s/it, lr: 1.0e-04 loss: 2.067e-02]mindexpander_qwen_v1:  89%|########9 | 2681/3000 [3:00:39<18:03,  3.40s/it, lr: 1.0e-04 loss: 1.419e-02]mindexpander_qwen_v1:  89%|########9 | 2681/3000 [3:00:39<18:03,  3.40s/it, lr: 1.0e-04 loss: 1.419e-02]mindexpander_qwen_v1:  89%|########9 | 2682/3000 [3:00:39<21:00,  3.96s/it, lr: 1.0e-04 loss: 1.419e-02]mindexpander_qwen_v1:  89%|########9 | 2682/3000 [3:00:39<21:00,  3.96s/it, lr: 1.0e-04 loss: 1.419e-02]mindexpander_qwen_v1:  89%|########9 | 2682/3000 [3:00:45<21:00,  3.96s/it, lr: 1.0e-04 loss: 2.809e-02]mindexpander_qwen_v1:  89%|########9 | 2682/3000 [3:00:45<21:00,  3.96s/it, lr: 1.0e-04 loss: 2.809e-02]mindexpander_qwen_v1:  89%|########9 | 2683/3000 [3:00:45<23:20,  4.42s/it, lr: 1.0e-04 loss: 2.809e-02]mindexpander_qwen_v1:  89%|########9 | 2683/3000 [3:00:45<23:20,  4.42s/it, lr: 1.0e-04 loss: 2.809e-02]mindexpander_qwen_v1:  89%|########9 | 2683/3000 [3:00:48<23:20,  4.42s/it, lr: 1.0e-04 loss: 4.031e-02]mindexpander_qwen_v1:  89%|########9 | 2683/3000 [3:00:48<23:20,  4.42s/it, lr: 1.0e-04 loss: 4.031e-02]mindexpander_qwen_v1:  89%|########9 | 2684/3000 [3:00:48<20:43,  3.93s/it, lr: 1.0e-04 loss: 4.031e-02]mindexpander_qwen_v1:  89%|########9 | 2684/3000 [3:00:48<20:43,  3.93s/it, lr: 1.0e-04 loss: 4.031e-02]mindexpander_qwen_v1:  89%|########9 | 2684/3000 [3:00:53<20:43,  3.93s/it, lr: 1.0e-04 loss: 2.816e-02]mindexpander_qwen_v1:  89%|########9 | 2684/3000 [3:00:53<20:43,  3.93s/it, lr: 1.0e-04 loss: 2.816e-02]mindexpander_qwen_v1:  90%|########9 | 2685/3000 [3:00:53<23:14,  4.43s/it, lr: 1.0e-04 loss: 2.816e-02]mindexpander_qwen_v1:  90%|########9 | 2685/3000 [3:00:53<23:14,  4.43s/it, lr: 1.0e-04 loss: 2.816e-02]mindexpander_qwen_v1:  90%|########9 | 2685/3000 [3:00:56<23:14,  4.43s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  90%|########9 | 2685/3000 [3:00:56<23:14,  4.43s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  90%|########9 | 2686/3000 [3:00:56<20:13,  3.86s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  90%|########9 | 2686/3000 [3:00:56<20:13,  3.86s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  90%|########9 | 2686/3000 [3:00:58<20:13,  3.86s/it, lr: 1.0e-04 loss: 1.701e-01]mindexpander_qwen_v1:  90%|########9 | 2686/3000 [3:00:58<20:13,  3.86s/it, lr: 1.0e-04 loss: 1.701e-01]mindexpander_qwen_v1:  90%|########9 | 2687/3000 [3:00:58<18:00,  3.45s/it, lr: 1.0e-04 loss: 1.701e-01]mindexpander_qwen_v1:  90%|########9 | 2687/3000 [3:00:58<18:00,  3.45s/it, lr: 1.0e-04 loss: 1.701e-01]mindexpander_qwen_v1:  90%|########9 | 2687/3000 [3:01:01<18:00,  3.45s/it, lr: 1.0e-04 loss: 3.200e-02]mindexpander_qwen_v1:  90%|########9 | 2687/3000 [3:01:01<18:00,  3.45s/it, lr: 1.0e-04 loss: 3.200e-02]mindexpander_qwen_v1:  90%|########9 | 2688/3000 [3:01:01<16:42,  3.21s/it, lr: 1.0e-04 loss: 3.200e-02]mindexpander_qwen_v1:  90%|########9 | 2688/3000 [3:01:01<16:42,  3.21s/it, lr: 1.0e-04 loss: 3.200e-02]mindexpander_qwen_v1:  90%|########9 | 2688/3000 [3:01:03<16:42,  3.21s/it, lr: 1.0e-04 loss: 4.095e-02]mindexpander_qwen_v1:  90%|########9 | 2688/3000 [3:01:03<16:42,  3.21s/it, lr: 1.0e-04 loss: 4.095e-02]mindexpander_qwen_v1:  90%|########9 | 2689/3000 [3:01:03<15:29,  2.99s/it, lr: 1.0e-04 loss: 4.095e-02]mindexpander_qwen_v1:  90%|########9 | 2689/3000 [3:01:03<15:29,  2.99s/it, lr: 1.0e-04 loss: 4.095e-02]mindexpander_qwen_v1:  90%|########9 | 2689/3000 [3:01:06<15:29,  2.99s/it, lr: 1.0e-04 loss: 1.558e-02]mindexpander_qwen_v1:  90%|########9 | 2689/3000 [3:01:06<15:29,  2.99s/it, lr: 1.0e-04 loss: 1.558e-02]mindexpander_qwen_v1:  90%|########9 | 2690/3000 [3:01:11<15:26,  2.99s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  90%|########9 | 2690/3000 [3:01:11<15:26,  2.99s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  90%|########9 | 2691/3000 [3:01:11<15:01,  2.92s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  90%|########9 | 2691/3000 [3:01:11<15:01,  2.92s/it, lr: 1.0e-04 loss: 0.000e+00]mindexpander_qwen_v1:  90%|########9 | 2691/3000 [3:01:17<15:01,  2.92s/it, lr: 1.0e-04 loss: 7.980e-02]mindexpander_qwen_v1:  90%|########9 | 2691/3000 [3:01:17<15:01,  2.92s/it, lr: 1.0e-04 loss: 7.980e-02]mindexpander_qwen_v1:  90%|########9 | 2692/3000 [3:01:17<18:51,  3.67s/it, lr: 1.0e-04 loss: 7.980e-02]mindexpander_qwen_v1:  90%|########9 | 2692/3000 [3:01:17<18:51,  3.67s/it, lr: 1.0e-04 loss: 7.980e-02]mindexpander_qwen_v1:  90%|########9 | 2692/3000 [3:01:23<18:51,  3.67s/it, lr: 1.0e-04 loss: 3.495e-02]mindexpander_qwen_v1:  90%|########9 | 2692/3000 [3:01:23<18:51,  3.67s/it, lr: 1.0e-04 loss: 3.495e-02]mindexpander_qwen_v1:  90%|########9 | 2693/3000 [3:01:23<21:30,  4.20s/it, lr: 1.0e-04 loss: 3.495e-02]mindexpander_qwen_v1:  90%|########9 | 2693/3000 [3:01:23<21:30,  4.20s/it, lr: 1.0e-04 loss: 3.495e-02]mindexpander_qwen_v1:  90%|########9 | 2693/3000 [3:01:27<21:30,  4.20s/it, lr: 1.0e-04 loss: 1.435e-01]mindexpander_qwen_v1:  90%|########9 | 2693/3000 [3:01:27<21:30,  4.20s/it, lr: 1.0e-04 loss: 1.435e-01]mindexpander_qwen_v1:  90%|########9 | 2694/3000 [3:01:27<20:46,  4.07s/it, lr: 1.0e-04 loss: 1.435e-01]mindexpander_qwen_v1:  90%|########9 | 2694/3000 [3:01:27<20:46,  4.07s/it, lr: 1.0e-04 loss: 1.435e-01]mindexpander_qwen_v1:  90%|########9 | 2694/3000 [3:01:31<20:46,  4.07s/it, lr: 1.0e-04 loss: 4.260e-03]mindexpander_qwen_v1:  90%|########9 | 2694/3000 [3:01:31<20:46,  4.07s/it, lr: 1.0e-04 loss: 4.260e-03]mindexpander_qwen_v1:  90%|########9 | 2695/3000 [3:01:31<20:11,  3.97s/it, lr: 1.0e-04 loss: 4.260e-03]mindexpander_qwen_v1:  90%|########9 | 2695/3000 [3:01:31<20:11,  3.97s/it, lr: 1.0e-04 loss: 4.260e-03]mindexpander_qwen_v1:  90%|########9 | 2695/3000 [3:01:35<20:11,  3.97s/it, lr: 1.0e-04 loss: 3.164e-02]mindexpander_qwen_v1:  90%|########9 | 2695/3000 [3:01:35<20:11,  3.97s/it, lr: 1.0e-04 loss: 3.164e-02]mindexpander_qwen_v1:  90%|########9 | 2696/3000 [3:01:35<20:00,  3.95s/it, lr: 1.0e-04 loss: 3.164e-02]mindexpander_qwen_v1:  90%|########9 | 2696/3000 [3:01:35<20:00,  3.95s/it, lr: 1.0e-04 loss: 3.164e-02]mindexpander_qwen_v1:  90%|########9 | 2696/3000 [3:01:38<20:00,  3.95s/it, lr: 1.0e-04 loss: 4.844e-02]mindexpander_qwen_v1:  90%|########9 | 2696/3000 [3:01:38<20:00,  3.95s/it, lr: 1.0e-04 loss: 4.844e-02]mindexpander_qwen_v1:  90%|########9 | 2697/3000 [3:01:38<19:36,  3.88s/it, lr: 1.0e-04 loss: 4.844e-02]mindexpander_qwen_v1:  90%|########9 | 2697/3000 [3:01:38<19:36,  3.88s/it, lr: 1.0e-04 loss: 4.844e-02]mindexpander_qwen_v1:  90%|########9 | 2697/3000 [3:01:41<19:36,  3.88s/it, lr: 1.0e-04 loss: 2.556e-02]mindexpander_qwen_v1:  90%|########9 | 2697/3000 [3:01:41<19:36,  3.88s/it, lr: 1.0e-04 loss: 2.556e-02]mindexpander_qwen_v1:  90%|########9 | 2698/3000 [3:01:41<17:24,  3.46s/it, lr: 1.0e-04 loss: 2.556e-02]mindexpander_qwen_v1:  90%|########9 | 2698/3000 [3:01:41<17:24,  3.46s/it, lr: 1.0e-04 loss: 2.556e-02]mindexpander_qwen_v1:  90%|########9 | 2698/3000 [3:01:44<17:24,  3.46s/it, lr: 1.0e-04 loss: 1.836e-02]mindexpander_qwen_v1:  90%|########9 | 2698/3000 [3:01:44<17:24,  3.46s/it, lr: 1.0e-04 loss: 1.836e-02]mindexpander_qwen_v1:  90%|########9 | 2699/3000 [3:01:44<17:44,  3.54s/it, lr: 1.0e-04 loss: 1.836e-02]mindexpander_qwen_v1:  90%|########9 | 2699/3000 [3:01:44<17:44,  3.54s/it, lr: 1.0e-04 loss: 1.836e-02]mindexpander_qwen_v1:  90%|########9 | 2699/3000 [3:01:51<17:44,  3.54s/it, lr: 1.0e-04 loss: 8.372e-02]mindexpander_qwen_v1:  90%|########9 | 2699/3000 [3:01:51<17:44,  3.54s/it, lr: 1.0e-04 loss: 8.372e-02]mindexpander_qwen_v1:  90%|######### | 2700/3000 [3:01:53<17:40,  3.54s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:  90%|######### | 2700/3000 [3:01:53<17:40,  3.54s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:  90%|######### | 2701/3000 [3:01:53<12:20,  2.48s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:  90%|######### | 2701/3000 [3:01:53<12:20,  2.48s/it, lr: 1.0e-04 loss: 1.771e-01]mindexpander_qwen_v1:  90%|######### | 2701/3000 [3:01:55<12:20,  2.48s/it, lr: 1.0e-04 loss: 7.860e-02]mindexpander_qwen_v1:  90%|######### | 2701/3000 [3:01:55<12:20,  2.48s/it, lr: 1.0e-04 loss: 7.860e-02]mindexpander_qwen_v1:  90%|######### | 2702/3000 [3:01:55<12:15,  2.47s/it, lr: 1.0e-04 loss: 7.860e-02]mindexpander_qwen_v1:  90%|######### | 2702/3000 [3:01:55<12:15,  2.47s/it, lr: 1.0e-04 loss: 7.860e-02]mindexpander_qwen_v1:  90%|######### | 2702/3000 [3:01:59<12:15,  2.47s/it, lr: 1.0e-04 loss: 4.124e-02]mindexpander_qwen_v1:  90%|######### | 2702/3000 [3:01:59<12:15,  2.47s/it, lr: 1.0e-04 loss: 4.124e-02]mindexpander_qwen_v1:  90%|######### | 2703/3000 [3:01:59<13:50,  2.80s/it, lr: 1.0e-04 loss: 4.124e-02]mindexpander_qwen_v1:  90%|######### | 2703/3000 [3:01:59<13:50,  2.80s/it, lr: 1.0e-04 loss: 4.124e-02]mindexpander_qwen_v1:  90%|######### | 2703/3000 [3:02:05<13:50,  2.80s/it, lr: 1.0e-04 loss: 4.835e-02]mindexpander_qwen_v1:  90%|######### | 2703/3000 [3:02:05<13:50,  2.80s/it, lr: 1.0e-04 loss: 4.835e-02]mindexpander_qwen_v1:  90%|######### | 2704/3000 [3:02:05<17:54,  3.63s/it, lr: 1.0e-04 loss: 4.835e-02]mindexpander_qwen_v1:  90%|######### | 2704/3000 [3:02:05<17:54,  3.63s/it, lr: 1.0e-04 loss: 4.835e-02]mindexpander_qwen_v1:  90%|######### | 2704/3000 [3:02:08<17:54,  3.63s/it, lr: 1.0e-04 loss: 2.307e-02]mindexpander_qwen_v1:  90%|######### | 2704/3000 [3:02:08<17:54,  3.63s/it, lr: 1.0e-04 loss: 2.307e-02]mindexpander_qwen_v1:  90%|######### | 2705/3000 [3:02:08<16:12,  3.30s/it, lr: 1.0e-04 loss: 2.307e-02]mindexpander_qwen_v1:  90%|######### | 2705/3000 [3:02:08<16:12,  3.30s/it, lr: 1.0e-04 loss: 2.307e-02]mindexpander_qwen_v1:  90%|######### | 2705/3000 [3:02:11<16:12,  3.30s/it, lr: 1.0e-04 loss: 1.365e-01]mindexpander_qwen_v1:  90%|######### | 2705/3000 [3:02:11<16:12,  3.30s/it, lr: 1.0e-04 loss: 1.365e-01]mindexpander_qwen_v1:  90%|######### | 2706/3000 [3:02:11<16:45,  3.42s/it, lr: 1.0e-04 loss: 1.365e-01]mindexpander_qwen_v1:  90%|######### | 2706/3000 [3:02:11<16:45,  3.42s/it, lr: 1.0e-04 loss: 1.365e-01]mindexpander_qwen_v1:  90%|######### | 2706/3000 [3:02:17<16:45,  3.42s/it, lr: 1.0e-04 loss: 1.963e-02]mindexpander_qwen_v1:  90%|######### | 2706/3000 [3:02:17<16:45,  3.42s/it, lr: 1.0e-04 loss: 1.963e-02]mindexpander_qwen_v1:  90%|######### | 2707/3000 [3:02:17<19:57,  4.09s/it, lr: 1.0e-04 loss: 1.963e-02]mindexpander_qwen_v1:  90%|######### | 2707/3000 [3:02:17<19:57,  4.09s/it, lr: 1.0e-04 loss: 1.963e-02]mindexpander_qwen_v1:  90%|######### | 2707/3000 [3:02:21<19:57,  4.09s/it, lr: 1.0e-04 loss: 1.737e-01]mindexpander_qwen_v1:  90%|######### | 2707/3000 [3:02:21<19:57,  4.09s/it, lr: 1.0e-04 loss: 1.737e-01]mindexpander_qwen_v1:  90%|######### | 2708/3000 [3:02:21<19:36,  4.03s/it, lr: 1.0e-04 loss: 1.737e-01]mindexpander_qwen_v1:  90%|######### | 2708/3000 [3:02:21<19:36,  4.03s/it, lr: 1.0e-04 loss: 1.737e-01]mindexpander_qwen_v1:  90%|######### | 2708/3000 [3:02:27<19:36,  4.03s/it, lr: 1.0e-04 loss: 3.551e-02]mindexpander_qwen_v1:  90%|######### | 2708/3000 [3:02:27<19:36,  4.03s/it, lr: 1.0e-04 loss: 3.551e-02]mindexpander_qwen_v1:  90%|######### | 2709/3000 [3:02:27<21:57,  4.53s/it, lr: 1.0e-04 loss: 3.551e-02]mindexpander_qwen_v1:  90%|######### | 2709/3000 [3:02:27<21:57,  4.53s/it, lr: 1.0e-04 loss: 3.551e-02]mindexpander_qwen_v1:  90%|######### | 2709/3000 [3:02:30<21:57,  4.53s/it, lr: 1.0e-04 loss: 5.038e-02]mindexpander_qwen_v1:  90%|######### | 2709/3000 [3:02:30<21:57,  4.53s/it, lr: 1.0e-04 loss: 5.038e-02]mindexpander_qwen_v1:  90%|######### | 2710/3000 [3:02:33<21:52,  4.53s/it, lr: 1.0e-04 loss: 1.618e-01]mindexpander_qwen_v1:  90%|######### | 2710/3000 [3:02:33<21:52,  4.53s/it, lr: 1.0e-04 loss: 1.618e-01]mindexpander_qwen_v1:  90%|######### | 2711/3000 [3:02:33<14:30,  3.01s/it, lr: 1.0e-04 loss: 1.618e-01]mindexpander_qwen_v1:  90%|######### | 2711/3000 [3:02:33<14:30,  3.01s/it, lr: 1.0e-04 loss: 1.618e-01]mindexpander_qwen_v1:  90%|######### | 2711/3000 [3:02:39<14:30,  3.01s/it, lr: 1.0e-04 loss: 3.190e-02]mindexpander_qwen_v1:  90%|######### | 2711/3000 [3:02:39<14:30,  3.01s/it, lr: 1.0e-04 loss: 3.190e-02]mindexpander_qwen_v1:  90%|######### | 2712/3000 [3:02:39<17:49,  3.71s/it, lr: 1.0e-04 loss: 3.190e-02]mindexpander_qwen_v1:  90%|######### | 2712/3000 [3:02:39<17:49,  3.71s/it, lr: 1.0e-04 loss: 3.190e-02]mindexpander_qwen_v1:  90%|######### | 2712/3000 [3:02:41<17:49,  3.71s/it, lr: 1.0e-04 loss: 8.558e-02]mindexpander_qwen_v1:  90%|######### | 2712/3000 [3:02:41<17:49,  3.71s/it, lr: 1.0e-04 loss: 8.558e-02]mindexpander_qwen_v1:  90%|######### | 2713/3000 [3:02:41<16:10,  3.38s/it, lr: 1.0e-04 loss: 8.558e-02]mindexpander_qwen_v1:  90%|######### | 2713/3000 [3:02:41<16:10,  3.38s/it, lr: 1.0e-04 loss: 8.558e-02]mindexpander_qwen_v1:  90%|######### | 2713/3000 [3:02:43<16:10,  3.38s/it, lr: 1.0e-04 loss: 7.529e-03]mindexpander_qwen_v1:  90%|######### | 2713/3000 [3:02:43<16:10,  3.38s/it, lr: 1.0e-04 loss: 7.529e-03]mindexpander_qwen_v1:  90%|######### | 2714/3000 [3:02:43<14:53,  3.12s/it, lr: 1.0e-04 loss: 7.529e-03]mindexpander_qwen_v1:  90%|######### | 2714/3000 [3:02:43<14:53,  3.12s/it, lr: 1.0e-04 loss: 7.529e-03]mindexpander_qwen_v1:  90%|######### | 2714/3000 [3:02:47<14:53,  3.12s/it, lr: 1.0e-04 loss: 3.787e-02]mindexpander_qwen_v1:  90%|######### | 2714/3000 [3:02:47<14:53,  3.12s/it, lr: 1.0e-04 loss: 3.787e-02]mindexpander_qwen_v1:  90%|######### | 2715/3000 [3:02:47<15:36,  3.29s/it, lr: 1.0e-04 loss: 3.787e-02]mindexpander_qwen_v1:  90%|######### | 2715/3000 [3:02:47<15:36,  3.29s/it, lr: 1.0e-04 loss: 3.787e-02]mindexpander_qwen_v1:  90%|######### | 2715/3000 [3:02:50<15:36,  3.29s/it, lr: 1.0e-04 loss: 1.206e-02]mindexpander_qwen_v1:  90%|######### | 2715/3000 [3:02:50<15:36,  3.29s/it, lr: 1.0e-04 loss: 1.206e-02]mindexpander_qwen_v1:  91%|######### | 2716/3000 [3:02:50<14:40,  3.10s/it, lr: 1.0e-04 loss: 1.206e-02]mindexpander_qwen_v1:  91%|######### | 2716/3000 [3:02:50<14:40,  3.10s/it, lr: 1.0e-04 loss: 1.206e-02]mindexpander_qwen_v1:  91%|######### | 2716/3000 [3:02:55<14:40,  3.10s/it, lr: 1.0e-04 loss: 2.719e-02]mindexpander_qwen_v1:  91%|######### | 2716/3000 [3:02:55<14:40,  3.10s/it, lr: 1.0e-04 loss: 2.719e-02]mindexpander_qwen_v1:  91%|######### | 2717/3000 [3:02:56<18:11,  3.86s/it, lr: 1.0e-04 loss: 2.719e-02]mindexpander_qwen_v1:  91%|######### | 2717/3000 [3:02:56<18:11,  3.86s/it, lr: 1.0e-04 loss: 2.719e-02]mindexpander_qwen_v1:  91%|######### | 2717/3000 [3:02:58<18:11,  3.86s/it, lr: 1.0e-04 loss: 4.134e-02]mindexpander_qwen_v1:  91%|######### | 2717/3000 [3:02:58<18:11,  3.86s/it, lr: 1.0e-04 loss: 4.134e-02]mindexpander_qwen_v1:  91%|######### | 2718/3000 [3:02:58<16:12,  3.45s/it, lr: 1.0e-04 loss: 4.134e-02]mindexpander_qwen_v1:  91%|######### | 2718/3000 [3:02:58<16:12,  3.45s/it, lr: 1.0e-04 loss: 4.134e-02]mindexpander_qwen_v1:  91%|######### | 2718/3000 [3:03:04<16:12,  3.45s/it, lr: 1.0e-04 loss: 6.087e-03]mindexpander_qwen_v1:  91%|######### | 2718/3000 [3:03:04<16:12,  3.45s/it, lr: 1.0e-04 loss: 6.087e-03]mindexpander_qwen_v1:  91%|######### | 2719/3000 [3:03:04<19:17,  4.12s/it, lr: 1.0e-04 loss: 6.087e-03]mindexpander_qwen_v1:  91%|######### | 2719/3000 [3:03:04<19:17,  4.12s/it, lr: 1.0e-04 loss: 6.087e-03]mindexpander_qwen_v1:  91%|######### | 2719/3000 [3:03:08<19:17,  4.12s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  91%|######### | 2719/3000 [3:03:08<19:17,  4.12s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  91%|######### | 2720/3000 [3:03:11<19:13,  4.12s/it, lr: 1.0e-04 loss: 3.050e-02]mindexpander_qwen_v1:  91%|######### | 2720/3000 [3:03:11<19:13,  4.12s/it, lr: 1.0e-04 loss: 3.050e-02]mindexpander_qwen_v1:  91%|######### | 2721/3000 [3:03:11<14:20,  3.09s/it, lr: 1.0e-04 loss: 3.050e-02]mindexpander_qwen_v1:  91%|######### | 2721/3000 [3:03:11<14:20,  3.09s/it, lr: 1.0e-04 loss: 3.050e-02]mindexpander_qwen_v1:  91%|######### | 2721/3000 [3:03:15<14:20,  3.09s/it, lr: 1.0e-04 loss: 1.516e-01]mindexpander_qwen_v1:  91%|######### | 2721/3000 [3:03:15<14:20,  3.09s/it, lr: 1.0e-04 loss: 1.516e-01]mindexpander_qwen_v1:  91%|######### | 2722/3000 [3:03:15<15:01,  3.24s/it, lr: 1.0e-04 loss: 1.516e-01]mindexpander_qwen_v1:  91%|######### | 2722/3000 [3:03:15<15:01,  3.24s/it, lr: 1.0e-04 loss: 1.516e-01]mindexpander_qwen_v1:  91%|######### | 2722/3000 [3:03:19<15:01,  3.24s/it, lr: 1.0e-04 loss: 7.097e-02]mindexpander_qwen_v1:  91%|######### | 2722/3000 [3:03:19<15:01,  3.24s/it, lr: 1.0e-04 loss: 7.097e-02]mindexpander_qwen_v1:  91%|######### | 2723/3000 [3:03:19<15:32,  3.37s/it, lr: 1.0e-04 loss: 7.097e-02]mindexpander_qwen_v1:  91%|######### | 2723/3000 [3:03:19<15:32,  3.37s/it, lr: 1.0e-04 loss: 7.097e-02]mindexpander_qwen_v1:  91%|######### | 2723/3000 [3:03:21<15:32,  3.37s/it, lr: 1.0e-04 loss: 4.851e-02]mindexpander_qwen_v1:  91%|######### | 2723/3000 [3:03:21<15:32,  3.37s/it, lr: 1.0e-04 loss: 4.851e-02]mindexpander_qwen_v1:  91%|######### | 2724/3000 [3:03:21<14:33,  3.16s/it, lr: 1.0e-04 loss: 4.851e-02]mindexpander_qwen_v1:  91%|######### | 2724/3000 [3:03:21<14:33,  3.16s/it, lr: 1.0e-04 loss: 4.851e-02]mindexpander_qwen_v1:  91%|######### | 2724/3000 [3:03:27<14:33,  3.16s/it, lr: 1.0e-04 loss: 1.489e-01]mindexpander_qwen_v1:  91%|######### | 2724/3000 [3:03:27<14:33,  3.16s/it, lr: 1.0e-04 loss: 1.489e-01]mindexpander_qwen_v1:  91%|######### | 2725/3000 [3:03:27<17:45,  3.88s/it, lr: 1.0e-04 loss: 1.489e-01]mindexpander_qwen_v1:  91%|######### | 2725/3000 [3:03:27<17:45,  3.88s/it, lr: 1.0e-04 loss: 1.489e-01]mindexpander_qwen_v1:  91%|######### | 2725/3000 [3:03:31<17:45,  3.88s/it, lr: 1.0e-04 loss: 1.810e-01]mindexpander_qwen_v1:  91%|######### | 2725/3000 [3:03:31<17:45,  3.88s/it, lr: 1.0e-04 loss: 1.810e-01]mindexpander_qwen_v1:  91%|######### | 2726/3000 [3:03:31<17:29,  3.83s/it, lr: 1.0e-04 loss: 1.810e-01]mindexpander_qwen_v1:  91%|######### | 2726/3000 [3:03:31<17:29,  3.83s/it, lr: 1.0e-04 loss: 1.810e-01]mindexpander_qwen_v1:  91%|######### | 2726/3000 [3:03:33<17:29,  3.83s/it, lr: 1.0e-04 loss: 1.581e-01]mindexpander_qwen_v1:  91%|######### | 2726/3000 [3:03:33<17:29,  3.83s/it, lr: 1.0e-04 loss: 1.581e-01]mindexpander_qwen_v1:  91%|######### | 2727/3000 [3:03:33<15:35,  3.43s/it, lr: 1.0e-04 loss: 1.581e-01]mindexpander_qwen_v1:  91%|######### | 2727/3000 [3:03:33<15:35,  3.43s/it, lr: 1.0e-04 loss: 1.581e-01]mindexpander_qwen_v1:  91%|######### | 2727/3000 [3:03:39<15:35,  3.43s/it, lr: 1.0e-04 loss: 2.668e-02]mindexpander_qwen_v1:  91%|######### | 2727/3000 [3:03:39<15:35,  3.43s/it, lr: 1.0e-04 loss: 2.668e-02]mindexpander_qwen_v1:  91%|######### | 2728/3000 [3:03:39<18:44,  4.13s/it, lr: 1.0e-04 loss: 2.668e-02]mindexpander_qwen_v1:  91%|######### | 2728/3000 [3:03:39<18:44,  4.13s/it, lr: 1.0e-04 loss: 2.668e-02]mindexpander_qwen_v1:  91%|######### | 2728/3000 [3:03:45<18:44,  4.13s/it, lr: 1.0e-04 loss: 1.328e-01]mindexpander_qwen_v1:  91%|######### | 2728/3000 [3:03:45<18:44,  4.13s/it, lr: 1.0e-04 loss: 1.328e-01]mindexpander_qwen_v1:  91%|######### | 2729/3000 [3:03:45<20:45,  4.60s/it, lr: 1.0e-04 loss: 1.328e-01]mindexpander_qwen_v1:  91%|######### | 2729/3000 [3:03:45<20:45,  4.60s/it, lr: 1.0e-04 loss: 1.328e-01]mindexpander_qwen_v1:  91%|######### | 2729/3000 [3:03:49<20:45,  4.60s/it, lr: 1.0e-04 loss: 1.475e-01]mindexpander_qwen_v1:  91%|######### | 2729/3000 [3:03:49<20:45,  4.60s/it, lr: 1.0e-04 loss: 1.475e-01]mindexpander_qwen_v1:  91%|#########1| 2730/3000 [3:03:51<20:41,  4.60s/it, lr: 1.0e-04 loss: 2.181e-02]mindexpander_qwen_v1:  91%|#########1| 2730/3000 [3:03:51<20:41,  4.60s/it, lr: 1.0e-04 loss: 2.181e-02]mindexpander_qwen_v1:  91%|#########1| 2731/3000 [3:03:51<13:41,  3.06s/it, lr: 1.0e-04 loss: 2.181e-02]mindexpander_qwen_v1:  91%|#########1| 2731/3000 [3:03:51<13:41,  3.06s/it, lr: 1.0e-04 loss: 2.181e-02]mindexpander_qwen_v1:  91%|#########1| 2731/3000 [3:03:54<13:41,  3.06s/it, lr: 1.0e-04 loss: 2.874e-02]mindexpander_qwen_v1:  91%|#########1| 2731/3000 [3:03:54<13:41,  3.06s/it, lr: 1.0e-04 loss: 2.874e-02]mindexpander_qwen_v1:  91%|#########1| 2732/3000 [3:03:54<13:14,  2.97s/it, lr: 1.0e-04 loss: 2.874e-02]mindexpander_qwen_v1:  91%|#########1| 2732/3000 [3:03:54<13:14,  2.97s/it, lr: 1.0e-04 loss: 2.874e-02]mindexpander_qwen_v1:  91%|#########1| 2732/3000 [3:03:56<13:14,  2.97s/it, lr: 1.0e-04 loss: 9.317e-02]mindexpander_qwen_v1:  91%|#########1| 2732/3000 [3:03:56<13:14,  2.97s/it, lr: 1.0e-04 loss: 9.317e-02]mindexpander_qwen_v1:  91%|#########1| 2733/3000 [3:03:56<12:34,  2.83s/it, lr: 1.0e-04 loss: 9.317e-02]mindexpander_qwen_v1:  91%|#########1| 2733/3000 [3:03:56<12:34,  2.83s/it, lr: 1.0e-04 loss: 9.317e-02]mindexpander_qwen_v1:  91%|#########1| 2733/3000 [3:04:00<12:34,  2.83s/it, lr: 1.0e-04 loss: 6.384e-02]mindexpander_qwen_v1:  91%|#########1| 2733/3000 [3:04:00<12:34,  2.83s/it, lr: 1.0e-04 loss: 6.384e-02]mindexpander_qwen_v1:  91%|#########1| 2734/3000 [3:04:00<13:35,  3.06s/it, lr: 1.0e-04 loss: 6.384e-02]mindexpander_qwen_v1:  91%|#########1| 2734/3000 [3:04:00<13:35,  3.06s/it, lr: 1.0e-04 loss: 6.384e-02]mindexpander_qwen_v1:  91%|#########1| 2734/3000 [3:04:06<13:35,  3.06s/it, lr: 1.0e-04 loss: 6.510e-02]mindexpander_qwen_v1:  91%|#########1| 2734/3000 [3:04:06<13:35,  3.06s/it, lr: 1.0e-04 loss: 6.510e-02]mindexpander_qwen_v1:  91%|#########1| 2735/3000 [3:04:06<16:47,  3.80s/it, lr: 1.0e-04 loss: 6.510e-02]mindexpander_qwen_v1:  91%|#########1| 2735/3000 [3:04:06<16:47,  3.80s/it, lr: 1.0e-04 loss: 6.510e-02]mindexpander_qwen_v1:  91%|#########1| 2735/3000 [3:04:10<16:47,  3.80s/it, lr: 1.0e-04 loss: 1.628e-01]mindexpander_qwen_v1:  91%|#########1| 2735/3000 [3:04:10<16:47,  3.80s/it, lr: 1.0e-04 loss: 1.628e-01]mindexpander_qwen_v1:  91%|#########1| 2736/3000 [3:04:10<16:49,  3.82s/it, lr: 1.0e-04 loss: 1.628e-01]mindexpander_qwen_v1:  91%|#########1| 2736/3000 [3:04:10<16:49,  3.82s/it, lr: 1.0e-04 loss: 1.628e-01]mindexpander_qwen_v1:  91%|#########1| 2736/3000 [3:04:15<16:49,  3.82s/it, lr: 1.0e-04 loss: 1.066e-01]mindexpander_qwen_v1:  91%|#########1| 2736/3000 [3:04:15<16:49,  3.82s/it, lr: 1.0e-04 loss: 1.066e-01]mindexpander_qwen_v1:  91%|#########1| 2737/3000 [3:04:15<19:08,  4.37s/it, lr: 1.0e-04 loss: 1.066e-01]mindexpander_qwen_v1:  91%|#########1| 2737/3000 [3:04:15<19:08,  4.37s/it, lr: 1.0e-04 loss: 1.066e-01]mindexpander_qwen_v1:  91%|#########1| 2737/3000 [3:04:19<19:08,  4.37s/it, lr: 1.0e-04 loss: 1.441e-01]mindexpander_qwen_v1:  91%|#########1| 2737/3000 [3:04:19<19:08,  4.37s/it, lr: 1.0e-04 loss: 1.441e-01]mindexpander_qwen_v1:  91%|#########1| 2738/3000 [3:04:19<18:14,  4.18s/it, lr: 1.0e-04 loss: 1.441e-01]mindexpander_qwen_v1:  91%|#########1| 2738/3000 [3:04:19<18:14,  4.18s/it, lr: 1.0e-04 loss: 1.441e-01]mindexpander_qwen_v1:  91%|#########1| 2738/3000 [3:04:25<18:14,  4.18s/it, lr: 1.0e-04 loss: 7.649e-02]mindexpander_qwen_v1:  91%|#########1| 2738/3000 [3:04:25<18:14,  4.18s/it, lr: 1.0e-04 loss: 7.649e-02]mindexpander_qwen_v1:  91%|#########1| 2739/3000 [3:04:25<20:08,  4.63s/it, lr: 1.0e-04 loss: 7.649e-02]mindexpander_qwen_v1:  91%|#########1| 2739/3000 [3:04:25<20:08,  4.63s/it, lr: 1.0e-04 loss: 7.649e-02]mindexpander_qwen_v1:  91%|#########1| 2739/3000 [3:04:31<20:08,  4.63s/it, lr: 1.0e-04 loss: 6.072e-02]mindexpander_qwen_v1:  91%|#########1| 2739/3000 [3:04:31<20:08,  4.63s/it, lr: 1.0e-04 loss: 6.072e-02]mindexpander_qwen_v1:  91%|#########1| 2740/3000 [3:04:33<20:03,  4.63s/it, lr: 1.0e-04 loss: 1.416e-01]mindexpander_qwen_v1:  91%|#########1| 2740/3000 [3:04:33<20:03,  4.63s/it, lr: 1.0e-04 loss: 1.416e-01]mindexpander_qwen_v1:  91%|#########1| 2741/3000 [3:04:33<13:17,  3.08s/it, lr: 1.0e-04 loss: 1.416e-01]mindexpander_qwen_v1:  91%|#########1| 2741/3000 [3:04:33<13:17,  3.08s/it, lr: 1.0e-04 loss: 1.416e-01]mindexpander_qwen_v1:  91%|#########1| 2741/3000 [3:04:37<13:17,  3.08s/it, lr: 1.0e-04 loss: 6.726e-02]mindexpander_qwen_v1:  91%|#########1| 2741/3000 [3:04:37<13:17,  3.08s/it, lr: 1.0e-04 loss: 6.726e-02]mindexpander_qwen_v1:  91%|#########1| 2742/3000 [3:04:37<13:55,  3.24s/it, lr: 1.0e-04 loss: 6.726e-02]mindexpander_qwen_v1:  91%|#########1| 2742/3000 [3:04:37<13:55,  3.24s/it, lr: 1.0e-04 loss: 6.726e-02]mindexpander_qwen_v1:  91%|#########1| 2742/3000 [3:04:41<13:55,  3.24s/it, lr: 1.0e-04 loss: 1.722e-01]mindexpander_qwen_v1:  91%|#########1| 2742/3000 [3:04:41<13:55,  3.24s/it, lr: 1.0e-04 loss: 1.722e-01]mindexpander_qwen_v1:  91%|#########1| 2743/3000 [3:04:41<14:24,  3.36s/it, lr: 1.0e-04 loss: 1.722e-01]mindexpander_qwen_v1:  91%|#########1| 2743/3000 [3:04:41<14:24,  3.36s/it, lr: 1.0e-04 loss: 1.722e-01]mindexpander_qwen_v1:  91%|#########1| 2743/3000 [3:04:45<14:24,  3.36s/it, lr: 1.0e-04 loss: 6.864e-02]mindexpander_qwen_v1:  91%|#########1| 2743/3000 [3:04:45<14:24,  3.36s/it, lr: 1.0e-04 loss: 6.864e-02]mindexpander_qwen_v1:  91%|#########1| 2744/3000 [3:04:45<14:56,  3.50s/it, lr: 1.0e-04 loss: 6.864e-02]mindexpander_qwen_v1:  91%|#########1| 2744/3000 [3:04:45<14:56,  3.50s/it, lr: 1.0e-04 loss: 6.864e-02]mindexpander_qwen_v1:  91%|#########1| 2744/3000 [3:04:50<14:56,  3.50s/it, lr: 1.0e-04 loss: 2.125e-02]mindexpander_qwen_v1:  91%|#########1| 2744/3000 [3:04:50<14:56,  3.50s/it, lr: 1.0e-04 loss: 2.125e-02]mindexpander_qwen_v1:  92%|#########1| 2745/3000 [3:04:50<17:30,  4.12s/it, lr: 1.0e-04 loss: 2.125e-02]mindexpander_qwen_v1:  92%|#########1| 2745/3000 [3:04:50<17:30,  4.12s/it, lr: 1.0e-04 loss: 2.125e-02]mindexpander_qwen_v1:  92%|#########1| 2745/3000 [3:04:56<17:30,  4.12s/it, lr: 1.0e-04 loss: 1.664e-01]mindexpander_qwen_v1:  92%|#########1| 2745/3000 [3:04:56<17:30,  4.12s/it, lr: 1.0e-04 loss: 1.664e-01]mindexpander_qwen_v1:  92%|#########1| 2746/3000 [3:04:56<19:21,  4.57s/it, lr: 1.0e-04 loss: 1.664e-01]mindexpander_qwen_v1:  92%|#########1| 2746/3000 [3:04:56<19:21,  4.57s/it, lr: 1.0e-04 loss: 1.664e-01]mindexpander_qwen_v1:  92%|#########1| 2746/3000 [3:05:00<19:21,  4.57s/it, lr: 1.0e-04 loss: 7.040e-02]mindexpander_qwen_v1:  92%|#########1| 2746/3000 [3:05:00<19:21,  4.57s/it, lr: 1.0e-04 loss: 7.040e-02]mindexpander_qwen_v1:  92%|#########1| 2747/3000 [3:05:00<18:13,  4.32s/it, lr: 1.0e-04 loss: 7.040e-02]mindexpander_qwen_v1:  92%|#########1| 2747/3000 [3:05:00<18:13,  4.32s/it, lr: 1.0e-04 loss: 7.040e-02]mindexpander_qwen_v1:  92%|#########1| 2747/3000 [3:05:06<18:13,  4.32s/it, lr: 1.0e-04 loss: 6.071e-02]mindexpander_qwen_v1:  92%|#########1| 2747/3000 [3:05:06<18:13,  4.32s/it, lr: 1.0e-04 loss: 6.071e-02]mindexpander_qwen_v1:  92%|#########1| 2748/3000 [3:05:06<20:02,  4.77s/it, lr: 1.0e-04 loss: 6.071e-02]mindexpander_qwen_v1:  92%|#########1| 2748/3000 [3:05:06<20:02,  4.77s/it, lr: 1.0e-04 loss: 6.071e-02]mindexpander_qwen_v1:  92%|#########1| 2748/3000 [3:05:11<20:02,  4.77s/it, lr: 1.0e-04 loss: 1.419e-01]mindexpander_qwen_v1:  92%|#########1| 2748/3000 [3:05:11<20:02,  4.77s/it, lr: 1.0e-04 loss: 1.419e-01]mindexpander_qwen_v1:  92%|#########1| 2749/3000 [3:05:11<21:06,  5.05s/it, lr: 1.0e-04 loss: 1.419e-01]mindexpander_qwen_v1:  92%|#########1| 2749/3000 [3:05:11<21:06,  5.05s/it, lr: 1.0e-04 loss: 1.419e-01]mindexpander_qwen_v1:  92%|#########1| 2749/3000 [3:05:15<21:06,  5.05s/it, lr: 1.0e-04 loss: 1.690e-02]mindexpander_qwen_v1:  92%|#########1| 2749/3000 [3:05:15<21:06,  5.05s/it, lr: 1.0e-04 loss: 1.690e-02]
+Saving at step 2750
+Saved checkpoint to /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000002750.safetensors
+Saved optimizer to /app/ai-toolkit/output/mindexpander_qwen_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1_000001750.safetensors
+
+
+Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:   0%|          | 0/2 [00:00<?, ?it/s][A[A
+
+Generating Images:  50%|#####     | 1/2 [01:26<01:26, 86.58s/it]Generating Images:  50%|#####     | 1/2 [01:26<01:26, 86.58s/it][A[A
+
+Generating Images: 100%|##########| 2/2 [02:53<00:00, 86.91s/it]Generating Images: 100%|##########| 2/2 [02:53<00:00, 86.91s/it][A[A
+
+                                                                                                                                [A[Amindexpander_qwen_v1:  92%|#########1| 2750/3000 [3:05:21<21:01,  5.05s/it, lr: 1.0e-04 loss: 7.082e-02]mindexpander_qwen_v1:  92%|#########1| 2750/3000 [3:05:21<21:01,  5.05s/it, lr: 1.0e-04 loss: 7.082e-02]mindexpander_qwen_v1:  92%|#########1| 2751/3000 [3:05:21<16:57,  4.09s/it, lr: 1.0e-04 loss: 7.082e-02]mindexpander_qwen_v1:  92%|#########1| 2751/3000 [3:05:21<16:57,  4.09s/it, lr: 1.0e-04 loss: 7.082e-02]mindexpander_qwen_v1:  92%|#########1| 2751/3000 [3:05:23<16:57,  4.09s/it, lr: 1.0e-04 loss: 4.073e-02]mindexpander_qwen_v1:  92%|#########1| 2751/3000 [3:05:23<16:57,  4.09s/it, lr: 1.0e-04 loss: 4.073e-02]mindexpander_qwen_v1:  92%|#########1| 2752/3000 [3:05:23<15:12,  3.68s/it, lr: 1.0e-04 loss: 4.073e-02]mindexpander_qwen_v1:  92%|#########1| 2752/3000 [3:05:23<15:12,  3.68s/it, lr: 1.0e-04 loss: 4.073e-02]mindexpander_qwen_v1:  92%|#########1| 2752/3000 [3:05:26<15:12,  3.68s/it, lr: 1.0e-04 loss: 1.671e-01]mindexpander_qwen_v1:  92%|#########1| 2752/3000 [3:05:26<15:12,  3.68s/it, lr: 1.0e-04 loss: 1.671e-01]mindexpander_qwen_v1:  92%|#########1| 2753/3000 [3:05:26<13:48,  3.35s/it, lr: 1.0e-04 loss: 1.671e-01]mindexpander_qwen_v1:  92%|#########1| 2753/3000 [3:05:26<13:48,  3.35s/it, lr: 1.0e-04 loss: 1.671e-01]mindexpander_qwen_v1:  92%|#########1| 2753/3000 [3:05:32<13:48,  3.35s/it, lr: 1.0e-04 loss: 1.455e-02]mindexpander_qwen_v1:  92%|#########1| 2753/3000 [3:05:32<13:48,  3.35s/it, lr: 1.0e-04 loss: 1.455e-02]mindexpander_qwen_v1:  92%|#########1| 2754/3000 [3:05:32<16:29,  4.02s/it, lr: 1.0e-04 loss: 1.455e-02]mindexpander_qwen_v1:  92%|#########1| 2754/3000 [3:05:32<16:29,  4.02s/it, lr: 1.0e-04 loss: 1.455e-02]mindexpander_qwen_v1:  92%|#########1| 2754/3000 [3:05:34<16:29,  4.02s/it, lr: 1.0e-04 loss: 1.624e-01]mindexpander_qwen_v1:  92%|#########1| 2754/3000 [3:05:34<16:29,  4.02s/it, lr: 1.0e-04 loss: 1.624e-01]mindexpander_qwen_v1:  92%|#########1| 2755/3000 [3:05:34<14:36,  3.58s/it, lr: 1.0e-04 loss: 1.624e-01]mindexpander_qwen_v1:  92%|#########1| 2755/3000 [3:05:34<14:36,  3.58s/it, lr: 1.0e-04 loss: 1.624e-01]mindexpander_qwen_v1:  92%|#########1| 2755/3000 [3:05:36<14:36,  3.58s/it, lr: 1.0e-04 loss: 1.487e-01]mindexpander_qwen_v1:  92%|#########1| 2755/3000 [3:05:36<14:36,  3.58s/it, lr: 1.0e-04 loss: 1.487e-01]mindexpander_qwen_v1:  92%|#########1| 2756/3000 [3:05:36<13:13,  3.25s/it, lr: 1.0e-04 loss: 1.487e-01]mindexpander_qwen_v1:  92%|#########1| 2756/3000 [3:05:36<13:13,  3.25s/it, lr: 1.0e-04 loss: 1.487e-01]mindexpander_qwen_v1:  92%|#########1| 2756/3000 [3:05:40<13:13,  3.25s/it, lr: 1.0e-04 loss: 2.028e-02]mindexpander_qwen_v1:  92%|#########1| 2756/3000 [3:05:40<13:13,  3.25s/it, lr: 1.0e-04 loss: 2.028e-02]mindexpander_qwen_v1:  92%|#########1| 2757/3000 [3:05:40<13:42,  3.38s/it, lr: 1.0e-04 loss: 2.028e-02]mindexpander_qwen_v1:  92%|#########1| 2757/3000 [3:05:40<13:42,  3.38s/it, lr: 1.0e-04 loss: 2.028e-02]mindexpander_qwen_v1:  92%|#########1| 2757/3000 [3:05:43<13:42,  3.38s/it, lr: 1.0e-04 loss: 1.234e-01]mindexpander_qwen_v1:  92%|#########1| 2757/3000 [3:05:43<13:42,  3.38s/it, lr: 1.0e-04 loss: 1.234e-01]mindexpander_qwen_v1:  92%|#########1| 2758/3000 [3:05:43<12:43,  3.15s/it, lr: 1.0e-04 loss: 1.234e-01]mindexpander_qwen_v1:  92%|#########1| 2758/3000 [3:05:43<12:43,  3.15s/it, lr: 1.0e-04 loss: 1.234e-01]mindexpander_qwen_v1:  92%|#########1| 2758/3000 [3:05:45<12:43,  3.15s/it, lr: 1.0e-04 loss: 5.481e-02]mindexpander_qwen_v1:  92%|#########1| 2758/3000 [3:05:45<12:43,  3.15s/it, lr: 1.0e-04 loss: 5.481e-02]mindexpander_qwen_v1:  92%|#########1| 2759/3000 [3:05:45<11:48,  2.94s/it, lr: 1.0e-04 loss: 5.481e-02]mindexpander_qwen_v1:  92%|#########1| 2759/3000 [3:05:45<11:48,  2.94s/it, lr: 1.0e-04 loss: 5.481e-02]mindexpander_qwen_v1:  92%|#########1| 2759/3000 [3:05:48<11:48,  2.94s/it, lr: 1.0e-04 loss: 1.594e-01]mindexpander_qwen_v1:  92%|#########1| 2759/3000 [3:05:48<11:48,  2.94s/it, lr: 1.0e-04 loss: 1.594e-01]mindexpander_qwen_v1:  92%|#########2| 2760/3000 [3:05:52<11:45,  2.94s/it, lr: 1.0e-04 loss: 7.614e-03]mindexpander_qwen_v1:  92%|#########2| 2760/3000 [3:05:52<11:45,  2.94s/it, lr: 1.0e-04 loss: 7.614e-03]mindexpander_qwen_v1:  92%|#########2| 2761/3000 [3:05:52<09:44,  2.44s/it, lr: 1.0e-04 loss: 7.614e-03]mindexpander_qwen_v1:  92%|#########2| 2761/3000 [3:05:52<09:44,  2.44s/it, lr: 1.0e-04 loss: 7.614e-03]mindexpander_qwen_v1:  92%|#########2| 2761/3000 [3:05:58<09:44,  2.44s/it, lr: 1.0e-04 loss: 9.834e-03]mindexpander_qwen_v1:  92%|#########2| 2761/3000 [3:05:58<09:44,  2.44s/it, lr: 1.0e-04 loss: 9.834e-03]mindexpander_qwen_v1:  92%|#########2| 2762/3000 [3:05:58<13:06,  3.30s/it, lr: 1.0e-04 loss: 9.834e-03]mindexpander_qwen_v1:  92%|#########2| 2762/3000 [3:05:58<13:06,  3.30s/it, lr: 1.0e-04 loss: 9.834e-03]mindexpander_qwen_v1:  92%|#########2| 2762/3000 [3:06:00<13:06,  3.30s/it, lr: 1.0e-04 loss: 5.554e-02]mindexpander_qwen_v1:  92%|#########2| 2762/3000 [3:06:00<13:06,  3.30s/it, lr: 1.0e-04 loss: 5.554e-02]mindexpander_qwen_v1:  92%|#########2| 2763/3000 [3:06:00<12:10,  3.08s/it, lr: 1.0e-04 loss: 5.554e-02]mindexpander_qwen_v1:  92%|#########2| 2763/3000 [3:06:00<12:10,  3.08s/it, lr: 1.0e-04 loss: 5.554e-02]mindexpander_qwen_v1:  92%|#########2| 2763/3000 [3:06:04<12:10,  3.08s/it, lr: 1.0e-04 loss: 1.705e-02]mindexpander_qwen_v1:  92%|#########2| 2763/3000 [3:06:04<12:10,  3.08s/it, lr: 1.0e-04 loss: 1.705e-02]mindexpander_qwen_v1:  92%|#########2| 2764/3000 [3:06:04<12:48,  3.25s/it, lr: 1.0e-04 loss: 1.705e-02]mindexpander_qwen_v1:  92%|#########2| 2764/3000 [3:06:04<12:48,  3.25s/it, lr: 1.0e-04 loss: 1.705e-02]mindexpander_qwen_v1:  92%|#########2| 2764/3000 [3:06:08<12:48,  3.25s/it, lr: 1.0e-04 loss: 1.730e-01]mindexpander_qwen_v1:  92%|#########2| 2764/3000 [3:06:08<12:48,  3.25s/it, lr: 1.0e-04 loss: 1.730e-01]mindexpander_qwen_v1:  92%|#########2| 2765/3000 [3:06:08<13:14,  3.38s/it, lr: 1.0e-04 loss: 1.730e-01]mindexpander_qwen_v1:  92%|#########2| 2765/3000 [3:06:08<13:14,  3.38s/it, lr: 1.0e-04 loss: 1.730e-01]mindexpander_qwen_v1:  92%|#########2| 2765/3000 [3:06:13<13:14,  3.38s/it, lr: 1.0e-04 loss: 2.440e-02]mindexpander_qwen_v1:  92%|#########2| 2765/3000 [3:06:13<13:14,  3.38s/it, lr: 1.0e-04 loss: 2.440e-02]mindexpander_qwen_v1:  92%|#########2| 2766/3000 [3:06:13<15:56,  4.09s/it, lr: 1.0e-04 loss: 2.440e-02]mindexpander_qwen_v1:  92%|#########2| 2766/3000 [3:06:13<15:56,  4.09s/it, lr: 1.0e-04 loss: 2.440e-02]mindexpander_qwen_v1:  92%|#########2| 2766/3000 [3:06:17<15:56,  4.09s/it, lr: 1.0e-04 loss: 1.320e-01]mindexpander_qwen_v1:  92%|#########2| 2766/3000 [3:06:17<15:56,  4.09s/it, lr: 1.0e-04 loss: 1.320e-01]mindexpander_qwen_v1:  92%|#########2| 2767/3000 [3:06:17<15:27,  3.98s/it, lr: 1.0e-04 loss: 1.320e-01]mindexpander_qwen_v1:  92%|#########2| 2767/3000 [3:06:17<15:27,  3.98s/it, lr: 1.0e-04 loss: 1.320e-01]mindexpander_qwen_v1:  92%|#########2| 2767/3000 [3:06:20<15:27,  3.98s/it, lr: 1.0e-04 loss: 8.753e-02]mindexpander_qwen_v1:  92%|#########2| 2767/3000 [3:06:20<15:27,  3.98s/it, lr: 1.0e-04 loss: 8.753e-02]mindexpander_qwen_v1:  92%|#########2| 2768/3000 [3:06:20<13:38,  3.53s/it, lr: 1.0e-04 loss: 8.753e-02]mindexpander_qwen_v1:  92%|#########2| 2768/3000 [3:06:20<13:38,  3.53s/it, lr: 1.0e-04 loss: 8.753e-02]mindexpander_qwen_v1:  92%|#########2| 2768/3000 [3:06:25<13:38,  3.53s/it, lr: 1.0e-04 loss: 1.416e-02]mindexpander_qwen_v1:  92%|#########2| 2768/3000 [3:06:25<13:38,  3.53s/it, lr: 1.0e-04 loss: 1.416e-02]mindexpander_qwen_v1:  92%|#########2| 2769/3000 [3:06:25<16:03,  4.17s/it, lr: 1.0e-04 loss: 1.416e-02]mindexpander_qwen_v1:  92%|#########2| 2769/3000 [3:06:25<16:03,  4.17s/it, lr: 1.0e-04 loss: 1.416e-02]mindexpander_qwen_v1:  92%|#########2| 2769/3000 [3:06:29<16:03,  4.17s/it, lr: 1.0e-04 loss: 1.513e-01]mindexpander_qwen_v1:  92%|#########2| 2769/3000 [3:06:29<16:03,  4.17s/it, lr: 1.0e-04 loss: 1.513e-01]mindexpander_qwen_v1:  92%|#########2| 2770/3000 [3:06:33<15:59,  4.17s/it, lr: 1.0e-04 loss: 2.628e-02]mindexpander_qwen_v1:  92%|#########2| 2770/3000 [3:06:33<15:59,  4.17s/it, lr: 1.0e-04 loss: 2.628e-02]mindexpander_qwen_v1:  92%|#########2| 2771/3000 [3:06:33<11:52,  3.11s/it, lr: 1.0e-04 loss: 2.628e-02]mindexpander_qwen_v1:  92%|#########2| 2771/3000 [3:06:33<11:52,  3.11s/it, lr: 1.0e-04 loss: 2.628e-02]mindexpander_qwen_v1:  92%|#########2| 2771/3000 [3:06:35<11:52,  3.11s/it, lr: 1.0e-04 loss: 6.043e-02]mindexpander_qwen_v1:  92%|#########2| 2771/3000 [3:06:35<11:52,  3.11s/it, lr: 1.0e-04 loss: 6.043e-02]mindexpander_qwen_v1:  92%|#########2| 2772/3000 [3:06:35<11:11,  2.95s/it, lr: 1.0e-04 loss: 6.043e-02]mindexpander_qwen_v1:  92%|#########2| 2772/3000 [3:06:35<11:11,  2.95s/it, lr: 1.0e-04 loss: 6.043e-02]mindexpander_qwen_v1:  92%|#########2| 2772/3000 [3:06:41<11:11,  2.95s/it, lr: 1.0e-04 loss: 4.590e-02]mindexpander_qwen_v1:  92%|#########2| 2772/3000 [3:06:41<11:11,  2.95s/it, lr: 1.0e-04 loss: 4.590e-02]mindexpander_qwen_v1:  92%|#########2| 2773/3000 [3:06:41<13:52,  3.67s/it, lr: 1.0e-04 loss: 4.590e-02]mindexpander_qwen_v1:  92%|#########2| 2773/3000 [3:06:41<13:52,  3.67s/it, lr: 1.0e-04 loss: 4.590e-02]mindexpander_qwen_v1:  92%|#########2| 2773/3000 [3:06:45<13:52,  3.67s/it, lr: 1.0e-04 loss: 1.286e-01]mindexpander_qwen_v1:  92%|#########2| 2773/3000 [3:06:45<13:52,  3.67s/it, lr: 1.0e-04 loss: 1.286e-01]mindexpander_qwen_v1:  92%|#########2| 2774/3000 [3:06:45<14:04,  3.74s/it, lr: 1.0e-04 loss: 1.286e-01]mindexpander_qwen_v1:  92%|#########2| 2774/3000 [3:06:45<14:04,  3.74s/it, lr: 1.0e-04 loss: 1.286e-01]mindexpander_qwen_v1:  92%|#########2| 2774/3000 [3:06:51<14:04,  3.74s/it, lr: 1.0e-04 loss: 1.462e-01]mindexpander_qwen_v1:  92%|#########2| 2774/3000 [3:06:51<14:04,  3.74s/it, lr: 1.0e-04 loss: 1.462e-01]mindexpander_qwen_v1:  92%|#########2| 2775/3000 [3:06:51<16:05,  4.29s/it, lr: 1.0e-04 loss: 1.462e-01]mindexpander_qwen_v1:  92%|#########2| 2775/3000 [3:06:51<16:05,  4.29s/it, lr: 1.0e-04 loss: 1.462e-01]mindexpander_qwen_v1:  92%|#########2| 2775/3000 [3:06:54<16:05,  4.29s/it, lr: 1.0e-04 loss: 8.514e-02]mindexpander_qwen_v1:  92%|#########2| 2775/3000 [3:06:54<16:05,  4.29s/it, lr: 1.0e-04 loss: 8.514e-02]mindexpander_qwen_v1:  93%|#########2| 2776/3000 [3:06:54<15:24,  4.13s/it, lr: 1.0e-04 loss: 8.514e-02]mindexpander_qwen_v1:  93%|#########2| 2776/3000 [3:06:54<15:24,  4.13s/it, lr: 1.0e-04 loss: 8.514e-02]mindexpander_qwen_v1:  93%|#########2| 2776/3000 [3:07:00<15:24,  4.13s/it, lr: 1.0e-04 loss: 4.458e-02]mindexpander_qwen_v1:  93%|#########2| 2776/3000 [3:07:00<15:24,  4.13s/it, lr: 1.0e-04 loss: 4.458e-02]mindexpander_qwen_v1:  93%|#########2| 2777/3000 [3:07:00<17:03,  4.59s/it, lr: 1.0e-04 loss: 4.458e-02]mindexpander_qwen_v1:  93%|#########2| 2777/3000 [3:07:00<17:03,  4.59s/it, lr: 1.0e-04 loss: 4.458e-02]mindexpander_qwen_v1:  93%|#########2| 2777/3000 [3:07:06<17:03,  4.59s/it, lr: 1.0e-04 loss: 1.094e-01]mindexpander_qwen_v1:  93%|#########2| 2777/3000 [3:07:06<17:03,  4.59s/it, lr: 1.0e-04 loss: 1.094e-01]mindexpander_qwen_v1:  93%|#########2| 2778/3000 [3:07:06<18:22,  4.97s/it, lr: 1.0e-04 loss: 1.094e-01]mindexpander_qwen_v1:  93%|#########2| 2778/3000 [3:07:06<18:22,  4.97s/it, lr: 1.0e-04 loss: 1.094e-01]mindexpander_qwen_v1:  93%|#########2| 2778/3000 [3:07:10<18:22,  4.97s/it, lr: 1.0e-04 loss: 8.549e-02]mindexpander_qwen_v1:  93%|#########2| 2778/3000 [3:07:10<18:22,  4.97s/it, lr: 1.0e-04 loss: 8.549e-02]mindexpander_qwen_v1:  93%|#########2| 2779/3000 [3:07:10<16:56,  4.60s/it, lr: 1.0e-04 loss: 8.549e-02]mindexpander_qwen_v1:  93%|#########2| 2779/3000 [3:07:10<16:56,  4.60s/it, lr: 1.0e-04 loss: 8.549e-02]mindexpander_qwen_v1:  93%|#########2| 2779/3000 [3:07:12<16:56,  4.60s/it, lr: 1.0e-04 loss: 5.497e-02]mindexpander_qwen_v1:  93%|#########2| 2779/3000 [3:07:12<16:56,  4.60s/it, lr: 1.0e-04 loss: 5.497e-02]mindexpander_qwen_v1:  93%|#########2| 2780/3000 [3:07:18<16:51,  4.60s/it, lr: 1.0e-04 loss: 4.170e-02]mindexpander_qwen_v1:  93%|#########2| 2780/3000 [3:07:18<16:51,  4.60s/it, lr: 1.0e-04 loss: 4.170e-02]mindexpander_qwen_v1:  93%|#########2| 2781/3000 [3:07:18<13:52,  3.80s/it, lr: 1.0e-04 loss: 4.170e-02]mindexpander_qwen_v1:  93%|#########2| 2781/3000 [3:07:18<13:52,  3.80s/it, lr: 1.0e-04 loss: 4.170e-02]mindexpander_qwen_v1:  93%|#########2| 2781/3000 [3:07:24<13:52,  3.80s/it, lr: 1.0e-04 loss: 3.128e-02]mindexpander_qwen_v1:  93%|#########2| 2781/3000 [3:07:24<13:52,  3.80s/it, lr: 1.0e-04 loss: 3.128e-02]mindexpander_qwen_v1:  93%|#########2| 2782/3000 [3:07:24<15:39,  4.31s/it, lr: 1.0e-04 loss: 3.128e-02]mindexpander_qwen_v1:  93%|#########2| 2782/3000 [3:07:24<15:39,  4.31s/it, lr: 1.0e-04 loss: 3.128e-02]mindexpander_qwen_v1:  93%|#########2| 2782/3000 [3:07:26<15:39,  4.31s/it, lr: 1.0e-04 loss: 3.891e-02]mindexpander_qwen_v1:  93%|#########2| 2782/3000 [3:07:26<15:39,  4.31s/it, lr: 1.0e-04 loss: 3.891e-02]mindexpander_qwen_v1:  93%|#########2| 2783/3000 [3:07:26<13:49,  3.82s/it, lr: 1.0e-04 loss: 3.891e-02]mindexpander_qwen_v1:  93%|#########2| 2783/3000 [3:07:26<13:49,  3.82s/it, lr: 1.0e-04 loss: 3.891e-02]mindexpander_qwen_v1:  93%|#########2| 2783/3000 [3:07:30<13:49,  3.82s/it, lr: 1.0e-04 loss: 2.367e-02]mindexpander_qwen_v1:  93%|#########2| 2783/3000 [3:07:30<13:49,  3.82s/it, lr: 1.0e-04 loss: 2.367e-02]mindexpander_qwen_v1:  93%|#########2| 2784/3000 [3:07:30<13:39,  3.79s/it, lr: 1.0e-04 loss: 2.367e-02]mindexpander_qwen_v1:  93%|#########2| 2784/3000 [3:07:30<13:39,  3.79s/it, lr: 1.0e-04 loss: 2.367e-02]mindexpander_qwen_v1:  93%|#########2| 2784/3000 [3:07:32<13:39,  3.79s/it, lr: 1.0e-04 loss: 5.387e-02]mindexpander_qwen_v1:  93%|#########2| 2784/3000 [3:07:32<13:39,  3.79s/it, lr: 1.0e-04 loss: 5.387e-02]mindexpander_qwen_v1:  93%|#########2| 2785/3000 [3:07:32<12:14,  3.42s/it, lr: 1.0e-04 loss: 5.387e-02]mindexpander_qwen_v1:  93%|#########2| 2785/3000 [3:07:32<12:14,  3.42s/it, lr: 1.0e-04 loss: 5.387e-02]mindexpander_qwen_v1:  93%|#########2| 2785/3000 [3:07:35<12:14,  3.42s/it, lr: 1.0e-04 loss: 9.938e-02]mindexpander_qwen_v1:  93%|#########2| 2785/3000 [3:07:35<12:14,  3.42s/it, lr: 1.0e-04 loss: 9.938e-02]mindexpander_qwen_v1:  93%|#########2| 2786/3000 [3:07:35<11:23,  3.19s/it, lr: 1.0e-04 loss: 9.938e-02]mindexpander_qwen_v1:  93%|#########2| 2786/3000 [3:07:35<11:23,  3.19s/it, lr: 1.0e-04 loss: 9.938e-02]mindexpander_qwen_v1:  93%|#########2| 2786/3000 [3:07:37<11:23,  3.19s/it, lr: 1.0e-04 loss: 1.466e-01]mindexpander_qwen_v1:  93%|#########2| 2786/3000 [3:07:37<11:23,  3.19s/it, lr: 1.0e-04 loss: 1.466e-01]mindexpander_qwen_v1:  93%|#########2| 2787/3000 [3:07:37<10:33,  2.98s/it, lr: 1.0e-04 loss: 1.466e-01]mindexpander_qwen_v1:  93%|#########2| 2787/3000 [3:07:37<10:33,  2.98s/it, lr: 1.0e-04 loss: 1.466e-01]mindexpander_qwen_v1:  93%|#########2| 2787/3000 [3:07:40<10:33,  2.98s/it, lr: 1.0e-04 loss: 1.868e-02]mindexpander_qwen_v1:  93%|#########2| 2787/3000 [3:07:40<10:33,  2.98s/it, lr: 1.0e-04 loss: 1.868e-02]mindexpander_qwen_v1:  93%|#########2| 2788/3000 [3:07:40<09:57,  2.82s/it, lr: 1.0e-04 loss: 1.868e-02]mindexpander_qwen_v1:  93%|#########2| 2788/3000 [3:07:40<09:57,  2.82s/it, lr: 1.0e-04 loss: 1.868e-02]mindexpander_qwen_v1:  93%|#########2| 2788/3000 [3:07:46<09:57,  2.82s/it, lr: 1.0e-04 loss: 1.838e-01]mindexpander_qwen_v1:  93%|#########2| 2788/3000 [3:07:46<09:57,  2.82s/it, lr: 1.0e-04 loss: 1.838e-01]mindexpander_qwen_v1:  93%|#########2| 2789/3000 [3:07:46<12:55,  3.68s/it, lr: 1.0e-04 loss: 1.838e-01]mindexpander_qwen_v1:  93%|#########2| 2789/3000 [3:07:46<12:55,  3.68s/it, lr: 1.0e-04 loss: 1.838e-01]mindexpander_qwen_v1:  93%|#########2| 2789/3000 [3:07:52<12:55,  3.68s/it, lr: 1.0e-04 loss: 1.298e-02]mindexpander_qwen_v1:  93%|#########2| 2789/3000 [3:07:52<12:55,  3.68s/it, lr: 1.0e-04 loss: 1.298e-02]mindexpander_qwen_v1:  93%|#########3| 2790/3000 [3:07:54<12:51,  3.68s/it, lr: 1.0e-04 loss: 1.143e-01]mindexpander_qwen_v1:  93%|#########3| 2790/3000 [3:07:54<12:51,  3.68s/it, lr: 1.0e-04 loss: 1.143e-01]mindexpander_qwen_v1:  93%|#########3| 2791/3000 [3:07:54<08:54,  2.56s/it, lr: 1.0e-04 loss: 1.143e-01]mindexpander_qwen_v1:  93%|#########3| 2791/3000 [3:07:54<08:54,  2.56s/it, lr: 1.0e-04 loss: 1.143e-01]mindexpander_qwen_v1:  93%|#########3| 2791/3000 [3:08:00<08:54,  2.56s/it, lr: 1.0e-04 loss: 1.765e-01]mindexpander_qwen_v1:  93%|#########3| 2791/3000 [3:08:00<08:54,  2.56s/it, lr: 1.0e-04 loss: 1.765e-01]mindexpander_qwen_v1:  93%|#########3| 2792/3000 [3:08:00<11:33,  3.33s/it, lr: 1.0e-04 loss: 1.765e-01]mindexpander_qwen_v1:  93%|#########3| 2792/3000 [3:08:00<11:33,  3.33s/it, lr: 1.0e-04 loss: 1.765e-01]mindexpander_qwen_v1:  93%|#########3| 2792/3000 [3:08:06<11:33,  3.33s/it, lr: 1.0e-04 loss: 1.598e-01]mindexpander_qwen_v1:  93%|#########3| 2792/3000 [3:08:06<11:33,  3.33s/it, lr: 1.0e-04 loss: 1.598e-01]mindexpander_qwen_v1:  93%|#########3| 2793/3000 [3:08:06<13:38,  3.95s/it, lr: 1.0e-04 loss: 1.598e-01]mindexpander_qwen_v1:  93%|#########3| 2793/3000 [3:08:06<13:38,  3.95s/it, lr: 1.0e-04 loss: 1.598e-01]mindexpander_qwen_v1:  93%|#########3| 2793/3000 [3:08:08<13:38,  3.95s/it, lr: 1.0e-04 loss: 4.253e-02]mindexpander_qwen_v1:  93%|#########3| 2793/3000 [3:08:08<13:38,  3.95s/it, lr: 1.0e-04 loss: 4.253e-02]mindexpander_qwen_v1:  93%|#########3| 2794/3000 [3:08:08<12:21,  3.60s/it, lr: 1.0e-04 loss: 4.253e-02]mindexpander_qwen_v1:  93%|#########3| 2794/3000 [3:08:08<12:21,  3.60s/it, lr: 1.0e-04 loss: 4.253e-02]mindexpander_qwen_v1:  93%|#########3| 2794/3000 [3:08:11<12:21,  3.60s/it, lr: 1.0e-04 loss: 8.628e-02]mindexpander_qwen_v1:  93%|#########3| 2794/3000 [3:08:11<12:21,  3.60s/it, lr: 1.0e-04 loss: 8.628e-02]mindexpander_qwen_v1:  93%|#########3| 2795/3000 [3:08:11<11:10,  3.27s/it, lr: 1.0e-04 loss: 8.628e-02]mindexpander_qwen_v1:  93%|#########3| 2795/3000 [3:08:11<11:10,  3.27s/it, lr: 1.0e-04 loss: 8.628e-02]mindexpander_qwen_v1:  93%|#########3| 2795/3000 [3:08:17<11:10,  3.27s/it, lr: 1.0e-04 loss: 8.299e-02]mindexpander_qwen_v1:  93%|#########3| 2795/3000 [3:08:17<11:10,  3.27s/it, lr: 1.0e-04 loss: 8.299e-02]mindexpander_qwen_v1:  93%|#########3| 2796/3000 [3:08:17<13:29,  3.97s/it, lr: 1.0e-04 loss: 8.299e-02]mindexpander_qwen_v1:  93%|#########3| 2796/3000 [3:08:17<13:29,  3.97s/it, lr: 1.0e-04 loss: 8.299e-02]mindexpander_qwen_v1:  93%|#########3| 2796/3000 [3:08:20<13:29,  3.97s/it, lr: 1.0e-04 loss: 6.715e-02]mindexpander_qwen_v1:  93%|#########3| 2796/3000 [3:08:20<13:29,  3.97s/it, lr: 1.0e-04 loss: 6.715e-02]mindexpander_qwen_v1:  93%|#########3| 2797/3000 [3:08:20<13:10,  3.89s/it, lr: 1.0e-04 loss: 6.715e-02]mindexpander_qwen_v1:  93%|#########3| 2797/3000 [3:08:20<13:10,  3.89s/it, lr: 1.0e-04 loss: 6.715e-02]mindexpander_qwen_v1:  93%|#########3| 2797/3000 [3:08:23<13:10,  3.89s/it, lr: 1.0e-04 loss: 1.707e-02]mindexpander_qwen_v1:  93%|#########3| 2797/3000 [3:08:23<13:10,  3.89s/it, lr: 1.0e-04 loss: 1.707e-02]mindexpander_qwen_v1:  93%|#########3| 2798/3000 [3:08:23<11:51,  3.52s/it, lr: 1.0e-04 loss: 1.707e-02]mindexpander_qwen_v1:  93%|#########3| 2798/3000 [3:08:23<11:51,  3.52s/it, lr: 1.0e-04 loss: 1.707e-02]mindexpander_qwen_v1:  93%|#########3| 2798/3000 [3:08:27<11:51,  3.52s/it, lr: 1.0e-04 loss: 9.304e-02]mindexpander_qwen_v1:  93%|#########3| 2798/3000 [3:08:27<11:51,  3.52s/it, lr: 1.0e-04 loss: 9.304e-02]mindexpander_qwen_v1:  93%|#########3| 2799/3000 [3:08:27<11:59,  3.58s/it, lr: 1.0e-04 loss: 9.304e-02]mindexpander_qwen_v1:  93%|#########3| 2799/3000 [3:08:27<11:59,  3.58s/it, lr: 1.0e-04 loss: 9.304e-02]mindexpander_qwen_v1:  93%|#########3| 2799/3000 [3:08:29<11:59,  3.58s/it, lr: 1.0e-04 loss: 4.430e-02]mindexpander_qwen_v1:  93%|#########3| 2799/3000 [3:08:29<11:59,  3.58s/it, lr: 1.0e-04 loss: 4.430e-02]mindexpander_qwen_v1:  93%|#########3| 2800/3000 [3:08:32<11:55,  3.58s/it, lr: 1.0e-04 loss: 1.423e-02]mindexpander_qwen_v1:  93%|#########3| 2800/3000 [3:08:32<11:55,  3.58s/it, lr: 1.0e-04 loss: 1.423e-02]mindexpander_qwen_v1:  93%|#########3| 2801/3000 [3:08:32<08:17,  2.50s/it, lr: 1.0e-04 loss: 1.423e-02]mindexpander_qwen_v1:  93%|#########3| 2801/3000 [3:08:32<08:17,  2.50s/it, lr: 1.0e-04 loss: 1.423e-02]mindexpander_qwen_v1:  93%|#########3| 2801/3000 [3:08:35<08:17,  2.50s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  93%|#########3| 2801/3000 [3:08:35<08:17,  2.50s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  93%|#########3| 2802/3000 [3:08:35<09:23,  2.84s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  93%|#########3| 2802/3000 [3:08:35<09:23,  2.84s/it, lr: 1.0e-04 loss: 1.509e-01]mindexpander_qwen_v1:  93%|#########3| 2802/3000 [3:08:38<09:23,  2.84s/it, lr: 1.0e-04 loss: 1.404e-02]mindexpander_qwen_v1:  93%|#########3| 2802/3000 [3:08:38<09:23,  2.84s/it, lr: 1.0e-04 loss: 1.404e-02]mindexpander_qwen_v1:  93%|#########3| 2803/3000 [3:08:38<08:59,  2.74s/it, lr: 1.0e-04 loss: 1.404e-02]mindexpander_qwen_v1:  93%|#########3| 2803/3000 [3:08:38<08:59,  2.74s/it, lr: 1.0e-04 loss: 1.404e-02]mindexpander_qwen_v1:  93%|#########3| 2803/3000 [3:08:42<08:59,  2.74s/it, lr: 1.0e-04 loss: 1.628e-01]mindexpander_qwen_v1:  93%|#########3| 2803/3000 [3:08:42<08:59,  2.74s/it, lr: 1.0e-04 loss: 1.628e-01]mindexpander_qwen_v1:  93%|#########3| 2804/3000 [3:08:42<09:48,  3.00s/it, lr: 1.0e-04 loss: 1.628e-01]mindexpander_qwen_v1:  93%|#########3| 2804/3000 [3:08:42<09:48,  3.00s/it, lr: 1.0e-04 loss: 1.628e-01]mindexpander_qwen_v1:  93%|#########3| 2804/3000 [3:08:45<09:48,  3.00s/it, lr: 1.0e-04 loss: 1.112e-01]mindexpander_qwen_v1:  93%|#########3| 2804/3000 [3:08:45<09:48,  3.00s/it, lr: 1.0e-04 loss: 1.112e-01]mindexpander_qwen_v1:  94%|#########3| 2805/3000 [3:08:45<10:24,  3.20s/it, lr: 1.0e-04 loss: 1.112e-01]mindexpander_qwen_v1:  94%|#########3| 2805/3000 [3:08:45<10:24,  3.20s/it, lr: 1.0e-04 loss: 1.112e-01]mindexpander_qwen_v1:  94%|#########3| 2805/3000 [3:08:51<10:24,  3.20s/it, lr: 1.0e-04 loss: 1.521e-01]mindexpander_qwen_v1:  94%|#########3| 2805/3000 [3:08:51<10:24,  3.20s/it, lr: 1.0e-04 loss: 1.521e-01]mindexpander_qwen_v1:  94%|#########3| 2806/3000 [3:08:51<12:46,  3.95s/it, lr: 1.0e-04 loss: 1.521e-01]mindexpander_qwen_v1:  94%|#########3| 2806/3000 [3:08:51<12:46,  3.95s/it, lr: 1.0e-04 loss: 1.521e-01]mindexpander_qwen_v1:  94%|#########3| 2806/3000 [3:08:54<12:46,  3.95s/it, lr: 1.0e-04 loss: 1.683e-01]mindexpander_qwen_v1:  94%|#########3| 2806/3000 [3:08:54<12:46,  3.95s/it, lr: 1.0e-04 loss: 1.683e-01]mindexpander_qwen_v1:  94%|#########3| 2807/3000 [3:08:54<11:18,  3.51s/it, lr: 1.0e-04 loss: 1.683e-01]mindexpander_qwen_v1:  94%|#########3| 2807/3000 [3:08:54<11:18,  3.51s/it, lr: 1.0e-04 loss: 1.683e-01]mindexpander_qwen_v1:  94%|#########3| 2807/3000 [3:08:57<11:18,  3.51s/it, lr: 1.0e-04 loss: 5.499e-02]mindexpander_qwen_v1:  94%|#########3| 2807/3000 [3:08:57<11:18,  3.51s/it, lr: 1.0e-04 loss: 5.499e-02]mindexpander_qwen_v1:  94%|#########3| 2808/3000 [3:08:57<11:25,  3.57s/it, lr: 1.0e-04 loss: 5.499e-02]mindexpander_qwen_v1:  94%|#########3| 2808/3000 [3:08:57<11:25,  3.57s/it, lr: 1.0e-04 loss: 5.499e-02]mindexpander_qwen_v1:  94%|#########3| 2808/3000 [3:09:03<11:25,  3.57s/it, lr: 1.0e-04 loss: 4.706e-02]mindexpander_qwen_v1:  94%|#########3| 2808/3000 [3:09:03<11:25,  3.57s/it, lr: 1.0e-04 loss: 4.706e-02]mindexpander_qwen_v1:  94%|#########3| 2809/3000 [3:09:03<13:22,  4.20s/it, lr: 1.0e-04 loss: 4.706e-02]mindexpander_qwen_v1:  94%|#########3| 2809/3000 [3:09:03<13:22,  4.20s/it, lr: 1.0e-04 loss: 4.706e-02]mindexpander_qwen_v1:  94%|#########3| 2809/3000 [3:09:07<13:22,  4.20s/it, lr: 1.0e-04 loss: 3.146e-02]mindexpander_qwen_v1:  94%|#########3| 2809/3000 [3:09:07<13:22,  4.20s/it, lr: 1.0e-04 loss: 3.146e-02]mindexpander_qwen_v1:  94%|#########3| 2810/3000 [3:09:13<13:17,  4.20s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  94%|#########3| 2810/3000 [3:09:13<13:17,  4.20s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  94%|#########3| 2811/3000 [3:09:13<11:17,  3.58s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  94%|#########3| 2811/3000 [3:09:13<11:17,  3.58s/it, lr: 1.0e-04 loss: 1.084e-01]mindexpander_qwen_v1:  94%|#########3| 2811/3000 [3:09:16<11:17,  3.58s/it, lr: 1.0e-04 loss: 1.255e-01]mindexpander_qwen_v1:  94%|#########3| 2811/3000 [3:09:16<11:17,  3.58s/it, lr: 1.0e-04 loss: 1.255e-01]mindexpander_qwen_v1:  94%|#########3| 2812/3000 [3:09:16<11:19,  3.62s/it, lr: 1.0e-04 loss: 1.255e-01]mindexpander_qwen_v1:  94%|#########3| 2812/3000 [3:09:16<11:19,  3.62s/it, lr: 1.0e-04 loss: 1.255e-01]mindexpander_qwen_v1:  94%|#########3| 2812/3000 [3:09:22<11:19,  3.62s/it, lr: 1.0e-04 loss: 4.165e-02]mindexpander_qwen_v1:  94%|#########3| 2812/3000 [3:09:22<11:19,  3.62s/it, lr: 1.0e-04 loss: 4.165e-02]mindexpander_qwen_v1:  94%|#########3| 2813/3000 [3:09:22<12:57,  4.16s/it, lr: 1.0e-04 loss: 4.165e-02]mindexpander_qwen_v1:  94%|#########3| 2813/3000 [3:09:22<12:57,  4.16s/it, lr: 1.0e-04 loss: 4.165e-02]mindexpander_qwen_v1:  94%|#########3| 2813/3000 [3:09:28<12:57,  4.16s/it, lr: 1.0e-04 loss: 5.152e-02]mindexpander_qwen_v1:  94%|#########3| 2813/3000 [3:09:28<12:57,  4.16s/it, lr: 1.0e-04 loss: 5.152e-02]mindexpander_qwen_v1:  94%|#########3| 2814/3000 [3:09:28<14:18,  4.61s/it, lr: 1.0e-04 loss: 5.152e-02]mindexpander_qwen_v1:  94%|#########3| 2814/3000 [3:09:28<14:18,  4.61s/it, lr: 1.0e-04 loss: 5.152e-02]mindexpander_qwen_v1:  94%|#########3| 2814/3000 [3:09:30<14:18,  4.61s/it, lr: 1.0e-04 loss: 1.442e-02]mindexpander_qwen_v1:  94%|#########3| 2814/3000 [3:09:30<14:18,  4.61s/it, lr: 1.0e-04 loss: 1.442e-02]mindexpander_qwen_v1:  94%|#########3| 2815/3000 [3:09:30<12:21,  4.01s/it, lr: 1.0e-04 loss: 1.442e-02]mindexpander_qwen_v1:  94%|#########3| 2815/3000 [3:09:30<12:21,  4.01s/it, lr: 1.0e-04 loss: 1.442e-02]mindexpander_qwen_v1:  94%|#########3| 2815/3000 [3:09:34<12:21,  4.01s/it, lr: 1.0e-04 loss: 3.104e-02]mindexpander_qwen_v1:  94%|#########3| 2815/3000 [3:09:34<12:21,  4.01s/it, lr: 1.0e-04 loss: 3.104e-02]mindexpander_qwen_v1:  94%|#########3| 2816/3000 [3:09:34<12:01,  3.92s/it, lr: 1.0e-04 loss: 3.104e-02]mindexpander_qwen_v1:  94%|#########3| 2816/3000 [3:09:34<12:01,  3.92s/it, lr: 1.0e-04 loss: 3.104e-02]mindexpander_qwen_v1:  94%|#########3| 2816/3000 [3:09:38<12:01,  3.92s/it, lr: 1.0e-04 loss: 3.139e-03]mindexpander_qwen_v1:  94%|#########3| 2816/3000 [3:09:38<12:01,  3.92s/it, lr: 1.0e-04 loss: 3.139e-03]mindexpander_qwen_v1:  94%|#########3| 2817/3000 [3:09:38<11:46,  3.86s/it, lr: 1.0e-04 loss: 3.139e-03]mindexpander_qwen_v1:  94%|#########3| 2817/3000 [3:09:38<11:46,  3.86s/it, lr: 1.0e-04 loss: 3.139e-03]mindexpander_qwen_v1:  94%|#########3| 2817/3000 [3:09:40<11:46,  3.86s/it, lr: 1.0e-04 loss: 5.010e-02]mindexpander_qwen_v1:  94%|#########3| 2817/3000 [3:09:40<11:46,  3.86s/it, lr: 1.0e-04 loss: 5.010e-02]mindexpander_qwen_v1:  94%|#########3| 2818/3000 [3:09:40<10:36,  3.50s/it, lr: 1.0e-04 loss: 5.010e-02]mindexpander_qwen_v1:  94%|#########3| 2818/3000 [3:09:40<10:36,  3.50s/it, lr: 1.0e-04 loss: 5.010e-02]mindexpander_qwen_v1:  94%|#########3| 2818/3000 [3:09:46<10:36,  3.50s/it, lr: 1.0e-04 loss: 4.077e-02]mindexpander_qwen_v1:  94%|#########3| 2818/3000 [3:09:46<10:36,  3.50s/it, lr: 1.0e-04 loss: 4.077e-02]mindexpander_qwen_v1:  94%|#########3| 2819/3000 [3:09:46<12:29,  4.14s/it, lr: 1.0e-04 loss: 4.077e-02]mindexpander_qwen_v1:  94%|#########3| 2819/3000 [3:09:46<12:29,  4.14s/it, lr: 1.0e-04 loss: 4.077e-02]mindexpander_qwen_v1:  94%|#########3| 2819/3000 [3:09:52<12:29,  4.14s/it, lr: 1.0e-04 loss: 1.496e-01]mindexpander_qwen_v1:  94%|#########3| 2819/3000 [3:09:52<12:29,  4.14s/it, lr: 1.0e-04 loss: 1.496e-01]mindexpander_qwen_v1:  94%|#########3| 2820/3000 [3:09:58<12:25,  4.14s/it, lr: 1.0e-04 loss: 7.320e-02]mindexpander_qwen_v1:  94%|#########3| 2820/3000 [3:09:58<12:25,  4.14s/it, lr: 1.0e-04 loss: 7.320e-02]mindexpander_qwen_v1:  94%|#########4| 2821/3000 [3:09:58<10:36,  3.56s/it, lr: 1.0e-04 loss: 7.320e-02]mindexpander_qwen_v1:  94%|#########4| 2821/3000 [3:09:58<10:36,  3.56s/it, lr: 1.0e-04 loss: 7.320e-02]mindexpander_qwen_v1:  94%|#########4| 2821/3000 [3:10:04<10:36,  3.56s/it, lr: 1.0e-04 loss: 1.123e-02]mindexpander_qwen_v1:  94%|#########4| 2821/3000 [3:10:04<10:36,  3.56s/it, lr: 1.0e-04 loss: 1.123e-02]mindexpander_qwen_v1:  94%|#########4| 2822/3000 [3:10:04<12:18,  4.15s/it, lr: 1.0e-04 loss: 1.123e-02]mindexpander_qwen_v1:  94%|#########4| 2822/3000 [3:10:04<12:18,  4.15s/it, lr: 1.0e-04 loss: 1.123e-02]mindexpander_qwen_v1:  94%|#########4| 2822/3000 [3:10:06<12:18,  4.15s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  94%|#########4| 2822/3000 [3:10:06<12:18,  4.15s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  94%|#########4| 2823/3000 [3:10:06<10:55,  3.70s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  94%|#########4| 2823/3000 [3:10:06<10:55,  3.70s/it, lr: 1.0e-04 loss: 1.648e-01]mindexpander_qwen_v1:  94%|#########4| 2823/3000 [3:10:09<10:55,  3.70s/it, lr: 1.0e-04 loss: 1.469e-01]mindexpander_qwen_v1:  94%|#########4| 2823/3000 [3:10:09<10:55,  3.70s/it, lr: 1.0e-04 loss: 1.469e-01]mindexpander_qwen_v1:  94%|#########4| 2824/3000 [3:10:09<09:52,  3.36s/it, lr: 1.0e-04 loss: 1.469e-01]mindexpander_qwen_v1:  94%|#########4| 2824/3000 [3:10:09<09:52,  3.36s/it, lr: 1.0e-04 loss: 1.469e-01]mindexpander_qwen_v1:  94%|#########4| 2824/3000 [3:10:11<09:52,  3.36s/it, lr: 1.0e-04 loss: 4.104e-02]mindexpander_qwen_v1:  94%|#########4| 2824/3000 [3:10:11<09:52,  3.36s/it, lr: 1.0e-04 loss: 4.104e-02]mindexpander_qwen_v1:  94%|#########4| 2825/3000 [3:10:11<09:04,  3.11s/it, lr: 1.0e-04 loss: 4.104e-02]mindexpander_qwen_v1:  94%|#########4| 2825/3000 [3:10:11<09:04,  3.11s/it, lr: 1.0e-04 loss: 4.104e-02]mindexpander_qwen_v1:  94%|#########4| 2825/3000 [3:10:17<09:04,  3.11s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  94%|#########4| 2825/3000 [3:10:17<09:04,  3.11s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  94%|#########4| 2826/3000 [3:10:17<11:17,  3.89s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  94%|#########4| 2826/3000 [3:10:17<11:17,  3.89s/it, lr: 1.0e-04 loss: 1.710e-01]mindexpander_qwen_v1:  94%|#########4| 2826/3000 [3:10:21<11:17,  3.89s/it, lr: 1.0e-04 loss: 1.578e-01]mindexpander_qwen_v1:  94%|#########4| 2826/3000 [3:10:21<11:17,  3.89s/it, lr: 1.0e-04 loss: 1.578e-01]mindexpander_qwen_v1:  94%|#########4| 2827/3000 [3:10:21<11:05,  3.85s/it, lr: 1.0e-04 loss: 1.578e-01]mindexpander_qwen_v1:  94%|#########4| 2827/3000 [3:10:21<11:05,  3.85s/it, lr: 1.0e-04 loss: 1.578e-01]mindexpander_qwen_v1:  94%|#########4| 2827/3000 [3:10:26<11:05,  3.85s/it, lr: 1.0e-04 loss: 1.474e-02]mindexpander_qwen_v1:  94%|#########4| 2827/3000 [3:10:26<11:05,  3.85s/it, lr: 1.0e-04 loss: 1.474e-02]mindexpander_qwen_v1:  94%|#########4| 2828/3000 [3:10:26<12:35,  4.39s/it, lr: 1.0e-04 loss: 1.474e-02]mindexpander_qwen_v1:  94%|#########4| 2828/3000 [3:10:26<12:35,  4.39s/it, lr: 1.0e-04 loss: 1.474e-02]mindexpander_qwen_v1:  94%|#########4| 2828/3000 [3:10:29<12:35,  4.39s/it, lr: 1.0e-04 loss: 2.730e-02]mindexpander_qwen_v1:  94%|#########4| 2828/3000 [3:10:29<12:35,  4.39s/it, lr: 1.0e-04 loss: 2.730e-02]mindexpander_qwen_v1:  94%|#########4| 2829/3000 [3:10:29<10:53,  3.82s/it, lr: 1.0e-04 loss: 2.730e-02]mindexpander_qwen_v1:  94%|#########4| 2829/3000 [3:10:29<10:53,  3.82s/it, lr: 1.0e-04 loss: 2.730e-02]mindexpander_qwen_v1:  94%|#########4| 2829/3000 [3:10:33<10:53,  3.82s/it, lr: 1.0e-04 loss: 1.016e-01]mindexpander_qwen_v1:  94%|#########4| 2829/3000 [3:10:33<10:53,  3.82s/it, lr: 1.0e-04 loss: 1.016e-01]mindexpander_qwen_v1:  94%|#########4| 2830/3000 [3:10:39<10:49,  3.82s/it, lr: 1.0e-04 loss: 5.510e-02]mindexpander_qwen_v1:  94%|#########4| 2830/3000 [3:10:39<10:49,  3.82s/it, lr: 1.0e-04 loss: 5.510e-02]mindexpander_qwen_v1:  94%|#########4| 2831/3000 [3:10:39<09:33,  3.40s/it, lr: 1.0e-04 loss: 5.510e-02]mindexpander_qwen_v1:  94%|#########4| 2831/3000 [3:10:39<09:33,  3.40s/it, lr: 1.0e-04 loss: 5.510e-02]mindexpander_qwen_v1:  94%|#########4| 2831/3000 [3:10:41<09:33,  3.40s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  94%|#########4| 2831/3000 [3:10:41<09:33,  3.40s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  94%|#########4| 2832/3000 [3:10:41<09:03,  3.24s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  94%|#########4| 2832/3000 [3:10:41<09:03,  3.24s/it, lr: 1.0e-04 loss: 1.830e-01]mindexpander_qwen_v1:  94%|#########4| 2832/3000 [3:10:47<09:03,  3.24s/it, lr: 1.0e-04 loss: 3.125e-02]mindexpander_qwen_v1:  94%|#########4| 2832/3000 [3:10:47<09:03,  3.24s/it, lr: 1.0e-04 loss: 3.125e-02]mindexpander_qwen_v1:  94%|#########4| 2833/3000 [3:10:47<11:04,  3.98s/it, lr: 1.0e-04 loss: 3.125e-02]mindexpander_qwen_v1:  94%|#########4| 2833/3000 [3:10:47<11:04,  3.98s/it, lr: 1.0e-04 loss: 3.125e-02]mindexpander_qwen_v1:  94%|#########4| 2833/3000 [3:10:51<11:04,  3.98s/it, lr: 1.0e-04 loss: 1.131e-02]mindexpander_qwen_v1:  94%|#########4| 2833/3000 [3:10:51<11:04,  3.98s/it, lr: 1.0e-04 loss: 1.131e-02]mindexpander_qwen_v1:  94%|#########4| 2834/3000 [3:10:51<10:57,  3.96s/it, lr: 1.0e-04 loss: 1.131e-02]mindexpander_qwen_v1:  94%|#########4| 2834/3000 [3:10:51<10:57,  3.96s/it, lr: 1.0e-04 loss: 1.131e-02]mindexpander_qwen_v1:  94%|#########4| 2834/3000 [3:10:55<10:57,  3.96s/it, lr: 1.0e-04 loss: 7.353e-02]mindexpander_qwen_v1:  94%|#########4| 2834/3000 [3:10:55<10:57,  3.96s/it, lr: 1.0e-04 loss: 7.353e-02]mindexpander_qwen_v1:  94%|#########4| 2835/3000 [3:10:55<10:42,  3.89s/it, lr: 1.0e-04 loss: 7.353e-02]mindexpander_qwen_v1:  94%|#########4| 2835/3000 [3:10:55<10:42,  3.89s/it, lr: 1.0e-04 loss: 7.353e-02]mindexpander_qwen_v1:  94%|#########4| 2835/3000 [3:11:01<10:42,  3.89s/it, lr: 1.0e-04 loss: 6.122e-02]mindexpander_qwen_v1:  94%|#########4| 2835/3000 [3:11:01<10:42,  3.89s/it, lr: 1.0e-04 loss: 6.122e-02]mindexpander_qwen_v1:  95%|#########4| 2836/3000 [3:11:01<12:03,  4.41s/it, lr: 1.0e-04 loss: 6.122e-02]mindexpander_qwen_v1:  95%|#########4| 2836/3000 [3:11:01<12:03,  4.41s/it, lr: 1.0e-04 loss: 6.122e-02]mindexpander_qwen_v1:  95%|#########4| 2836/3000 [3:11:06<12:03,  4.41s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  95%|#########4| 2836/3000 [3:11:06<12:03,  4.41s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  95%|#########4| 2837/3000 [3:11:06<12:59,  4.78s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  95%|#########4| 2837/3000 [3:11:06<12:59,  4.78s/it, lr: 1.0e-04 loss: 1.816e-01]mindexpander_qwen_v1:  95%|#########4| 2837/3000 [3:11:10<12:59,  4.78s/it, lr: 1.0e-04 loss: 1.004e-01]mindexpander_qwen_v1:  95%|#########4| 2837/3000 [3:11:10<12:59,  4.78s/it, lr: 1.0e-04 loss: 1.004e-01]mindexpander_qwen_v1:  95%|#########4| 2838/3000 [3:11:10<12:13,  4.52s/it, lr: 1.0e-04 loss: 1.004e-01]mindexpander_qwen_v1:  95%|#########4| 2838/3000 [3:11:10<12:13,  4.52s/it, lr: 1.0e-04 loss: 1.004e-01]mindexpander_qwen_v1:  95%|#########4| 2838/3000 [3:11:13<12:13,  4.52s/it, lr: 1.0e-04 loss: 9.258e-02]mindexpander_qwen_v1:  95%|#########4| 2838/3000 [3:11:13<12:13,  4.52s/it, lr: 1.0e-04 loss: 9.258e-02]mindexpander_qwen_v1:  95%|#########4| 2839/3000 [3:11:13<10:30,  3.91s/it, lr: 1.0e-04 loss: 9.258e-02]mindexpander_qwen_v1:  95%|#########4| 2839/3000 [3:11:13<10:30,  3.91s/it, lr: 1.0e-04 loss: 9.258e-02]mindexpander_qwen_v1:  95%|#########4| 2839/3000 [3:11:16<10:30,  3.91s/it, lr: 1.0e-04 loss: 2.878e-03]mindexpander_qwen_v1:  95%|#########4| 2839/3000 [3:11:16<10:30,  3.91s/it, lr: 1.0e-04 loss: 2.878e-03]mindexpander_qwen_v1:  95%|#########4| 2840/3000 [3:11:19<10:26,  3.91s/it, lr: 1.0e-04 loss: 3.627e-02]mindexpander_qwen_v1:  95%|#########4| 2840/3000 [3:11:19<10:26,  3.91s/it, lr: 1.0e-04 loss: 3.627e-02]mindexpander_qwen_v1:  95%|#########4| 2841/3000 [3:11:19<07:06,  2.68s/it, lr: 1.0e-04 loss: 3.627e-02]mindexpander_qwen_v1:  95%|#########4| 2841/3000 [3:11:19<07:06,  2.68s/it, lr: 1.0e-04 loss: 3.627e-02]mindexpander_qwen_v1:  95%|#########4| 2841/3000 [3:11:22<07:06,  2.68s/it, lr: 1.0e-04 loss: 4.603e-02]mindexpander_qwen_v1:  95%|#########4| 2841/3000 [3:11:22<07:06,  2.68s/it, lr: 1.0e-04 loss: 4.603e-02]mindexpander_qwen_v1:  95%|#########4| 2842/3000 [3:11:22<07:02,  2.67s/it, lr: 1.0e-04 loss: 4.603e-02]mindexpander_qwen_v1:  95%|#########4| 2842/3000 [3:11:22<07:02,  2.67s/it, lr: 1.0e-04 loss: 4.603e-02]mindexpander_qwen_v1:  95%|#########4| 2842/3000 [3:11:25<07:02,  2.67s/it, lr: 1.0e-04 loss: 1.617e-01]mindexpander_qwen_v1:  95%|#########4| 2842/3000 [3:11:25<07:02,  2.67s/it, lr: 1.0e-04 loss: 1.617e-01]mindexpander_qwen_v1:  95%|#########4| 2843/3000 [3:11:25<07:42,  2.95s/it, lr: 1.0e-04 loss: 1.617e-01]mindexpander_qwen_v1:  95%|#########4| 2843/3000 [3:11:25<07:42,  2.95s/it, lr: 1.0e-04 loss: 1.617e-01]mindexpander_qwen_v1:  95%|#########4| 2843/3000 [3:11:28<07:42,  2.95s/it, lr: 1.0e-04 loss: 1.369e-01]mindexpander_qwen_v1:  95%|#########4| 2843/3000 [3:11:28<07:42,  2.95s/it, lr: 1.0e-04 loss: 1.369e-01]mindexpander_qwen_v1:  95%|#########4| 2844/3000 [3:11:28<07:18,  2.81s/it, lr: 1.0e-04 loss: 1.369e-01]mindexpander_qwen_v1:  95%|#########4| 2844/3000 [3:11:28<07:18,  2.81s/it, lr: 1.0e-04 loss: 1.369e-01]mindexpander_qwen_v1:  95%|#########4| 2844/3000 [3:11:30<07:18,  2.81s/it, lr: 1.0e-04 loss: 1.832e-01]mindexpander_qwen_v1:  95%|#########4| 2844/3000 [3:11:30<07:18,  2.81s/it, lr: 1.0e-04 loss: 1.832e-01]mindexpander_qwen_v1:  95%|#########4| 2845/3000 [3:11:30<06:59,  2.71s/it, lr: 1.0e-04 loss: 1.832e-01]mindexpander_qwen_v1:  95%|#########4| 2845/3000 [3:11:30<06:59,  2.71s/it, lr: 1.0e-04 loss: 1.832e-01]mindexpander_qwen_v1:  95%|#########4| 2845/3000 [3:11:34<06:59,  2.71s/it, lr: 1.0e-04 loss: 4.764e-02]mindexpander_qwen_v1:  95%|#########4| 2845/3000 [3:11:34<06:59,  2.71s/it, lr: 1.0e-04 loss: 4.764e-02]mindexpander_qwen_v1:  95%|#########4| 2846/3000 [3:11:34<07:48,  3.05s/it, lr: 1.0e-04 loss: 4.764e-02]mindexpander_qwen_v1:  95%|#########4| 2846/3000 [3:11:34<07:48,  3.05s/it, lr: 1.0e-04 loss: 4.764e-02]mindexpander_qwen_v1:  95%|#########4| 2846/3000 [3:11:38<07:48,  3.05s/it, lr: 1.0e-04 loss: 5.487e-02]mindexpander_qwen_v1:  95%|#########4| 2846/3000 [3:11:38<07:48,  3.05s/it, lr: 1.0e-04 loss: 5.487e-02]mindexpander_qwen_v1:  95%|#########4| 2847/3000 [3:11:38<08:15,  3.24s/it, lr: 1.0e-04 loss: 5.487e-02]mindexpander_qwen_v1:  95%|#########4| 2847/3000 [3:11:38<08:15,  3.24s/it, lr: 1.0e-04 loss: 5.487e-02]mindexpander_qwen_v1:  95%|#########4| 2847/3000 [3:11:44<08:15,  3.24s/it, lr: 1.0e-04 loss: 2.121e-02]mindexpander_qwen_v1:  95%|#########4| 2847/3000 [3:11:44<08:15,  3.24s/it, lr: 1.0e-04 loss: 2.121e-02]mindexpander_qwen_v1:  95%|#########4| 2848/3000 [3:11:44<10:02,  3.96s/it, lr: 1.0e-04 loss: 2.121e-02]mindexpander_qwen_v1:  95%|#########4| 2848/3000 [3:11:44<10:02,  3.96s/it, lr: 1.0e-04 loss: 2.121e-02]mindexpander_qwen_v1:  95%|#########4| 2848/3000 [3:11:47<10:02,  3.96s/it, lr: 1.0e-04 loss: 6.713e-02]mindexpander_qwen_v1:  95%|#########4| 2848/3000 [3:11:47<10:02,  3.96s/it, lr: 1.0e-04 loss: 6.713e-02]mindexpander_qwen_v1:  95%|#########4| 2849/3000 [3:11:47<09:48,  3.89s/it, lr: 1.0e-04 loss: 6.713e-02]mindexpander_qwen_v1:  95%|#########4| 2849/3000 [3:11:47<09:48,  3.89s/it, lr: 1.0e-04 loss: 6.713e-02]mindexpander_qwen_v1:  95%|#########4| 2849/3000 [3:11:50<09:48,  3.89s/it, lr: 1.0e-04 loss: 3.669e-02]mindexpander_qwen_v1:  95%|#########4| 2849/3000 [3:11:50<09:48,  3.89s/it, lr: 1.0e-04 loss: 3.669e-02]mindexpander_qwen_v1:  95%|#########5| 2850/3000 [3:11:56<09:44,  3.89s/it, lr: 1.0e-04 loss: 1.745e-01]mindexpander_qwen_v1:  95%|#########5| 2850/3000 [3:11:56<09:44,  3.89s/it, lr: 1.0e-04 loss: 1.745e-01]mindexpander_qwen_v1:  95%|#########5| 2851/3000 [3:11:56<08:29,  3.42s/it, lr: 1.0e-04 loss: 1.745e-01]mindexpander_qwen_v1:  95%|#########5| 2851/3000 [3:11:56<08:29,  3.42s/it, lr: 1.0e-04 loss: 1.745e-01]mindexpander_qwen_v1:  95%|#########5| 2851/3000 [3:12:02<08:29,  3.42s/it, lr: 1.0e-04 loss: 4.025e-02]mindexpander_qwen_v1:  95%|#########5| 2851/3000 [3:12:02<08:29,  3.42s/it, lr: 1.0e-04 loss: 4.025e-02]mindexpander_qwen_v1:  95%|#########5| 2852/3000 [3:12:02<09:50,  3.99s/it, lr: 1.0e-04 loss: 4.025e-02]mindexpander_qwen_v1:  95%|#########5| 2852/3000 [3:12:02<09:50,  3.99s/it, lr: 1.0e-04 loss: 4.025e-02]mindexpander_qwen_v1:  95%|#########5| 2852/3000 [3:12:06<09:50,  3.99s/it, lr: 1.0e-04 loss: 7.200e-02]mindexpander_qwen_v1:  95%|#########5| 2852/3000 [3:12:06<09:50,  3.99s/it, lr: 1.0e-04 loss: 7.200e-02]mindexpander_qwen_v1:  95%|#########5| 2853/3000 [3:12:06<09:36,  3.92s/it, lr: 1.0e-04 loss: 7.200e-02]mindexpander_qwen_v1:  95%|#########5| 2853/3000 [3:12:06<09:36,  3.92s/it, lr: 1.0e-04 loss: 7.200e-02]mindexpander_qwen_v1:  95%|#########5| 2853/3000 [3:12:08<09:36,  3.92s/it, lr: 1.0e-04 loss: 1.593e-01]mindexpander_qwen_v1:  95%|#########5| 2853/3000 [3:12:08<09:36,  3.92s/it, lr: 1.0e-04 loss: 1.593e-01]mindexpander_qwen_v1:  95%|#########5| 2854/3000 [3:12:08<08:41,  3.57s/it, lr: 1.0e-04 loss: 1.593e-01]mindexpander_qwen_v1:  95%|#########5| 2854/3000 [3:12:08<08:41,  3.57s/it, lr: 1.0e-04 loss: 1.593e-01]mindexpander_qwen_v1:  95%|#########5| 2854/3000 [3:12:14<08:41,  3.57s/it, lr: 1.0e-04 loss: 1.266e-02]mindexpander_qwen_v1:  95%|#########5| 2854/3000 [3:12:14<08:41,  3.57s/it, lr: 1.0e-04 loss: 1.266e-02]mindexpander_qwen_v1:  95%|#########5| 2855/3000 [3:12:14<10:03,  4.16s/it, lr: 1.0e-04 loss: 1.266e-02]mindexpander_qwen_v1:  95%|#########5| 2855/3000 [3:12:14<10:03,  4.16s/it, lr: 1.0e-04 loss: 1.266e-02]mindexpander_qwen_v1:  95%|#########5| 2855/3000 [3:12:16<10:03,  4.16s/it, lr: 1.0e-04 loss: 1.193e-01]mindexpander_qwen_v1:  95%|#########5| 2855/3000 [3:12:16<10:03,  4.16s/it, lr: 1.0e-04 loss: 1.193e-01]mindexpander_qwen_v1:  95%|#########5| 2856/3000 [3:12:16<08:48,  3.67s/it, lr: 1.0e-04 loss: 1.193e-01]mindexpander_qwen_v1:  95%|#########5| 2856/3000 [3:12:16<08:48,  3.67s/it, lr: 1.0e-04 loss: 1.193e-01]mindexpander_qwen_v1:  95%|#########5| 2856/3000 [3:12:20<08:48,  3.67s/it, lr: 1.0e-04 loss: 1.380e-02]mindexpander_qwen_v1:  95%|#########5| 2856/3000 [3:12:20<08:48,  3.67s/it, lr: 1.0e-04 loss: 1.380e-02]mindexpander_qwen_v1:  95%|#########5| 2857/3000 [3:12:20<08:54,  3.74s/it, lr: 1.0e-04 loss: 1.380e-02]mindexpander_qwen_v1:  95%|#########5| 2857/3000 [3:12:20<08:54,  3.74s/it, lr: 1.0e-04 loss: 1.380e-02]mindexpander_qwen_v1:  95%|#########5| 2857/3000 [3:12:26<08:54,  3.74s/it, lr: 1.0e-04 loss: 1.340e-02]mindexpander_qwen_v1:  95%|#########5| 2857/3000 [3:12:26<08:54,  3.74s/it, lr: 1.0e-04 loss: 1.340e-02]mindexpander_qwen_v1:  95%|#########5| 2858/3000 [3:12:26<10:12,  4.31s/it, lr: 1.0e-04 loss: 1.340e-02]mindexpander_qwen_v1:  95%|#########5| 2858/3000 [3:12:26<10:12,  4.31s/it, lr: 1.0e-04 loss: 1.340e-02]mindexpander_qwen_v1:  95%|#########5| 2858/3000 [3:12:28<10:12,  4.31s/it, lr: 1.0e-04 loss: 2.405e-03]mindexpander_qwen_v1:  95%|#########5| 2858/3000 [3:12:28<10:12,  4.31s/it, lr: 1.0e-04 loss: 2.405e-03]mindexpander_qwen_v1:  95%|#########5| 2859/3000 [3:12:28<08:50,  3.76s/it, lr: 1.0e-04 loss: 2.405e-03]mindexpander_qwen_v1:  95%|#########5| 2859/3000 [3:12:28<08:50,  3.76s/it, lr: 1.0e-04 loss: 2.405e-03]mindexpander_qwen_v1:  95%|#########5| 2859/3000 [3:12:31<08:50,  3.76s/it, lr: 1.0e-04 loss: 1.624e-01]mindexpander_qwen_v1:  95%|#########5| 2859/3000 [3:12:31<08:50,  3.76s/it, lr: 1.0e-04 loss: 1.624e-01]mindexpander_qwen_v1:  95%|#########5| 2860/3000 [3:12:33<08:46,  3.76s/it, lr: 1.0e-04 loss: 2.458e-02]mindexpander_qwen_v1:  95%|#########5| 2860/3000 [3:12:33<08:46,  3.76s/it, lr: 1.0e-04 loss: 2.458e-02]mindexpander_qwen_v1:  95%|#########5| 2861/3000 [3:12:33<06:06,  2.64s/it, lr: 1.0e-04 loss: 2.458e-02]mindexpander_qwen_v1:  95%|#########5| 2861/3000 [3:12:33<06:06,  2.64s/it, lr: 1.0e-04 loss: 2.458e-02]mindexpander_qwen_v1:  95%|#########5| 2861/3000 [3:12:39<06:06,  2.64s/it, lr: 1.0e-04 loss: 5.288e-02]mindexpander_qwen_v1:  95%|#########5| 2861/3000 [3:12:39<06:06,  2.64s/it, lr: 1.0e-04 loss: 5.288e-02]mindexpander_qwen_v1:  95%|#########5| 2862/3000 [3:12:39<07:48,  3.39s/it, lr: 1.0e-04 loss: 5.288e-02]mindexpander_qwen_v1:  95%|#########5| 2862/3000 [3:12:39<07:48,  3.39s/it, lr: 1.0e-04 loss: 5.288e-02]mindexpander_qwen_v1:  95%|#########5| 2862/3000 [3:12:45<07:48,  3.39s/it, lr: 1.0e-04 loss: 1.127e-02]mindexpander_qwen_v1:  95%|#########5| 2862/3000 [3:12:45<07:48,  3.39s/it, lr: 1.0e-04 loss: 1.127e-02]mindexpander_qwen_v1:  95%|#########5| 2863/3000 [3:12:45<09:07,  4.00s/it, lr: 1.0e-04 loss: 1.127e-02]mindexpander_qwen_v1:  95%|#########5| 2863/3000 [3:12:45<09:07,  4.00s/it, lr: 1.0e-04 loss: 1.127e-02]mindexpander_qwen_v1:  95%|#########5| 2863/3000 [3:12:47<09:07,  4.00s/it, lr: 1.0e-04 loss: 1.081e-01]mindexpander_qwen_v1:  95%|#########5| 2863/3000 [3:12:47<09:07,  4.00s/it, lr: 1.0e-04 loss: 1.081e-01]mindexpander_qwen_v1:  95%|#########5| 2864/3000 [3:12:47<08:06,  3.58s/it, lr: 1.0e-04 loss: 1.081e-01]mindexpander_qwen_v1:  95%|#########5| 2864/3000 [3:12:47<08:06,  3.58s/it, lr: 1.0e-04 loss: 1.081e-01]mindexpander_qwen_v1:  95%|#########5| 2864/3000 [3:12:51<08:06,  3.58s/it, lr: 1.0e-04 loss: 7.236e-02]mindexpander_qwen_v1:  95%|#########5| 2864/3000 [3:12:51<08:06,  3.58s/it, lr: 1.0e-04 loss: 7.236e-02]mindexpander_qwen_v1:  96%|#########5| 2865/3000 [3:12:51<08:15,  3.67s/it, lr: 1.0e-04 loss: 7.236e-02]mindexpander_qwen_v1:  96%|#########5| 2865/3000 [3:12:51<08:15,  3.67s/it, lr: 1.0e-04 loss: 7.236e-02]mindexpander_qwen_v1:  96%|#########5| 2865/3000 [3:12:55<08:15,  3.67s/it, lr: 1.0e-04 loss: 8.337e-02]mindexpander_qwen_v1:  96%|#########5| 2865/3000 [3:12:55<08:15,  3.67s/it, lr: 1.0e-04 loss: 8.337e-02]mindexpander_qwen_v1:  96%|#########5| 2866/3000 [3:12:55<08:14,  3.69s/it, lr: 1.0e-04 loss: 8.337e-02]mindexpander_qwen_v1:  96%|#########5| 2866/3000 [3:12:55<08:14,  3.69s/it, lr: 1.0e-04 loss: 8.337e-02]mindexpander_qwen_v1:  96%|#########5| 2866/3000 [3:13:01<08:14,  3.69s/it, lr: 1.0e-04 loss: 1.368e-01]mindexpander_qwen_v1:  96%|#########5| 2866/3000 [3:13:01<08:14,  3.69s/it, lr: 1.0e-04 loss: 1.368e-01]mindexpander_qwen_v1:  96%|#########5| 2867/3000 [3:13:01<09:28,  4.28s/it, lr: 1.0e-04 loss: 1.368e-01]mindexpander_qwen_v1:  96%|#########5| 2867/3000 [3:13:01<09:28,  4.28s/it, lr: 1.0e-04 loss: 1.368e-01]mindexpander_qwen_v1:  96%|#########5| 2867/3000 [3:13:06<09:28,  4.28s/it, lr: 1.0e-04 loss: 3.943e-02]mindexpander_qwen_v1:  96%|#########5| 2867/3000 [3:13:06<09:28,  4.28s/it, lr: 1.0e-04 loss: 3.943e-02]mindexpander_qwen_v1:  96%|#########5| 2868/3000 [3:13:06<10:20,  4.70s/it, lr: 1.0e-04 loss: 3.943e-02]mindexpander_qwen_v1:  96%|#########5| 2868/3000 [3:13:06<10:20,  4.70s/it, lr: 1.0e-04 loss: 3.943e-02]mindexpander_qwen_v1:  96%|#########5| 2868/3000 [3:13:12<10:20,  4.70s/it, lr: 1.0e-04 loss: 9.708e-02]mindexpander_qwen_v1:  96%|#########5| 2868/3000 [3:13:12<10:20,  4.70s/it, lr: 1.0e-04 loss: 9.708e-02]mindexpander_qwen_v1:  96%|#########5| 2869/3000 [3:13:12<10:59,  5.04s/it, lr: 1.0e-04 loss: 9.708e-02]mindexpander_qwen_v1:  96%|#########5| 2869/3000 [3:13:12<10:59,  5.04s/it, lr: 1.0e-04 loss: 9.708e-02]mindexpander_qwen_v1:  96%|#########5| 2869/3000 [3:13:15<10:59,  5.04s/it, lr: 1.0e-04 loss: 9.789e-02]mindexpander_qwen_v1:  96%|#########5| 2869/3000 [3:13:15<10:59,  5.04s/it, lr: 1.0e-04 loss: 9.789e-02]mindexpander_qwen_v1:  96%|#########5| 2870/3000 [3:13:17<10:54,  5.04s/it, lr: 1.0e-04 loss: 1.495e-01]mindexpander_qwen_v1:  96%|#########5| 2870/3000 [3:13:17<10:54,  5.04s/it, lr: 1.0e-04 loss: 1.495e-01]mindexpander_qwen_v1:  96%|#########5| 2871/3000 [3:13:17<07:04,  3.29s/it, lr: 1.0e-04 loss: 1.495e-01]mindexpander_qwen_v1:  96%|#########5| 2871/3000 [3:13:17<07:04,  3.29s/it, lr: 1.0e-04 loss: 1.495e-01]mindexpander_qwen_v1:  96%|#########5| 2871/3000 [3:13:21<07:04,  3.29s/it, lr: 1.0e-04 loss: 1.616e-01]mindexpander_qwen_v1:  96%|#########5| 2871/3000 [3:13:21<07:04,  3.29s/it, lr: 1.0e-04 loss: 1.616e-01]mindexpander_qwen_v1:  96%|#########5| 2872/3000 [3:13:21<07:14,  3.40s/it, lr: 1.0e-04 loss: 1.616e-01]mindexpander_qwen_v1:  96%|#########5| 2872/3000 [3:13:21<07:14,  3.40s/it, lr: 1.0e-04 loss: 1.616e-01]mindexpander_qwen_v1:  96%|#########5| 2872/3000 [3:13:25<07:14,  3.40s/it, lr: 1.0e-04 loss: 1.608e-01]mindexpander_qwen_v1:  96%|#########5| 2872/3000 [3:13:25<07:14,  3.40s/it, lr: 1.0e-04 loss: 1.608e-01]mindexpander_qwen_v1:  96%|#########5| 2873/3000 [3:13:25<07:28,  3.53s/it, lr: 1.0e-04 loss: 1.608e-01]mindexpander_qwen_v1:  96%|#########5| 2873/3000 [3:13:25<07:28,  3.53s/it, lr: 1.0e-04 loss: 1.608e-01]mindexpander_qwen_v1:  96%|#########5| 2873/3000 [3:13:28<07:28,  3.53s/it, lr: 1.0e-04 loss: 7.124e-02]mindexpander_qwen_v1:  96%|#########5| 2873/3000 [3:13:28<07:28,  3.53s/it, lr: 1.0e-04 loss: 7.124e-02]mindexpander_qwen_v1:  96%|#########5| 2874/3000 [3:13:28<07:31,  3.58s/it, lr: 1.0e-04 loss: 7.124e-02]mindexpander_qwen_v1:  96%|#########5| 2874/3000 [3:13:28<07:31,  3.58s/it, lr: 1.0e-04 loss: 7.124e-02]mindexpander_qwen_v1:  96%|#########5| 2874/3000 [3:13:32<07:31,  3.58s/it, lr: 1.0e-04 loss: 9.317e-03]mindexpander_qwen_v1:  96%|#########5| 2874/3000 [3:13:32<07:31,  3.58s/it, lr: 1.0e-04 loss: 9.317e-03]mindexpander_qwen_v1:  96%|#########5| 2875/3000 [3:13:32<07:32,  3.62s/it, lr: 1.0e-04 loss: 9.317e-03]mindexpander_qwen_v1:  96%|#########5| 2875/3000 [3:13:32<07:32,  3.62s/it, lr: 1.0e-04 loss: 9.317e-03]mindexpander_qwen_v1:  96%|#########5| 2875/3000 [3:13:36<07:32,  3.62s/it, lr: 1.0e-04 loss: 3.455e-02]mindexpander_qwen_v1:  96%|#########5| 2875/3000 [3:13:36<07:32,  3.62s/it, lr: 1.0e-04 loss: 3.455e-02]mindexpander_qwen_v1:  96%|#########5| 2876/3000 [3:13:36<07:31,  3.65s/it, lr: 1.0e-04 loss: 3.455e-02]mindexpander_qwen_v1:  96%|#########5| 2876/3000 [3:13:36<07:31,  3.65s/it, lr: 1.0e-04 loss: 3.455e-02]mindexpander_qwen_v1:  96%|#########5| 2876/3000 [3:13:38<07:31,  3.65s/it, lr: 1.0e-04 loss: 1.421e-02]mindexpander_qwen_v1:  96%|#########5| 2876/3000 [3:13:38<07:31,  3.65s/it, lr: 1.0e-04 loss: 1.421e-02]mindexpander_qwen_v1:  96%|#########5| 2877/3000 [3:13:38<06:52,  3.36s/it, lr: 1.0e-04 loss: 1.421e-02]mindexpander_qwen_v1:  96%|#########5| 2877/3000 [3:13:38<06:52,  3.36s/it, lr: 1.0e-04 loss: 1.421e-02]mindexpander_qwen_v1:  96%|#########5| 2877/3000 [3:13:44<06:52,  3.36s/it, lr: 1.0e-04 loss: 4.430e-04]mindexpander_qwen_v1:  96%|#########5| 2877/3000 [3:13:44<06:52,  3.36s/it, lr: 1.0e-04 loss: 4.430e-04]mindexpander_qwen_v1:  96%|#########5| 2878/3000 [3:13:44<08:13,  4.05s/it, lr: 1.0e-04 loss: 4.430e-04]mindexpander_qwen_v1:  96%|#########5| 2878/3000 [3:13:44<08:13,  4.05s/it, lr: 1.0e-04 loss: 4.430e-04]mindexpander_qwen_v1:  96%|#########5| 2878/3000 [3:13:48<08:13,  4.05s/it, lr: 1.0e-04 loss: 1.819e-01]mindexpander_qwen_v1:  96%|#########5| 2878/3000 [3:13:48<08:13,  4.05s/it, lr: 1.0e-04 loss: 1.819e-01]mindexpander_qwen_v1:  96%|#########5| 2879/3000 [3:13:48<07:57,  3.95s/it, lr: 1.0e-04 loss: 1.819e-01]mindexpander_qwen_v1:  96%|#########5| 2879/3000 [3:13:48<07:57,  3.95s/it, lr: 1.0e-04 loss: 1.819e-01]mindexpander_qwen_v1:  96%|#########5| 2879/3000 [3:13:54<07:57,  3.95s/it, lr: 1.0e-04 loss: 4.727e-02]mindexpander_qwen_v1:  96%|#########5| 2879/3000 [3:13:54<07:57,  3.95s/it, lr: 1.0e-04 loss: 4.727e-02]mindexpander_qwen_v1:  96%|#########6| 2880/3000 [3:14:00<07:53,  3.95s/it, lr: 1.0e-04 loss: 1.716e-01]mindexpander_qwen_v1:  96%|#########6| 2880/3000 [3:14:00<07:53,  3.95s/it, lr: 1.0e-04 loss: 1.716e-01]mindexpander_qwen_v1:  96%|#########6| 2881/3000 [3:14:00<06:56,  3.50s/it, lr: 1.0e-04 loss: 1.716e-01]mindexpander_qwen_v1:  96%|#########6| 2881/3000 [3:14:00<06:56,  3.50s/it, lr: 1.0e-04 loss: 1.716e-01]mindexpander_qwen_v1:  96%|#########6| 2881/3000 [3:14:04<06:56,  3.50s/it, lr: 1.0e-04 loss: 1.306e-01]mindexpander_qwen_v1:  96%|#########6| 2881/3000 [3:14:04<06:56,  3.50s/it, lr: 1.0e-04 loss: 1.306e-01]mindexpander_qwen_v1:  96%|#########6| 2882/3000 [3:14:04<06:59,  3.55s/it, lr: 1.0e-04 loss: 1.306e-01]mindexpander_qwen_v1:  96%|#########6| 2882/3000 [3:14:04<06:59,  3.55s/it, lr: 1.0e-04 loss: 1.306e-01]mindexpander_qwen_v1:  96%|#########6| 2882/3000 [3:14:06<06:59,  3.55s/it, lr: 1.0e-04 loss: 2.331e-02]mindexpander_qwen_v1:  96%|#########6| 2882/3000 [3:14:06<06:59,  3.55s/it, lr: 1.0e-04 loss: 2.331e-02]mindexpander_qwen_v1:  96%|#########6| 2883/3000 [3:14:06<06:21,  3.26s/it, lr: 1.0e-04 loss: 2.331e-02]mindexpander_qwen_v1:  96%|#########6| 2883/3000 [3:14:06<06:21,  3.26s/it, lr: 1.0e-04 loss: 2.331e-02]mindexpander_qwen_v1:  96%|#########6| 2883/3000 [3:14:12<06:21,  3.26s/it, lr: 1.0e-04 loss: 3.483e-02]mindexpander_qwen_v1:  96%|#########6| 2883/3000 [3:14:12<06:21,  3.26s/it, lr: 1.0e-04 loss: 3.483e-02]mindexpander_qwen_v1:  96%|#########6| 2884/3000 [3:14:12<07:35,  3.93s/it, lr: 1.0e-04 loss: 3.483e-02]mindexpander_qwen_v1:  96%|#########6| 2884/3000 [3:14:12<07:35,  3.93s/it, lr: 1.0e-04 loss: 3.483e-02]mindexpander_qwen_v1:  96%|#########6| 2884/3000 [3:14:16<07:35,  3.93s/it, lr: 1.0e-04 loss: 1.255e-01]mindexpander_qwen_v1:  96%|#########6| 2884/3000 [3:14:16<07:35,  3.93s/it, lr: 1.0e-04 loss: 1.255e-01]mindexpander_qwen_v1:  96%|#########6| 2885/3000 [3:14:16<07:30,  3.92s/it, lr: 1.0e-04 loss: 1.255e-01]mindexpander_qwen_v1:  96%|#########6| 2885/3000 [3:14:16<07:30,  3.92s/it, lr: 1.0e-04 loss: 1.255e-01]mindexpander_qwen_v1:  96%|#########6| 2885/3000 [3:14:21<07:30,  3.92s/it, lr: 1.0e-04 loss: 3.797e-02]mindexpander_qwen_v1:  96%|#########6| 2885/3000 [3:14:21<07:30,  3.92s/it, lr: 1.0e-04 loss: 3.797e-02]mindexpander_qwen_v1:  96%|#########6| 2886/3000 [3:14:21<08:25,  4.43s/it, lr: 1.0e-04 loss: 3.797e-02]mindexpander_qwen_v1:  96%|#########6| 2886/3000 [3:14:21<08:25,  4.43s/it, lr: 1.0e-04 loss: 3.797e-02]mindexpander_qwen_v1:  96%|#########6| 2886/3000 [3:14:27<08:25,  4.43s/it, lr: 1.0e-04 loss: 3.548e-02]mindexpander_qwen_v1:  96%|#########6| 2886/3000 [3:14:27<08:25,  4.43s/it, lr: 1.0e-04 loss: 3.548e-02]mindexpander_qwen_v1:  96%|#########6| 2887/3000 [3:14:27<09:02,  4.80s/it, lr: 1.0e-04 loss: 3.548e-02]mindexpander_qwen_v1:  96%|#########6| 2887/3000 [3:14:27<09:02,  4.80s/it, lr: 1.0e-04 loss: 3.548e-02]mindexpander_qwen_v1:  96%|#########6| 2887/3000 [3:14:33<09:02,  4.80s/it, lr: 1.0e-04 loss: 1.161e-01]mindexpander_qwen_v1:  96%|#########6| 2887/3000 [3:14:33<09:02,  4.80s/it, lr: 1.0e-04 loss: 1.161e-01]mindexpander_qwen_v1:  96%|#########6| 2888/3000 [3:14:33<09:28,  5.07s/it, lr: 1.0e-04 loss: 1.161e-01]mindexpander_qwen_v1:  96%|#########6| 2888/3000 [3:14:33<09:28,  5.07s/it, lr: 1.0e-04 loss: 1.161e-01]mindexpander_qwen_v1:  96%|#########6| 2888/3000 [3:14:39<09:28,  5.07s/it, lr: 1.0e-04 loss: 8.031e-02]mindexpander_qwen_v1:  96%|#########6| 2888/3000 [3:14:39<09:28,  5.07s/it, lr: 1.0e-04 loss: 8.031e-02]mindexpander_qwen_v1:  96%|#########6| 2889/3000 [3:14:39<09:49,  5.31s/it, lr: 1.0e-04 loss: 8.031e-02]mindexpander_qwen_v1:  96%|#########6| 2889/3000 [3:14:39<09:49,  5.31s/it, lr: 1.0e-04 loss: 8.031e-02]mindexpander_qwen_v1:  96%|#########6| 2889/3000 [3:14:42<09:49,  5.31s/it, lr: 1.0e-04 loss: 1.079e-02]mindexpander_qwen_v1:  96%|#########6| 2889/3000 [3:14:42<09:49,  5.31s/it, lr: 1.0e-04 loss: 1.079e-02]mindexpander_qwen_v1:  96%|#########6| 2890/3000 [3:14:48<09:43,  5.31s/it, lr: 1.0e-04 loss: 1.593e-01]mindexpander_qwen_v1:  96%|#########6| 2890/3000 [3:14:48<09:43,  5.31s/it, lr: 1.0e-04 loss: 1.593e-01]mindexpander_qwen_v1:  96%|#########6| 2891/3000 [3:14:48<07:36,  4.19s/it, lr: 1.0e-04 loss: 1.593e-01]mindexpander_qwen_v1:  96%|#########6| 2891/3000 [3:14:48<07:36,  4.19s/it, lr: 1.0e-04 loss: 1.593e-01]mindexpander_qwen_v1:  96%|#########6| 2891/3000 [3:14:52<07:36,  4.19s/it, lr: 1.0e-04 loss: 1.186e-01]mindexpander_qwen_v1:  96%|#########6| 2891/3000 [3:14:52<07:36,  4.19s/it, lr: 1.0e-04 loss: 1.186e-01]mindexpander_qwen_v1:  96%|#########6| 2892/3000 [3:14:52<07:19,  4.07s/it, lr: 1.0e-04 loss: 1.186e-01]mindexpander_qwen_v1:  96%|#########6| 2892/3000 [3:14:52<07:19,  4.07s/it, lr: 1.0e-04 loss: 1.186e-01]mindexpander_qwen_v1:  96%|#########6| 2892/3000 [3:14:54<07:19,  4.07s/it, lr: 1.0e-04 loss: 6.032e-02]mindexpander_qwen_v1:  96%|#########6| 2892/3000 [3:14:54<07:19,  4.07s/it, lr: 1.0e-04 loss: 6.032e-02]mindexpander_qwen_v1:  96%|#########6| 2893/3000 [3:14:54<06:35,  3.70s/it, lr: 1.0e-04 loss: 6.032e-02]mindexpander_qwen_v1:  96%|#########6| 2893/3000 [3:14:54<06:35,  3.70s/it, lr: 1.0e-04 loss: 6.032e-02]mindexpander_qwen_v1:  96%|#########6| 2893/3000 [3:15:00<06:35,  3.70s/it, lr: 1.0e-04 loss: 4.247e-02]mindexpander_qwen_v1:  96%|#########6| 2893/3000 [3:15:00<06:35,  3.70s/it, lr: 1.0e-04 loss: 4.247e-02]mindexpander_qwen_v1:  96%|#########6| 2894/3000 [3:15:00<07:29,  4.24s/it, lr: 1.0e-04 loss: 4.247e-02]mindexpander_qwen_v1:  96%|#########6| 2894/3000 [3:15:00<07:29,  4.24s/it, lr: 1.0e-04 loss: 4.247e-02]mindexpander_qwen_v1:  96%|#########6| 2894/3000 [3:15:04<07:29,  4.24s/it, lr: 1.0e-04 loss: 1.200e-01]mindexpander_qwen_v1:  96%|#########6| 2894/3000 [3:15:04<07:29,  4.24s/it, lr: 1.0e-04 loss: 1.200e-01]mindexpander_qwen_v1:  96%|#########6| 2895/3000 [3:15:04<07:10,  4.10s/it, lr: 1.0e-04 loss: 1.200e-01]mindexpander_qwen_v1:  96%|#########6| 2895/3000 [3:15:04<07:10,  4.10s/it, lr: 1.0e-04 loss: 1.200e-01]mindexpander_qwen_v1:  96%|#########6| 2895/3000 [3:15:08<07:10,  4.10s/it, lr: 1.0e-04 loss: 6.274e-02]mindexpander_qwen_v1:  96%|#########6| 2895/3000 [3:15:08<07:10,  4.10s/it, lr: 1.0e-04 loss: 6.274e-02]mindexpander_qwen_v1:  97%|#########6| 2896/3000 [3:15:08<06:55,  3.99s/it, lr: 1.0e-04 loss: 6.274e-02]mindexpander_qwen_v1:  97%|#########6| 2896/3000 [3:15:08<06:55,  3.99s/it, lr: 1.0e-04 loss: 6.274e-02]mindexpander_qwen_v1:  97%|#########6| 2896/3000 [3:15:10<06:55,  3.99s/it, lr: 1.0e-04 loss: 8.719e-02]mindexpander_qwen_v1:  97%|#########6| 2896/3000 [3:15:10<06:55,  3.99s/it, lr: 1.0e-04 loss: 8.719e-02]mindexpander_qwen_v1:  97%|#########6| 2897/3000 [3:15:10<06:05,  3.54s/it, lr: 1.0e-04 loss: 8.719e-02]mindexpander_qwen_v1:  97%|#########6| 2897/3000 [3:15:10<06:05,  3.54s/it, lr: 1.0e-04 loss: 8.719e-02]mindexpander_qwen_v1:  97%|#########6| 2897/3000 [3:15:13<06:05,  3.54s/it, lr: 1.0e-04 loss: 5.659e-02]mindexpander_qwen_v1:  97%|#########6| 2897/3000 [3:15:13<06:05,  3.54s/it, lr: 1.0e-04 loss: 5.659e-02]mindexpander_qwen_v1:  97%|#########6| 2898/3000 [3:15:13<05:34,  3.28s/it, lr: 1.0e-04 loss: 5.659e-02]mindexpander_qwen_v1:  97%|#########6| 2898/3000 [3:15:13<05:34,  3.28s/it, lr: 1.0e-04 loss: 5.659e-02]mindexpander_qwen_v1:  97%|#########6| 2898/3000 [3:15:15<05:34,  3.28s/it, lr: 1.0e-04 loss: 6.072e-02]mindexpander_qwen_v1:  97%|#########6| 2898/3000 [3:15:15<05:34,  3.28s/it, lr: 1.0e-04 loss: 6.072e-02]mindexpander_qwen_v1:  97%|#########6| 2899/3000 [3:15:15<05:06,  3.04s/it, lr: 1.0e-04 loss: 6.072e-02]mindexpander_qwen_v1:  97%|#########6| 2899/3000 [3:15:15<05:06,  3.04s/it, lr: 1.0e-04 loss: 6.072e-02]mindexpander_qwen_v1:  97%|#########6| 2899/3000 [3:15:18<05:06,  3.04s/it, lr: 1.0e-04 loss: 1.549e-01]mindexpander_qwen_v1:  97%|#########6| 2899/3000 [3:15:18<05:06,  3.04s/it, lr: 1.0e-04 loss: 1.549e-01]mindexpander_qwen_v1:  97%|#########6| 2900/3000 [3:15:21<05:03,  3.04s/it, lr: 1.0e-04 loss: 7.695e-02]mindexpander_qwen_v1:  97%|#########6| 2900/3000 [3:15:21<05:03,  3.04s/it, lr: 1.0e-04 loss: 7.695e-02]mindexpander_qwen_v1:  97%|#########6| 2901/3000 [3:15:21<04:07,  2.50s/it, lr: 1.0e-04 loss: 7.695e-02]mindexpander_qwen_v1:  97%|#########6| 2901/3000 [3:15:21<04:07,  2.50s/it, lr: 1.0e-04 loss: 7.695e-02]mindexpander_qwen_v1:  97%|#########6| 2901/3000 [3:15:24<04:07,  2.50s/it, lr: 1.0e-04 loss: 1.722e-01]mindexpander_qwen_v1:  97%|#########6| 2901/3000 [3:15:24<04:07,  2.50s/it, lr: 1.0e-04 loss: 1.722e-01]mindexpander_qwen_v1:  97%|#########6| 2902/3000 [3:15:24<04:08,  2.53s/it, lr: 1.0e-04 loss: 1.722e-01]mindexpander_qwen_v1:  97%|#########6| 2902/3000 [3:15:24<04:08,  2.53s/it, lr: 1.0e-04 loss: 1.722e-01]mindexpander_qwen_v1:  97%|#########6| 2902/3000 [3:15:26<04:08,  2.53s/it, lr: 1.0e-04 loss: 1.781e-01]mindexpander_qwen_v1:  97%|#########6| 2902/3000 [3:15:26<04:08,  2.53s/it, lr: 1.0e-04 loss: 1.781e-01]mindexpander_qwen_v1:  97%|#########6| 2903/3000 [3:15:26<04:03,  2.51s/it, lr: 1.0e-04 loss: 1.781e-01]mindexpander_qwen_v1:  97%|#########6| 2903/3000 [3:15:26<04:03,  2.51s/it, lr: 1.0e-04 loss: 1.781e-01]mindexpander_qwen_v1:  97%|#########6| 2903/3000 [3:15:29<04:03,  2.51s/it, lr: 1.0e-04 loss: 1.740e-01]mindexpander_qwen_v1:  97%|#########6| 2903/3000 [3:15:29<04:03,  2.51s/it, lr: 1.0e-04 loss: 1.740e-01]mindexpander_qwen_v1:  97%|#########6| 2904/3000 [3:15:29<03:58,  2.49s/it, lr: 1.0e-04 loss: 1.740e-01]mindexpander_qwen_v1:  97%|#########6| 2904/3000 [3:15:29<03:58,  2.49s/it, lr: 1.0e-04 loss: 1.740e-01]mindexpander_qwen_v1:  97%|#########6| 2904/3000 [3:15:33<03:58,  2.49s/it, lr: 1.0e-04 loss: 1.113e-01]mindexpander_qwen_v1:  97%|#########6| 2904/3000 [3:15:33<03:58,  2.49s/it, lr: 1.0e-04 loss: 1.113e-01]mindexpander_qwen_v1:  97%|#########6| 2905/3000 [3:15:33<04:33,  2.88s/it, lr: 1.0e-04 loss: 1.113e-01]mindexpander_qwen_v1:  97%|#########6| 2905/3000 [3:15:33<04:33,  2.88s/it, lr: 1.0e-04 loss: 1.113e-01]mindexpander_qwen_v1:  97%|#########6| 2905/3000 [3:15:38<04:33,  2.88s/it, lr: 1.0e-04 loss: 1.406e-02]mindexpander_qwen_v1:  97%|#########6| 2905/3000 [3:15:38<04:33,  2.88s/it, lr: 1.0e-04 loss: 1.406e-02]mindexpander_qwen_v1:  97%|#########6| 2906/3000 [3:15:38<05:46,  3.68s/it, lr: 1.0e-04 loss: 1.406e-02]mindexpander_qwen_v1:  97%|#########6| 2906/3000 [3:15:38<05:46,  3.68s/it, lr: 1.0e-04 loss: 1.406e-02]mindexpander_qwen_v1:  97%|#########6| 2906/3000 [3:15:41<05:46,  3.68s/it, lr: 1.0e-04 loss: 1.663e-01]mindexpander_qwen_v1:  97%|#########6| 2906/3000 [3:15:41<05:46,  3.68s/it, lr: 1.0e-04 loss: 1.663e-01]mindexpander_qwen_v1:  97%|#########6| 2907/3000 [3:15:41<05:09,  3.32s/it, lr: 1.0e-04 loss: 1.663e-01]mindexpander_qwen_v1:  97%|#########6| 2907/3000 [3:15:41<05:09,  3.32s/it, lr: 1.0e-04 loss: 1.663e-01]mindexpander_qwen_v1:  97%|#########6| 2907/3000 [3:15:45<05:09,  3.32s/it, lr: 1.0e-04 loss: 4.142e-02]mindexpander_qwen_v1:  97%|#########6| 2907/3000 [3:15:45<05:09,  3.32s/it, lr: 1.0e-04 loss: 4.142e-02]mindexpander_qwen_v1:  97%|#########6| 2908/3000 [3:15:45<05:16,  3.44s/it, lr: 1.0e-04 loss: 4.142e-02]mindexpander_qwen_v1:  97%|#########6| 2908/3000 [3:15:45<05:16,  3.44s/it, lr: 1.0e-04 loss: 4.142e-02]mindexpander_qwen_v1:  97%|#########6| 2908/3000 [3:15:48<05:16,  3.44s/it, lr: 1.0e-04 loss: 1.703e-01]mindexpander_qwen_v1:  97%|#########6| 2908/3000 [3:15:48<05:16,  3.44s/it, lr: 1.0e-04 loss: 1.703e-01]mindexpander_qwen_v1:  97%|#########6| 2909/3000 [3:15:48<05:25,  3.58s/it, lr: 1.0e-04 loss: 1.703e-01]mindexpander_qwen_v1:  97%|#########6| 2909/3000 [3:15:48<05:25,  3.58s/it, lr: 1.0e-04 loss: 1.703e-01]mindexpander_qwen_v1:  97%|#########6| 2909/3000 [3:15:54<05:25,  3.58s/it, lr: 1.0e-04 loss: 7.254e-03]mindexpander_qwen_v1:  97%|#########6| 2909/3000 [3:15:54<05:25,  3.58s/it, lr: 1.0e-04 loss: 7.254e-03]mindexpander_qwen_v1:  97%|#########7| 2910/3000 [3:15:57<05:21,  3.58s/it, lr: 1.0e-04 loss: 3.138e-02]mindexpander_qwen_v1:  97%|#########7| 2910/3000 [3:15:57<05:21,  3.58s/it, lr: 1.0e-04 loss: 3.138e-02]mindexpander_qwen_v1:  97%|#########7| 2911/3000 [3:15:57<03:42,  2.50s/it, lr: 1.0e-04 loss: 3.138e-02]mindexpander_qwen_v1:  97%|#########7| 2911/3000 [3:15:57<03:42,  2.50s/it, lr: 1.0e-04 loss: 3.138e-02]mindexpander_qwen_v1:  97%|#########7| 2911/3000 [3:15:59<03:42,  2.50s/it, lr: 1.0e-04 loss: 7.957e-02]mindexpander_qwen_v1:  97%|#########7| 2911/3000 [3:15:59<03:42,  2.50s/it, lr: 1.0e-04 loss: 7.957e-02]mindexpander_qwen_v1:  97%|#########7| 2912/3000 [3:15:59<03:38,  2.49s/it, lr: 1.0e-04 loss: 7.957e-02]mindexpander_qwen_v1:  97%|#########7| 2912/3000 [3:15:59<03:38,  2.49s/it, lr: 1.0e-04 loss: 7.957e-02]mindexpander_qwen_v1:  97%|#########7| 2912/3000 [3:16:02<03:38,  2.49s/it, lr: 1.0e-04 loss: 1.131e-01]mindexpander_qwen_v1:  97%|#########7| 2912/3000 [3:16:02<03:38,  2.49s/it, lr: 1.0e-04 loss: 1.131e-01]mindexpander_qwen_v1:  97%|#########7| 2913/3000 [3:16:02<03:35,  2.48s/it, lr: 1.0e-04 loss: 1.131e-01]mindexpander_qwen_v1:  97%|#########7| 2913/3000 [3:16:02<03:35,  2.48s/it, lr: 1.0e-04 loss: 1.131e-01]mindexpander_qwen_v1:  97%|#########7| 2913/3000 [3:16:06<03:35,  2.48s/it, lr: 1.0e-04 loss: 2.394e-02]mindexpander_qwen_v1:  97%|#########7| 2913/3000 [3:16:06<03:35,  2.48s/it, lr: 1.0e-04 loss: 2.394e-02]mindexpander_qwen_v1:  97%|#########7| 2914/3000 [3:16:06<04:08,  2.89s/it, lr: 1.0e-04 loss: 2.394e-02]mindexpander_qwen_v1:  97%|#########7| 2914/3000 [3:16:06<04:08,  2.89s/it, lr: 1.0e-04 loss: 2.394e-02]mindexpander_qwen_v1:  97%|#########7| 2914/3000 [3:16:08<04:08,  2.89s/it, lr: 1.0e-04 loss: 1.506e-01]mindexpander_qwen_v1:  97%|#########7| 2914/3000 [3:16:08<04:08,  2.89s/it, lr: 1.0e-04 loss: 1.506e-01]mindexpander_qwen_v1:  97%|#########7| 2915/3000 [3:16:08<03:54,  2.76s/it, lr: 1.0e-04 loss: 1.506e-01]mindexpander_qwen_v1:  97%|#########7| 2915/3000 [3:16:08<03:54,  2.76s/it, lr: 1.0e-04 loss: 1.506e-01]mindexpander_qwen_v1:  97%|#########7| 2915/3000 [3:16:14<03:54,  2.76s/it, lr: 1.0e-04 loss: 5.320e-03]mindexpander_qwen_v1:  97%|#########7| 2915/3000 [3:16:14<03:54,  2.76s/it, lr: 1.0e-04 loss: 5.320e-03]mindexpander_qwen_v1:  97%|#########7| 2916/3000 [3:16:14<05:02,  3.60s/it, lr: 1.0e-04 loss: 5.320e-03]mindexpander_qwen_v1:  97%|#########7| 2916/3000 [3:16:14<05:02,  3.60s/it, lr: 1.0e-04 loss: 5.320e-03]mindexpander_qwen_v1:  97%|#########7| 2916/3000 [3:16:20<05:02,  3.60s/it, lr: 1.0e-04 loss: 6.950e-02]mindexpander_qwen_v1:  97%|#########7| 2916/3000 [3:16:20<05:02,  3.60s/it, lr: 1.0e-04 loss: 6.950e-02]mindexpander_qwen_v1:  97%|#########7| 2917/3000 [3:16:20<05:53,  4.25s/it, lr: 1.0e-04 loss: 6.950e-02]mindexpander_qwen_v1:  97%|#########7| 2917/3000 [3:16:20<05:53,  4.25s/it, lr: 1.0e-04 loss: 6.950e-02]mindexpander_qwen_v1:  97%|#########7| 2917/3000 [3:16:26<05:53,  4.25s/it, lr: 1.0e-04 loss: 8.616e-03]mindexpander_qwen_v1:  97%|#########7| 2917/3000 [3:16:26<05:53,  4.25s/it, lr: 1.0e-04 loss: 8.616e-03]mindexpander_qwen_v1:  97%|#########7| 2918/3000 [3:16:26<06:24,  4.68s/it, lr: 1.0e-04 loss: 8.616e-03]mindexpander_qwen_v1:  97%|#########7| 2918/3000 [3:16:26<06:24,  4.68s/it, lr: 1.0e-04 loss: 8.616e-03]mindexpander_qwen_v1:  97%|#########7| 2918/3000 [3:16:29<06:24,  4.68s/it, lr: 1.0e-04 loss: 7.110e-02]mindexpander_qwen_v1:  97%|#########7| 2918/3000 [3:16:29<06:24,  4.68s/it, lr: 1.0e-04 loss: 7.110e-02]mindexpander_qwen_v1:  97%|#########7| 2919/3000 [3:16:29<05:56,  4.41s/it, lr: 1.0e-04 loss: 7.110e-02]mindexpander_qwen_v1:  97%|#########7| 2919/3000 [3:16:29<05:56,  4.41s/it, lr: 1.0e-04 loss: 7.110e-02]mindexpander_qwen_v1:  97%|#########7| 2919/3000 [3:16:35<05:56,  4.41s/it, lr: 1.0e-04 loss: 3.730e-02]mindexpander_qwen_v1:  97%|#########7| 2919/3000 [3:16:35<05:56,  4.41s/it, lr: 1.0e-04 loss: 3.730e-02]mindexpander_qwen_v1:  97%|#########7| 2920/3000 [3:16:39<05:52,  4.41s/it, lr: 1.0e-04 loss: 1.480e-02]mindexpander_qwen_v1:  97%|#########7| 2920/3000 [3:16:39<05:52,  4.41s/it, lr: 1.0e-04 loss: 1.480e-02]mindexpander_qwen_v1:  97%|#########7| 2921/3000 [3:16:39<04:19,  3.28s/it, lr: 1.0e-04 loss: 1.480e-02]mindexpander_qwen_v1:  97%|#########7| 2921/3000 [3:16:39<04:19,  3.28s/it, lr: 1.0e-04 loss: 1.480e-02]mindexpander_qwen_v1:  97%|#########7| 2921/3000 [3:16:43<04:19,  3.28s/it, lr: 1.0e-04 loss: 2.647e-02]mindexpander_qwen_v1:  97%|#########7| 2921/3000 [3:16:43<04:19,  3.28s/it, lr: 1.0e-04 loss: 2.647e-02]mindexpander_qwen_v1:  97%|#########7| 2922/3000 [3:16:43<04:24,  3.39s/it, lr: 1.0e-04 loss: 2.647e-02]mindexpander_qwen_v1:  97%|#########7| 2922/3000 [3:16:43<04:24,  3.39s/it, lr: 1.0e-04 loss: 2.647e-02]mindexpander_qwen_v1:  97%|#########7| 2922/3000 [3:16:46<04:24,  3.39s/it, lr: 1.0e-04 loss: 2.437e-02]mindexpander_qwen_v1:  97%|#########7| 2922/3000 [3:16:46<04:24,  3.39s/it, lr: 1.0e-04 loss: 2.437e-02]mindexpander_qwen_v1:  97%|#########7| 2923/3000 [3:16:46<04:27,  3.48s/it, lr: 1.0e-04 loss: 2.437e-02]mindexpander_qwen_v1:  97%|#########7| 2923/3000 [3:16:46<04:27,  3.48s/it, lr: 1.0e-04 loss: 2.437e-02]mindexpander_qwen_v1:  97%|#########7| 2923/3000 [3:16:50<04:27,  3.48s/it, lr: 1.0e-04 loss: 7.041e-02]mindexpander_qwen_v1:  97%|#########7| 2923/3000 [3:16:50<04:27,  3.48s/it, lr: 1.0e-04 loss: 7.041e-02]mindexpander_qwen_v1:  97%|#########7| 2924/3000 [3:16:50<04:29,  3.55s/it, lr: 1.0e-04 loss: 7.041e-02]mindexpander_qwen_v1:  97%|#########7| 2924/3000 [3:16:50<04:29,  3.55s/it, lr: 1.0e-04 loss: 7.041e-02]mindexpander_qwen_v1:  97%|#########7| 2924/3000 [3:16:56<04:29,  3.55s/it, lr: 1.0e-04 loss: 4.890e-02]mindexpander_qwen_v1:  97%|#########7| 2924/3000 [3:16:56<04:29,  3.55s/it, lr: 1.0e-04 loss: 4.890e-02]mindexpander_qwen_v1:  98%|#########7| 2925/3000 [3:16:56<05:14,  4.19s/it, lr: 1.0e-04 loss: 4.890e-02]mindexpander_qwen_v1:  98%|#########7| 2925/3000 [3:16:56<05:14,  4.19s/it, lr: 1.0e-04 loss: 4.890e-02]mindexpander_qwen_v1:  98%|#########7| 2925/3000 [3:16:58<05:14,  4.19s/it, lr: 1.0e-04 loss: 5.978e-03]mindexpander_qwen_v1:  98%|#########7| 2925/3000 [3:16:58<05:14,  4.19s/it, lr: 1.0e-04 loss: 5.978e-03]mindexpander_qwen_v1:  98%|#########7| 2926/3000 [3:16:58<04:33,  3.69s/it, lr: 1.0e-04 loss: 5.978e-03]mindexpander_qwen_v1:  98%|#########7| 2926/3000 [3:16:58<04:33,  3.69s/it, lr: 1.0e-04 loss: 5.978e-03]mindexpander_qwen_v1:  98%|#########7| 2926/3000 [3:17:01<04:33,  3.69s/it, lr: 1.0e-04 loss: 1.620e-02]mindexpander_qwen_v1:  98%|#########7| 2926/3000 [3:17:01<04:33,  3.69s/it, lr: 1.0e-04 loss: 1.620e-02]mindexpander_qwen_v1:  98%|#########7| 2927/3000 [3:17:01<04:02,  3.33s/it, lr: 1.0e-04 loss: 1.620e-02]mindexpander_qwen_v1:  98%|#########7| 2927/3000 [3:17:01<04:02,  3.33s/it, lr: 1.0e-04 loss: 1.620e-02]mindexpander_qwen_v1:  98%|#########7| 2927/3000 [3:17:07<04:02,  3.33s/it, lr: 1.0e-04 loss: 2.052e-02]mindexpander_qwen_v1:  98%|#########7| 2927/3000 [3:17:07<04:02,  3.33s/it, lr: 1.0e-04 loss: 2.052e-02]mindexpander_qwen_v1:  98%|#########7| 2928/3000 [3:17:07<04:50,  4.03s/it, lr: 1.0e-04 loss: 2.052e-02]mindexpander_qwen_v1:  98%|#########7| 2928/3000 [3:17:07<04:50,  4.03s/it, lr: 1.0e-04 loss: 2.052e-02]mindexpander_qwen_v1:  98%|#########7| 2928/3000 [3:17:09<04:50,  4.03s/it, lr: 1.0e-04 loss: 9.747e-02]mindexpander_qwen_v1:  98%|#########7| 2928/3000 [3:17:09<04:50,  4.03s/it, lr: 1.0e-04 loss: 9.747e-02]mindexpander_qwen_v1:  98%|#########7| 2929/3000 [3:17:09<04:16,  3.62s/it, lr: 1.0e-04 loss: 9.747e-02]mindexpander_qwen_v1:  98%|#########7| 2929/3000 [3:17:09<04:16,  3.62s/it, lr: 1.0e-04 loss: 9.747e-02]mindexpander_qwen_v1:  98%|#########7| 2929/3000 [3:17:13<04:16,  3.62s/it, lr: 1.0e-04 loss: 1.061e-01]mindexpander_qwen_v1:  98%|#########7| 2929/3000 [3:17:13<04:16,  3.62s/it, lr: 1.0e-04 loss: 1.061e-01]mindexpander_qwen_v1:  98%|#########7| 2930/3000 [3:17:19<04:13,  3.62s/it, lr: 1.0e-04 loss: 3.914e-02]mindexpander_qwen_v1:  98%|#########7| 2930/3000 [3:17:19<04:13,  3.62s/it, lr: 1.0e-04 loss: 3.914e-02]mindexpander_qwen_v1:  98%|#########7| 2931/3000 [3:17:19<03:45,  3.27s/it, lr: 1.0e-04 loss: 3.914e-02]mindexpander_qwen_v1:  98%|#########7| 2931/3000 [3:17:19<03:45,  3.27s/it, lr: 1.0e-04 loss: 3.914e-02]mindexpander_qwen_v1:  98%|#########7| 2931/3000 [3:17:21<03:45,  3.27s/it, lr: 1.0e-04 loss: 2.248e-02]mindexpander_qwen_v1:  98%|#########7| 2931/3000 [3:17:21<03:45,  3.27s/it, lr: 1.0e-04 loss: 2.248e-02]mindexpander_qwen_v1:  98%|#########7| 2932/3000 [3:17:21<03:28,  3.07s/it, lr: 1.0e-04 loss: 2.248e-02]mindexpander_qwen_v1:  98%|#########7| 2932/3000 [3:17:21<03:28,  3.07s/it, lr: 1.0e-04 loss: 2.248e-02]mindexpander_qwen_v1:  98%|#########7| 2932/3000 [3:17:25<03:28,  3.07s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  98%|#########7| 2932/3000 [3:17:25<03:28,  3.07s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  98%|#########7| 2933/3000 [3:17:25<03:40,  3.29s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  98%|#########7| 2933/3000 [3:17:25<03:40,  3.29s/it, lr: 1.0e-04 loss: 1.743e-01]mindexpander_qwen_v1:  98%|#########7| 2933/3000 [3:17:31<03:40,  3.29s/it, lr: 1.0e-04 loss: 2.884e-02]mindexpander_qwen_v1:  98%|#########7| 2933/3000 [3:17:31<03:40,  3.29s/it, lr: 1.0e-04 loss: 2.884e-02]mindexpander_qwen_v1:  98%|#########7| 2934/3000 [3:17:31<04:20,  3.95s/it, lr: 1.0e-04 loss: 2.884e-02]mindexpander_qwen_v1:  98%|#########7| 2934/3000 [3:17:31<04:20,  3.95s/it, lr: 1.0e-04 loss: 2.884e-02]mindexpander_qwen_v1:  98%|#########7| 2934/3000 [3:17:33<04:20,  3.95s/it, lr: 1.0e-04 loss: 2.873e-02]mindexpander_qwen_v1:  98%|#########7| 2934/3000 [3:17:33<04:20,  3.95s/it, lr: 1.0e-04 loss: 2.873e-02]mindexpander_qwen_v1:  98%|#########7| 2935/3000 [3:17:33<03:49,  3.54s/it, lr: 1.0e-04 loss: 2.873e-02]mindexpander_qwen_v1:  98%|#########7| 2935/3000 [3:17:33<03:49,  3.54s/it, lr: 1.0e-04 loss: 2.873e-02]mindexpander_qwen_v1:  98%|#########7| 2935/3000 [3:17:37<03:49,  3.54s/it, lr: 1.0e-04 loss: 5.811e-02]mindexpander_qwen_v1:  98%|#########7| 2935/3000 [3:17:37<03:49,  3.54s/it, lr: 1.0e-04 loss: 5.811e-02]mindexpander_qwen_v1:  98%|#########7| 2936/3000 [3:17:37<03:50,  3.60s/it, lr: 1.0e-04 loss: 5.811e-02]mindexpander_qwen_v1:  98%|#########7| 2936/3000 [3:17:37<03:50,  3.60s/it, lr: 1.0e-04 loss: 5.811e-02]mindexpander_qwen_v1:  98%|#########7| 2936/3000 [3:17:41<03:50,  3.60s/it, lr: 1.0e-04 loss: 8.143e-02]mindexpander_qwen_v1:  98%|#########7| 2936/3000 [3:17:41<03:50,  3.60s/it, lr: 1.0e-04 loss: 8.143e-02]mindexpander_qwen_v1:  98%|#########7| 2937/3000 [3:17:41<03:52,  3.69s/it, lr: 1.0e-04 loss: 8.143e-02]mindexpander_qwen_v1:  98%|#########7| 2937/3000 [3:17:41<03:52,  3.69s/it, lr: 1.0e-04 loss: 8.143e-02]mindexpander_qwen_v1:  98%|#########7| 2937/3000 [3:17:43<03:52,  3.69s/it, lr: 1.0e-04 loss: 1.567e-01]mindexpander_qwen_v1:  98%|#########7| 2937/3000 [3:17:43<03:52,  3.69s/it, lr: 1.0e-04 loss: 1.567e-01]mindexpander_qwen_v1:  98%|#########7| 2938/3000 [3:17:43<03:26,  3.33s/it, lr: 1.0e-04 loss: 1.567e-01]mindexpander_qwen_v1:  98%|#########7| 2938/3000 [3:17:43<03:26,  3.33s/it, lr: 1.0e-04 loss: 1.567e-01]mindexpander_qwen_v1:  98%|#########7| 2938/3000 [3:17:49<03:26,  3.33s/it, lr: 1.0e-04 loss: 1.418e-01]mindexpander_qwen_v1:  98%|#########7| 2938/3000 [3:17:49<03:26,  3.33s/it, lr: 1.0e-04 loss: 1.418e-01]mindexpander_qwen_v1:  98%|#########7| 2939/3000 [3:17:49<04:06,  4.04s/it, lr: 1.0e-04 loss: 1.418e-01]mindexpander_qwen_v1:  98%|#########7| 2939/3000 [3:17:49<04:06,  4.04s/it, lr: 1.0e-04 loss: 1.418e-01]mindexpander_qwen_v1:  98%|#########7| 2939/3000 [3:17:53<04:06,  4.04s/it, lr: 1.0e-04 loss: 2.602e-02]mindexpander_qwen_v1:  98%|#########7| 2939/3000 [3:17:53<04:06,  4.04s/it, lr: 1.0e-04 loss: 2.602e-02]mindexpander_qwen_v1:  98%|#########8| 2940/3000 [3:17:56<04:02,  4.04s/it, lr: 1.0e-04 loss: 5.286e-02]mindexpander_qwen_v1:  98%|#########8| 2940/3000 [3:17:56<04:02,  4.04s/it, lr: 1.0e-04 loss: 5.286e-02]mindexpander_qwen_v1:  98%|#########8| 2941/3000 [3:17:56<02:46,  2.82s/it, lr: 1.0e-04 loss: 5.286e-02]mindexpander_qwen_v1:  98%|#########8| 2941/3000 [3:17:56<02:46,  2.82s/it, lr: 1.0e-04 loss: 5.286e-02]mindexpander_qwen_v1:  98%|#########8| 2941/3000 [3:18:02<02:46,  2.82s/it, lr: 1.0e-04 loss: 1.170e-01]mindexpander_qwen_v1:  98%|#########8| 2941/3000 [3:18:02<02:46,  2.82s/it, lr: 1.0e-04 loss: 1.170e-01]mindexpander_qwen_v1:  98%|#########8| 2942/3000 [3:18:02<03:25,  3.54s/it, lr: 1.0e-04 loss: 1.170e-01]mindexpander_qwen_v1:  98%|#########8| 2942/3000 [3:18:02<03:25,  3.54s/it, lr: 1.0e-04 loss: 1.170e-01]mindexpander_qwen_v1:  98%|#########8| 2942/3000 [3:18:05<03:25,  3.54s/it, lr: 1.0e-04 loss: 7.409e-03]mindexpander_qwen_v1:  98%|#########8| 2942/3000 [3:18:05<03:25,  3.54s/it, lr: 1.0e-04 loss: 7.409e-03]mindexpander_qwen_v1:  98%|#########8| 2943/3000 [3:18:05<03:24,  3.59s/it, lr: 1.0e-04 loss: 7.409e-03]mindexpander_qwen_v1:  98%|#########8| 2943/3000 [3:18:05<03:24,  3.59s/it, lr: 1.0e-04 loss: 7.409e-03]mindexpander_qwen_v1:  98%|#########8| 2943/3000 [3:18:09<03:24,  3.59s/it, lr: 1.0e-04 loss: 1.829e-01]mindexpander_qwen_v1:  98%|#########8| 2943/3000 [3:18:09<03:24,  3.59s/it, lr: 1.0e-04 loss: 1.829e-01]mindexpander_qwen_v1:  98%|#########8| 2944/3000 [3:18:09<03:23,  3.63s/it, lr: 1.0e-04 loss: 1.829e-01]mindexpander_qwen_v1:  98%|#########8| 2944/3000 [3:18:09<03:23,  3.63s/it, lr: 1.0e-04 loss: 1.829e-01]mindexpander_qwen_v1:  98%|#########8| 2944/3000 [3:18:11<03:23,  3.63s/it, lr: 1.0e-04 loss: 9.673e-02]mindexpander_qwen_v1:  98%|#########8| 2944/3000 [3:18:11<03:23,  3.63s/it, lr: 1.0e-04 loss: 9.673e-02]mindexpander_qwen_v1:  98%|#########8| 2945/3000 [3:18:11<03:01,  3.29s/it, lr: 1.0e-04 loss: 9.673e-02]mindexpander_qwen_v1:  98%|#########8| 2945/3000 [3:18:11<03:01,  3.29s/it, lr: 1.0e-04 loss: 9.673e-02]mindexpander_qwen_v1:  98%|#########8| 2945/3000 [3:18:14<03:01,  3.29s/it, lr: 1.0e-04 loss: 6.333e-02]mindexpander_qwen_v1:  98%|#########8| 2945/3000 [3:18:14<03:01,  3.29s/it, lr: 1.0e-04 loss: 6.333e-02]mindexpander_qwen_v1:  98%|#########8| 2946/3000 [3:18:14<02:48,  3.11s/it, lr: 1.0e-04 loss: 6.333e-02]mindexpander_qwen_v1:  98%|#########8| 2946/3000 [3:18:14<02:48,  3.11s/it, lr: 1.0e-04 loss: 6.333e-02]mindexpander_qwen_v1:  98%|#########8| 2946/3000 [3:18:20<02:48,  3.11s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:  98%|#########8| 2946/3000 [3:18:20<02:48,  3.11s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:  98%|#########8| 2947/3000 [3:18:20<03:24,  3.87s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:  98%|#########8| 2947/3000 [3:18:20<03:24,  3.87s/it, lr: 1.0e-04 loss: 1.855e-01]mindexpander_qwen_v1:  98%|#########8| 2947/3000 [3:18:26<03:24,  3.87s/it, lr: 1.0e-04 loss: 4.666e-02]mindexpander_qwen_v1:  98%|#########8| 2947/3000 [3:18:26<03:24,  3.87s/it, lr: 1.0e-04 loss: 4.666e-02]mindexpander_qwen_v1:  98%|#########8| 2948/3000 [3:18:26<03:49,  4.41s/it, lr: 1.0e-04 loss: 4.666e-02]mindexpander_qwen_v1:  98%|#########8| 2948/3000 [3:18:26<03:49,  4.41s/it, lr: 1.0e-04 loss: 4.666e-02]mindexpander_qwen_v1:  98%|#########8| 2948/3000 [3:18:31<03:49,  4.41s/it, lr: 1.0e-04 loss: 3.325e-02]mindexpander_qwen_v1:  98%|#########8| 2948/3000 [3:18:31<03:49,  4.41s/it, lr: 1.0e-04 loss: 3.325e-02]mindexpander_qwen_v1:  98%|#########8| 2949/3000 [3:18:31<04:06,  4.83s/it, lr: 1.0e-04 loss: 3.325e-02]mindexpander_qwen_v1:  98%|#########8| 2949/3000 [3:18:31<04:06,  4.83s/it, lr: 1.0e-04 loss: 3.325e-02]mindexpander_qwen_v1:  98%|#########8| 2949/3000 [3:18:35<04:06,  4.83s/it, lr: 1.0e-04 loss: 1.932e-02]mindexpander_qwen_v1:  98%|#########8| 2949/3000 [3:18:35<04:06,  4.83s/it, lr: 1.0e-04 loss: 1.932e-02]mindexpander_qwen_v1:  98%|#########8| 2950/3000 [3:18:38<04:01,  4.83s/it, lr: 1.0e-04 loss: 1.080e-01]mindexpander_qwen_v1:  98%|#########8| 2950/3000 [3:18:38<04:01,  4.83s/it, lr: 1.0e-04 loss: 1.080e-01]mindexpander_qwen_v1:  98%|#########8| 2951/3000 [3:18:38<02:36,  3.19s/it, lr: 1.0e-04 loss: 1.080e-01]mindexpander_qwen_v1:  98%|#########8| 2951/3000 [3:18:38<02:36,  3.19s/it, lr: 1.0e-04 loss: 1.080e-01]mindexpander_qwen_v1:  98%|#########8| 2951/3000 [3:18:41<02:36,  3.19s/it, lr: 1.0e-04 loss: 7.414e-02]mindexpander_qwen_v1:  98%|#########8| 2951/3000 [3:18:41<02:36,  3.19s/it, lr: 1.0e-04 loss: 7.414e-02]mindexpander_qwen_v1:  98%|#########8| 2952/3000 [3:18:41<02:39,  3.32s/it, lr: 1.0e-04 loss: 7.414e-02]mindexpander_qwen_v1:  98%|#########8| 2952/3000 [3:18:41<02:39,  3.32s/it, lr: 1.0e-04 loss: 7.414e-02]mindexpander_qwen_v1:  98%|#########8| 2952/3000 [3:18:45<02:39,  3.32s/it, lr: 1.0e-04 loss: 2.758e-02]mindexpander_qwen_v1:  98%|#########8| 2952/3000 [3:18:45<02:39,  3.32s/it, lr: 1.0e-04 loss: 2.758e-02]mindexpander_qwen_v1:  98%|#########8| 2953/3000 [3:18:45<02:43,  3.47s/it, lr: 1.0e-04 loss: 2.758e-02]mindexpander_qwen_v1:  98%|#########8| 2953/3000 [3:18:45<02:43,  3.47s/it, lr: 1.0e-04 loss: 2.758e-02]mindexpander_qwen_v1:  98%|#########8| 2953/3000 [3:18:48<02:43,  3.47s/it, lr: 1.0e-04 loss: 5.321e-02]mindexpander_qwen_v1:  98%|#########8| 2953/3000 [3:18:48<02:43,  3.47s/it, lr: 1.0e-04 loss: 5.321e-02]mindexpander_qwen_v1:  98%|#########8| 2954/3000 [3:18:48<02:26,  3.19s/it, lr: 1.0e-04 loss: 5.321e-02]mindexpander_qwen_v1:  98%|#########8| 2954/3000 [3:18:48<02:26,  3.19s/it, lr: 1.0e-04 loss: 5.321e-02]mindexpander_qwen_v1:  98%|#########8| 2954/3000 [3:18:50<02:26,  3.19s/it, lr: 1.0e-04 loss: 1.774e-01]mindexpander_qwen_v1:  98%|#########8| 2954/3000 [3:18:50<02:26,  3.19s/it, lr: 1.0e-04 loss: 1.774e-01]mindexpander_qwen_v1:  98%|#########8| 2955/3000 [3:18:50<02:14,  2.98s/it, lr: 1.0e-04 loss: 1.774e-01]mindexpander_qwen_v1:  98%|#########8| 2955/3000 [3:18:50<02:14,  2.98s/it, lr: 1.0e-04 loss: 1.774e-01]mindexpander_qwen_v1:  98%|#########8| 2955/3000 [3:18:56<02:14,  2.98s/it, lr: 1.0e-04 loss: 1.010e-01]mindexpander_qwen_v1:  98%|#########8| 2955/3000 [3:18:56<02:14,  2.98s/it, lr: 1.0e-04 loss: 1.010e-01]mindexpander_qwen_v1:  99%|#########8| 2956/3000 [3:18:56<02:45,  3.76s/it, lr: 1.0e-04 loss: 1.010e-01]mindexpander_qwen_v1:  99%|#########8| 2956/3000 [3:18:56<02:45,  3.76s/it, lr: 1.0e-04 loss: 1.010e-01]mindexpander_qwen_v1:  99%|#########8| 2956/3000 [3:19:02<02:45,  3.76s/it, lr: 1.0e-04 loss: 5.202e-02]mindexpander_qwen_v1:  99%|#########8| 2956/3000 [3:19:02<02:45,  3.76s/it, lr: 1.0e-04 loss: 5.202e-02]mindexpander_qwen_v1:  99%|#########8| 2957/3000 [3:19:02<03:07,  4.36s/it, lr: 1.0e-04 loss: 5.202e-02]mindexpander_qwen_v1:  99%|#########8| 2957/3000 [3:19:02<03:07,  4.36s/it, lr: 1.0e-04 loss: 5.202e-02]mindexpander_qwen_v1:  99%|#########8| 2957/3000 [3:19:07<03:07,  4.36s/it, lr: 1.0e-04 loss: 1.015e-01]mindexpander_qwen_v1:  99%|#########8| 2957/3000 [3:19:07<03:07,  4.36s/it, lr: 1.0e-04 loss: 1.015e-01]mindexpander_qwen_v1:  99%|#########8| 2958/3000 [3:19:07<03:19,  4.76s/it, lr: 1.0e-04 loss: 1.015e-01]mindexpander_qwen_v1:  99%|#########8| 2958/3000 [3:19:07<03:19,  4.76s/it, lr: 1.0e-04 loss: 1.015e-01]mindexpander_qwen_v1:  99%|#########8| 2958/3000 [3:19:11<03:19,  4.76s/it, lr: 1.0e-04 loss: 1.659e-02]mindexpander_qwen_v1:  99%|#########8| 2958/3000 [3:19:11<03:19,  4.76s/it, lr: 1.0e-04 loss: 1.659e-02]mindexpander_qwen_v1:  99%|#########8| 2959/3000 [3:19:11<03:02,  4.45s/it, lr: 1.0e-04 loss: 1.659e-02]mindexpander_qwen_v1:  99%|#########8| 2959/3000 [3:19:11<03:02,  4.45s/it, lr: 1.0e-04 loss: 1.659e-02]mindexpander_qwen_v1:  99%|#########8| 2959/3000 [3:19:17<03:02,  4.45s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  99%|#########8| 2959/3000 [3:19:17<03:02,  4.45s/it, lr: 1.0e-04 loss: 1.040e-01]mindexpander_qwen_v1:  99%|#########8| 2960/3000 [3:19:23<02:58,  4.45s/it, lr: 1.0e-04 loss: 1.803e-02]mindexpander_qwen_v1:  99%|#########8| 2960/3000 [3:19:23<02:58,  4.45s/it, lr: 1.0e-04 loss: 1.803e-02]mindexpander_qwen_v1:  99%|#########8| 2961/3000 [3:19:23<02:26,  3.76s/it, lr: 1.0e-04 loss: 1.803e-02]mindexpander_qwen_v1:  99%|#########8| 2961/3000 [3:19:23<02:26,  3.76s/it, lr: 1.0e-04 loss: 1.803e-02]mindexpander_qwen_v1:  99%|#########8| 2961/3000 [3:19:25<02:26,  3.76s/it, lr: 1.0e-04 loss: 1.068e-01]mindexpander_qwen_v1:  99%|#########8| 2961/3000 [3:19:25<02:26,  3.76s/it, lr: 1.0e-04 loss: 1.068e-01]mindexpander_qwen_v1:  99%|#########8| 2962/3000 [3:19:25<02:10,  3.43s/it, lr: 1.0e-04 loss: 1.068e-01]mindexpander_qwen_v1:  99%|#########8| 2962/3000 [3:19:25<02:10,  3.43s/it, lr: 1.0e-04 loss: 1.068e-01]mindexpander_qwen_v1:  99%|#########8| 2962/3000 [3:19:31<02:10,  3.43s/it, lr: 1.0e-04 loss: 4.931e-02]mindexpander_qwen_v1:  99%|#########8| 2962/3000 [3:19:31<02:10,  3.43s/it, lr: 1.0e-04 loss: 4.931e-02]mindexpander_qwen_v1:  99%|#########8| 2963/3000 [3:19:31<02:28,  4.03s/it, lr: 1.0e-04 loss: 4.931e-02]mindexpander_qwen_v1:  99%|#########8| 2963/3000 [3:19:31<02:28,  4.03s/it, lr: 1.0e-04 loss: 4.931e-02]mindexpander_qwen_v1:  99%|#########8| 2963/3000 [3:19:33<02:28,  4.03s/it, lr: 1.0e-04 loss: 6.687e-02]mindexpander_qwen_v1:  99%|#########8| 2963/3000 [3:19:33<02:28,  4.03s/it, lr: 1.0e-04 loss: 6.687e-02]mindexpander_qwen_v1:  99%|#########8| 2964/3000 [3:19:33<02:09,  3.60s/it, lr: 1.0e-04 loss: 6.687e-02]mindexpander_qwen_v1:  99%|#########8| 2964/3000 [3:19:33<02:09,  3.60s/it, lr: 1.0e-04 loss: 6.687e-02]mindexpander_qwen_v1:  99%|#########8| 2964/3000 [3:19:36<02:09,  3.60s/it, lr: 1.0e-04 loss: 1.908e-01]mindexpander_qwen_v1:  99%|#########8| 2964/3000 [3:19:36<02:09,  3.60s/it, lr: 1.0e-04 loss: 1.908e-01]mindexpander_qwen_v1:  99%|#########8| 2965/3000 [3:19:36<01:56,  3.33s/it, lr: 1.0e-04 loss: 1.908e-01]mindexpander_qwen_v1:  99%|#########8| 2965/3000 [3:19:36<01:56,  3.33s/it, lr: 1.0e-04 loss: 1.908e-01]mindexpander_qwen_v1:  99%|#########8| 2965/3000 [3:19:40<01:56,  3.33s/it, lr: 1.0e-04 loss: 2.140e-02]mindexpander_qwen_v1:  99%|#########8| 2965/3000 [3:19:40<01:56,  3.33s/it, lr: 1.0e-04 loss: 2.140e-02]mindexpander_qwen_v1:  99%|#########8| 2966/3000 [3:19:40<01:57,  3.44s/it, lr: 1.0e-04 loss: 2.140e-02]mindexpander_qwen_v1:  99%|#########8| 2966/3000 [3:19:40<01:57,  3.44s/it, lr: 1.0e-04 loss: 2.140e-02]mindexpander_qwen_v1:  99%|#########8| 2966/3000 [3:19:43<01:57,  3.44s/it, lr: 1.0e-04 loss: 7.752e-02]mindexpander_qwen_v1:  99%|#########8| 2966/3000 [3:19:43<01:57,  3.44s/it, lr: 1.0e-04 loss: 7.752e-02]mindexpander_qwen_v1:  99%|#########8| 2967/3000 [3:19:43<01:56,  3.53s/it, lr: 1.0e-04 loss: 7.752e-02]mindexpander_qwen_v1:  99%|#########8| 2967/3000 [3:19:43<01:56,  3.53s/it, lr: 1.0e-04 loss: 7.752e-02]mindexpander_qwen_v1:  99%|#########8| 2967/3000 [3:19:46<01:56,  3.53s/it, lr: 1.0e-04 loss: 6.303e-02]mindexpander_qwen_v1:  99%|#########8| 2967/3000 [3:19:46<01:56,  3.53s/it, lr: 1.0e-04 loss: 6.303e-02]mindexpander_qwen_v1:  99%|#########8| 2968/3000 [3:19:46<01:42,  3.21s/it, lr: 1.0e-04 loss: 6.303e-02]mindexpander_qwen_v1:  99%|#########8| 2968/3000 [3:19:46<01:42,  3.21s/it, lr: 1.0e-04 loss: 6.303e-02]mindexpander_qwen_v1:  99%|#########8| 2968/3000 [3:19:50<01:42,  3.21s/it, lr: 1.0e-04 loss: 2.887e-02]mindexpander_qwen_v1:  99%|#########8| 2968/3000 [3:19:50<01:42,  3.21s/it, lr: 1.0e-04 loss: 2.887e-02]mindexpander_qwen_v1:  99%|#########8| 2969/3000 [3:19:50<01:45,  3.41s/it, lr: 1.0e-04 loss: 2.887e-02]mindexpander_qwen_v1:  99%|#########8| 2969/3000 [3:19:50<01:45,  3.41s/it, lr: 1.0e-04 loss: 2.887e-02]mindexpander_qwen_v1:  99%|#########8| 2969/3000 [3:19:54<01:45,  3.41s/it, lr: 1.0e-04 loss: 1.837e-01]mindexpander_qwen_v1:  99%|#########8| 2969/3000 [3:19:54<01:45,  3.41s/it, lr: 1.0e-04 loss: 1.837e-01]mindexpander_qwen_v1:  99%|#########9| 2970/3000 [3:19:59<01:42,  3.41s/it, lr: 1.0e-04 loss: 6.477e-02]mindexpander_qwen_v1:  99%|#########9| 2970/3000 [3:19:59<01:42,  3.41s/it, lr: 1.0e-04 loss: 6.477e-02]mindexpander_qwen_v1:  99%|#########9| 2971/3000 [3:19:59<01:31,  3.16s/it, lr: 1.0e-04 loss: 6.477e-02]mindexpander_qwen_v1:  99%|#########9| 2971/3000 [3:19:59<01:31,  3.16s/it, lr: 1.0e-04 loss: 6.477e-02]mindexpander_qwen_v1:  99%|#########9| 2971/3000 [3:20:02<01:31,  3.16s/it, lr: 1.0e-04 loss: 3.384e-02]mindexpander_qwen_v1:  99%|#########9| 2971/3000 [3:20:02<01:31,  3.16s/it, lr: 1.0e-04 loss: 3.384e-02]mindexpander_qwen_v1:  99%|#########9| 2972/3000 [3:20:02<01:23,  2.98s/it, lr: 1.0e-04 loss: 3.384e-02]mindexpander_qwen_v1:  99%|#########9| 2972/3000 [3:20:02<01:23,  2.98s/it, lr: 1.0e-04 loss: 3.384e-02]mindexpander_qwen_v1:  99%|#########9| 2972/3000 [3:20:06<01:23,  2.98s/it, lr: 1.0e-04 loss: 7.324e-02]mindexpander_qwen_v1:  99%|#########9| 2972/3000 [3:20:06<01:23,  2.98s/it, lr: 1.0e-04 loss: 7.324e-02]mindexpander_qwen_v1:  99%|#########9| 2973/3000 [3:20:06<01:27,  3.24s/it, lr: 1.0e-04 loss: 7.324e-02]mindexpander_qwen_v1:  99%|#########9| 2973/3000 [3:20:06<01:27,  3.24s/it, lr: 1.0e-04 loss: 7.324e-02]mindexpander_qwen_v1:  99%|#########9| 2973/3000 [3:20:12<01:27,  3.24s/it, lr: 1.0e-04 loss: 1.643e-02]mindexpander_qwen_v1:  99%|#########9| 2973/3000 [3:20:12<01:27,  3.24s/it, lr: 1.0e-04 loss: 1.643e-02]mindexpander_qwen_v1:  99%|#########9| 2974/3000 [3:20:12<01:41,  3.91s/it, lr: 1.0e-04 loss: 1.643e-02]mindexpander_qwen_v1:  99%|#########9| 2974/3000 [3:20:12<01:41,  3.91s/it, lr: 1.0e-04 loss: 1.643e-02]mindexpander_qwen_v1:  99%|#########9| 2974/3000 [3:20:15<01:41,  3.91s/it, lr: 1.0e-04 loss: 1.250e-01]mindexpander_qwen_v1:  99%|#########9| 2974/3000 [3:20:15<01:41,  3.91s/it, lr: 1.0e-04 loss: 1.250e-01]mindexpander_qwen_v1:  99%|#########9| 2975/3000 [3:20:15<01:36,  3.86s/it, lr: 1.0e-04 loss: 1.250e-01]mindexpander_qwen_v1:  99%|#########9| 2975/3000 [3:20:15<01:36,  3.86s/it, lr: 1.0e-04 loss: 1.250e-01]mindexpander_qwen_v1:  99%|#########9| 2975/3000 [3:20:18<01:36,  3.86s/it, lr: 1.0e-04 loss: 4.197e-02]mindexpander_qwen_v1:  99%|#########9| 2975/3000 [3:20:18<01:36,  3.86s/it, lr: 1.0e-04 loss: 4.197e-02]mindexpander_qwen_v1:  99%|#########9| 2976/3000 [3:20:18<01:22,  3.45s/it, lr: 1.0e-04 loss: 4.197e-02]mindexpander_qwen_v1:  99%|#########9| 2976/3000 [3:20:18<01:22,  3.45s/it, lr: 1.0e-04 loss: 4.197e-02]mindexpander_qwen_v1:  99%|#########9| 2976/3000 [3:20:22<01:22,  3.45s/it, lr: 1.0e-04 loss: 9.914e-03]mindexpander_qwen_v1:  99%|#########9| 2976/3000 [3:20:22<01:22,  3.45s/it, lr: 1.0e-04 loss: 9.914e-03]mindexpander_qwen_v1:  99%|#########9| 2977/3000 [3:20:22<01:22,  3.58s/it, lr: 1.0e-04 loss: 9.914e-03]mindexpander_qwen_v1:  99%|#########9| 2977/3000 [3:20:22<01:22,  3.58s/it, lr: 1.0e-04 loss: 9.914e-03]mindexpander_qwen_v1:  99%|#########9| 2977/3000 [3:20:24<01:22,  3.58s/it, lr: 1.0e-04 loss: 2.351e-03]mindexpander_qwen_v1:  99%|#########9| 2977/3000 [3:20:24<01:22,  3.58s/it, lr: 1.0e-04 loss: 2.351e-03]mindexpander_qwen_v1:  99%|#########9| 2978/3000 [3:20:24<01:11,  3.25s/it, lr: 1.0e-04 loss: 2.351e-03]mindexpander_qwen_v1:  99%|#########9| 2978/3000 [3:20:24<01:11,  3.25s/it, lr: 1.0e-04 loss: 2.351e-03]mindexpander_qwen_v1:  99%|#########9| 2978/3000 [3:20:28<01:11,  3.25s/it, lr: 1.0e-04 loss: 1.910e-01]mindexpander_qwen_v1:  99%|#########9| 2978/3000 [3:20:28<01:11,  3.25s/it, lr: 1.0e-04 loss: 1.910e-01]mindexpander_qwen_v1:  99%|#########9| 2979/3000 [3:20:28<01:11,  3.38s/it, lr: 1.0e-04 loss: 1.910e-01]mindexpander_qwen_v1:  99%|#########9| 2979/3000 [3:20:28<01:11,  3.38s/it, lr: 1.0e-04 loss: 1.910e-01]mindexpander_qwen_v1:  99%|#########9| 2979/3000 [3:20:34<01:11,  3.38s/it, lr: 1.0e-04 loss: 1.652e-01]mindexpander_qwen_v1:  99%|#########9| 2979/3000 [3:20:34<01:11,  3.38s/it, lr: 1.0e-04 loss: 1.652e-01]mindexpander_qwen_v1:  99%|#########9| 2980/3000 [3:20:36<01:07,  3.38s/it, lr: 1.0e-04 loss: 4.261e-02]mindexpander_qwen_v1:  99%|#########9| 2980/3000 [3:20:36<01:07,  3.38s/it, lr: 1.0e-04 loss: 4.261e-02]mindexpander_qwen_v1:  99%|#########9| 2981/3000 [3:20:36<00:46,  2.44s/it, lr: 1.0e-04 loss: 4.261e-02]mindexpander_qwen_v1:  99%|#########9| 2981/3000 [3:20:36<00:46,  2.44s/it, lr: 1.0e-04 loss: 4.261e-02]mindexpander_qwen_v1:  99%|#########9| 2981/3000 [3:20:40<00:46,  2.44s/it, lr: 1.0e-04 loss: 1.488e-01]mindexpander_qwen_v1:  99%|#########9| 2981/3000 [3:20:40<00:46,  2.44s/it, lr: 1.0e-04 loss: 1.488e-01]mindexpander_qwen_v1:  99%|#########9| 2982/3000 [3:20:40<00:49,  2.75s/it, lr: 1.0e-04 loss: 1.488e-01]mindexpander_qwen_v1:  99%|#########9| 2982/3000 [3:20:40<00:49,  2.75s/it, lr: 1.0e-04 loss: 1.488e-01]mindexpander_qwen_v1:  99%|#########9| 2982/3000 [3:20:42<00:49,  2.75s/it, lr: 1.0e-04 loss: 4.688e-02]mindexpander_qwen_v1:  99%|#########9| 2982/3000 [3:20:42<00:49,  2.75s/it, lr: 1.0e-04 loss: 4.688e-02]mindexpander_qwen_v1:  99%|#########9| 2983/3000 [3:20:42<00:45,  2.67s/it, lr: 1.0e-04 loss: 4.688e-02]mindexpander_qwen_v1:  99%|#########9| 2983/3000 [3:20:42<00:45,  2.67s/it, lr: 1.0e-04 loss: 4.688e-02]mindexpander_qwen_v1:  99%|#########9| 2983/3000 [3:20:45<00:45,  2.67s/it, lr: 1.0e-04 loss: 1.105e-01]mindexpander_qwen_v1:  99%|#########9| 2983/3000 [3:20:45<00:45,  2.67s/it, lr: 1.0e-04 loss: 1.105e-01]mindexpander_qwen_v1:  99%|#########9| 2984/3000 [3:20:45<00:41,  2.61s/it, lr: 1.0e-04 loss: 1.105e-01]mindexpander_qwen_v1:  99%|#########9| 2984/3000 [3:20:45<00:41,  2.61s/it, lr: 1.0e-04 loss: 1.105e-01]mindexpander_qwen_v1:  99%|#########9| 2984/3000 [3:20:49<00:41,  2.61s/it, lr: 1.0e-04 loss: 3.185e-02]mindexpander_qwen_v1:  99%|#########9| 2984/3000 [3:20:49<00:41,  2.61s/it, lr: 1.0e-04 loss: 3.185e-02]mindexpander_qwen_v1: 100%|#########9| 2985/3000 [3:20:49<00:44,  2.97s/it, lr: 1.0e-04 loss: 3.185e-02]mindexpander_qwen_v1: 100%|#########9| 2985/3000 [3:20:49<00:44,  2.97s/it, lr: 1.0e-04 loss: 3.185e-02]mindexpander_qwen_v1: 100%|#########9| 2985/3000 [3:20:54<00:44,  2.97s/it, lr: 1.0e-04 loss: 1.640e-01]mindexpander_qwen_v1: 100%|#########9| 2985/3000 [3:20:54<00:44,  2.97s/it, lr: 1.0e-04 loss: 1.640e-01]mindexpander_qwen_v1: 100%|#########9| 2986/3000 [3:20:54<00:52,  3.75s/it, lr: 1.0e-04 loss: 1.640e-01]mindexpander_qwen_v1: 100%|#########9| 2986/3000 [3:20:54<00:52,  3.75s/it, lr: 1.0e-04 loss: 1.640e-01]mindexpander_qwen_v1: 100%|#########9| 2986/3000 [3:21:00<00:52,  3.75s/it, lr: 1.0e-04 loss: 3.418e-02]mindexpander_qwen_v1: 100%|#########9| 2986/3000 [3:21:00<00:52,  3.75s/it, lr: 1.0e-04 loss: 3.418e-02]mindexpander_qwen_v1: 100%|#########9| 2987/3000 [3:21:00<00:56,  4.32s/it, lr: 1.0e-04 loss: 3.418e-02]mindexpander_qwen_v1: 100%|#########9| 2987/3000 [3:21:00<00:56,  4.32s/it, lr: 1.0e-04 loss: 3.418e-02]mindexpander_qwen_v1: 100%|#########9| 2987/3000 [3:21:04<00:56,  4.32s/it, lr: 1.0e-04 loss: 1.112e-01]mindexpander_qwen_v1: 100%|#########9| 2987/3000 [3:21:04<00:56,  4.32s/it, lr: 1.0e-04 loss: 1.112e-01]mindexpander_qwen_v1: 100%|#########9| 2988/3000 [3:21:04<00:49,  4.14s/it, lr: 1.0e-04 loss: 1.112e-01]mindexpander_qwen_v1: 100%|#########9| 2988/3000 [3:21:04<00:49,  4.14s/it, lr: 1.0e-04 loss: 1.112e-01]mindexpander_qwen_v1: 100%|#########9| 2988/3000 [3:21:06<00:49,  4.14s/it, lr: 1.0e-04 loss: 2.233e-02]mindexpander_qwen_v1: 100%|#########9| 2988/3000 [3:21:06<00:49,  4.14s/it, lr: 1.0e-04 loss: 2.233e-02]mindexpander_qwen_v1: 100%|#########9| 2989/3000 [3:21:06<00:40,  3.64s/it, lr: 1.0e-04 loss: 2.233e-02]mindexpander_qwen_v1: 100%|#########9| 2989/3000 [3:21:06<00:40,  3.64s/it, lr: 1.0e-04 loss: 2.233e-02]mindexpander_qwen_v1: 100%|#########9| 2989/3000 [3:21:09<00:40,  3.64s/it, lr: 1.0e-04 loss: 3.390e-02]mindexpander_qwen_v1: 100%|#########9| 2989/3000 [3:21:09<00:40,  3.64s/it, lr: 1.0e-04 loss: 3.390e-02]mindexpander_qwen_v1: 100%|#########9| 2990/3000 [3:21:11<00:36,  3.64s/it, lr: 1.0e-04 loss: 1.090e-01]mindexpander_qwen_v1: 100%|#########9| 2990/3000 [3:21:11<00:36,  3.64s/it, lr: 1.0e-04 loss: 1.090e-01]mindexpander_qwen_v1: 100%|#########9| 2991/3000 [3:21:11<00:22,  2.53s/it, lr: 1.0e-04 loss: 1.090e-01]mindexpander_qwen_v1: 100%|#########9| 2991/3000 [3:21:11<00:22,  2.53s/it, lr: 1.0e-04 loss: 1.090e-01]mindexpander_qwen_v1: 100%|#########9| 2991/3000 [3:21:17<00:22,  2.53s/it, lr: 1.0e-04 loss: 7.490e-02]mindexpander_qwen_v1: 100%|#########9| 2991/3000 [3:21:17<00:22,  2.53s/it, lr: 1.0e-04 loss: 7.490e-02]mindexpander_qwen_v1: 100%|#########9| 2992/3000 [3:21:17<00:26,  3.32s/it, lr: 1.0e-04 loss: 7.490e-02]mindexpander_qwen_v1: 100%|#########9| 2992/3000 [3:21:17<00:26,  3.32s/it, lr: 1.0e-04 loss: 7.490e-02]mindexpander_qwen_v1: 100%|#########9| 2992/3000 [3:21:23<00:26,  3.32s/it, lr: 1.0e-04 loss: 1.685e-01]mindexpander_qwen_v1: 100%|#########9| 2992/3000 [3:21:23<00:26,  3.32s/it, lr: 1.0e-04 loss: 1.685e-01]mindexpander_qwen_v1: 100%|#########9| 2993/3000 [3:21:23<00:27,  3.94s/it, lr: 1.0e-04 loss: 1.685e-01]mindexpander_qwen_v1: 100%|#########9| 2993/3000 [3:21:23<00:27,  3.94s/it, lr: 1.0e-04 loss: 1.685e-01]mindexpander_qwen_v1: 100%|#########9| 2993/3000 [3:21:25<00:27,  3.94s/it, lr: 1.0e-04 loss: 1.416e-02]mindexpander_qwen_v1: 100%|#########9| 2993/3000 [3:21:25<00:27,  3.94s/it, lr: 1.0e-04 loss: 1.416e-02]mindexpander_qwen_v1: 100%|#########9| 2994/3000 [3:21:25<00:21,  3.58s/it, lr: 1.0e-04 loss: 1.416e-02]mindexpander_qwen_v1: 100%|#########9| 2994/3000 [3:21:25<00:21,  3.58s/it, lr: 1.0e-04 loss: 1.416e-02]mindexpander_qwen_v1: 100%|#########9| 2994/3000 [3:21:31<00:21,  3.58s/it, lr: 1.0e-04 loss: 1.258e-01]mindexpander_qwen_v1: 100%|#########9| 2994/3000 [3:21:31<00:21,  3.58s/it, lr: 1.0e-04 loss: 1.258e-01]mindexpander_qwen_v1: 100%|#########9| 2995/3000 [3:21:31<00:20,  4.18s/it, lr: 1.0e-04 loss: 1.258e-01]mindexpander_qwen_v1: 100%|#########9| 2995/3000 [3:21:31<00:20,  4.18s/it, lr: 1.0e-04 loss: 1.258e-01]mindexpander_qwen_v1: 100%|#########9| 2995/3000 [3:21:37<00:20,  4.18s/it, lr: 1.0e-04 loss: 4.661e-02]mindexpander_qwen_v1: 100%|#########9| 2995/3000 [3:21:37<00:20,  4.18s/it, lr: 1.0e-04 loss: 4.661e-02]mindexpander_qwen_v1: 100%|#########9| 2996/3000 [3:21:37<00:18,  4.61s/it, lr: 1.0e-04 loss: 4.661e-02]mindexpander_qwen_v1: 100%|#########9| 2996/3000 [3:21:37<00:18,  4.61s/it, lr: 1.0e-04 loss: 4.661e-02]mindexpander_qwen_v1: 100%|#########9| 2996/3000 [3:21:41<00:18,  4.61s/it, lr: 1.0e-04 loss: 6.714e-02]mindexpander_qwen_v1: 100%|#########9| 2996/3000 [3:21:41<00:18,  4.61s/it, lr: 1.0e-04 loss: 6.714e-02]mindexpander_qwen_v1: 100%|#########9| 2997/3000 [3:21:41<00:13,  4.41s/it, lr: 1.0e-04 loss: 6.714e-02]mindexpander_qwen_v1: 100%|#########9| 2997/3000 [3:21:41<00:13,  4.41s/it, lr: 1.0e-04 loss: 6.714e-02]mindexpander_qwen_v1: 100%|#########9| 2997/3000 [3:21:46<00:13,  4.41s/it, lr: 1.0e-04 loss: 1.658e-01]mindexpander_qwen_v1: 100%|#########9| 2997/3000 [3:21:46<00:13,  4.41s/it, lr: 1.0e-04 loss: 1.658e-01]mindexpander_qwen_v1: 100%|#########9| 2998/3000 [3:21:46<00:09,  4.79s/it, lr: 1.0e-04 loss: 1.658e-01]mindexpander_qwen_v1: 100%|#########9| 2998/3000 [3:21:46<00:09,  4.79s/it, lr: 1.0e-04 loss: 1.658e-01]mindexpander_qwen_v1: 100%|#########9| 2998/3000 [3:21:50<00:09,  4.79s/it, lr: 1.0e-04 loss: 1.102e-01]mindexpander_qwen_v1: 100%|#########9| 2998/3000 [3:21:50<00:09,  4.79s/it, lr: 1.0e-04 loss: 1.102e-01]mindexpander_qwen_v1: 100%|#########9| 2999/3000 [3:21:50<00:04,  4.47s/it, lr: 1.0e-04 loss: 1.102e-01]mindexpander_qwen_v1: 100%|#########9| 2999/3000 [3:21:50<00:04,  4.47s/it, lr: 1.0e-04 loss: 1.102e-01]mindexpander_qwen_v1: 100%|#########9| 2999/3000 [3:21:50<00:04,  4.04s/it, lr: 1.0e-04 loss: 1.102e-01]mindexpander_qwen_v1: 100%|#########9| 2999/3000 [3:21:50<00:04,  4.04s/it, lr: 1.0e-04 loss: 1.102e-01]
+
+Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:   0%|          | 0/2 [00:00<?, ?it/s]Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.32s/it]Generating Images:  50%|#####     | 1/2 [01:27<01:27, 87.32s/it]Generating Images: 100%|##########| 2/2 [02:54<00:00, 87.29s/it]Generating Images: 100%|##########| 2/2 [02:54<00:00, 87.29s/it]                                                                                                                                
+Saved checkpoint to /app/ai-toolkit/output/mindexpander_qwen_v1/mindexpander_qwen_v1.safetensors
+Saved optimizer to /app/ai-toolkit/output/mindexpander_qwen_v1/optimizer.pt