OsaurusAI
/

Step-3.7-Flash-JANG_2L

Image-Text-to-Text

vision-language

Model card Files Files and versions

Osaurus-AI commited on 16 days ago

Commit

325c336

·

verified ·

1 Parent(s): 9933416

Update Step JANG speed proof

Files changed (1) hide show

README.md +13 -2

README.md CHANGED Viewed

@@ -42,8 +42,19 @@ Text proof:
   "prompt_tokens": 26,
   "generated_tokens": 58,
   "prefill_s": 9.161997079849243,
-  "total_s": 15.426342725753784,
-  "decode_tok_s": 9.25874836391233
 }
 ```

   "prompt_tokens": 26,
   "generated_tokens": 58,
   "prefill_s": 9.161997079849243,
+  "contains_final_4": true
+}
+```
+Speed note: short cold measurements include MLX graph/kernel compile and are not representative of steady decode. A no-wrapper warmed decode run over 32 measured tokens produced:
+```json
+{
+  "prefill_s": 9.369971990585327,
+  "warm_tokens": 4,
+  "measured_tokens": 32,
+  "decode_s": 0.7534263134002686,
+  "tok_s": 42.47263392697507
 }
 ```