INSAIT-Institute
/

BgGPT-Gemma-2-2.6B-IT-v1.0

Text Generation

text-generation-inference

Model card Files Files and versions

lordjimen commited on Nov 29, 2024

Commit

a5b6fb8

·

verified ·

1 Parent(s): 87def42

Update README.md

Files changed (1) hide show

README.md +0 -26

README.md CHANGED Viewed

@@ -131,32 +131,6 @@ print(tokenizer.decode(outputs[0]))
 **Important Note:** Models based on Gemma 2 such as BgGPT-Gemma-2-2.6B-IT-v1.0 do not support flash attention. Using it results in degraded performance.
-```python
-tokenizer = AutoTokenizer.from_pretrained(
-    "INSAIT-Institute/BgGPT-Gemma-2-27B-IT-v1.0",
-    use_default_system_prompt=False,
-)
-messages = [
-    {"role": "user", "content": "Кога е основан Софийският университет?"},
-]
-input_ids = tokenizer.apply_chat_template(
-  messages,
-  return_tensors="pt",
-  add_generation_prompt=True,
-  return_dict=True
-)
-outputs = model.generate(
-  **input_ids,
-  generation_config=generation_params
-)
-print(tokenizer.decode(outputs[0]))
-```
-**Important Note:** Models based on Gemma 2 such as BgGPT-Gemma-2-2.6B-IT-v1.0 do not support flash attention. Using it results in degraded performance.
 # Use with vLLM
 Example usage with vLLM:

 **Important Note:** Models based on Gemma 2 such as BgGPT-Gemma-2-2.6B-IT-v1.0 do not support flash attention. Using it results in degraded performance.
 # Use with vLLM
 Example usage with vLLM: