nampham1106
/

bkcare-embedding

@@ -8,6 +8,7 @@ tags:
 - transformers
 datasets:
 - tarudesu/ViHealthQA
 ---
 # nampham1106/bkcare-embedding
@@ -18,19 +19,24 @@ This is a [sentence-transformers](https://www.SBERT.net) model: It maps sentence
 ## Usage (Sentence-Transformers)
-Using this model becomes easy when you have [sentence-transformers](https://www.SBERT.net) installed:
-```
-pip install -U sentence-transformers
-```
 Then you can use the model like this:
 ```python
 from sentence_transformers import SentenceTransformer
-sentences = ["This is an example sentence", "Each sentence is converted"]
 model = SentenceTransformer('nampham1106/bkcare-embedding')
 embeddings = model.encode(sentences)
 print(embeddings)
 ```
@@ -43,7 +49,7 @@ Without [sentence-transformers](https://www.SBERT.net), you can use the model li
 ```python
 from transformers import AutoTokenizer, AutoModel
 import torch
 #Mean Pooling - Take attention mask into account for correct averaging
 def mean_pooling(model_output, attention_mask):
@@ -53,12 +59,13 @@ def mean_pooling(model_output, attention_mask):
 # Sentences we want sentence embeddings for
-sentences = ['This is an example sentence', 'Each sentence is converted']
 # Load model from HuggingFace Hub
 tokenizer = AutoTokenizer.from_pretrained('nampham1106/bkcare-embedding')
 model = AutoModel.from_pretrained('nampham1106/bkcare-embedding')
 # Tokenize sentences
 encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt')

 - transformers
 datasets:
 - tarudesu/ViHealthQA
+license: mit
 ---
 # nampham1106/bkcare-embedding
 ## Usage (Sentence-Transformers)
+### Installation <a name="install1"></a>
+ -  Install `sentence-transformers`:
+	- `pip install -U sentence-transformers`
+ - Install `pyvi` to word segment:
+	- `pip install pyvi`
+### Example usage <a name="usage1"></a>
 Then you can use the model like this:
 ```python
 from sentence_transformers import SentenceTransformer
+from pyvi.ViTokenizer import tokenize
+sentences = ["Đang chích ngừa viêm gan B có chích ngừa Covid-19 được không?", "Nếu anh / chị đang tiêm ngừa vaccine phòng_bệnh viêm_gan B , anh / chị vẫn có_thể tiêm phòng vaccine phòng Covid-19 , tuy_nhiên vaccine Covid-19 phải được tiêm cách trước và sau mũi vaccine viêm gan B tối_thiểu là 14 ngày ."]
 model = SentenceTransformer('nampham1106/bkcare-embedding')
+sentences = [tokenize(sentence) for sentence in sentences]
 embeddings = model.encode(sentences)
 print(embeddings)
 ```
 ```python
 from transformers import AutoTokenizer, AutoModel
 import torch
+from pyvi.ViTokenizer import tokenize
 #Mean Pooling - Take attention mask into account for correct averaging
 def mean_pooling(model_output, attention_mask):
 # Sentences we want sentence embeddings for
+sentences = ["Đang chích ngừa viêm gan B có chích ngừa Covid-19 được không?", "Nếu anh / chị đang tiêm ngừa vaccine phòng_bệnh viêm_gan B , anh / chị vẫn có_thể tiêm phòng vaccine phòng Covid-19 , tuy_nhiên vaccine Covid-19 phải được tiêm cách trước và sau mũi vaccine viêm gan B tối_thiểu là 14 ngày ."]
 # Load model from HuggingFace Hub
 tokenizer = AutoTokenizer.from_pretrained('nampham1106/bkcare-embedding')
 model = AutoModel.from_pretrained('nampham1106/bkcare-embedding')
+sentences = [tokenize(sentence) for sentence in sentences]
 # Tokenize sentences
 encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt')