📄 PhoBERT Vietnamese Comment Classifier (4-class)
Đây là mô hình phân loại bình luận tiếng Việt thành 4 nhãn cảm xúc sử dụng vinai/phobert-base.
🍿️ Các nhãn phân loại
positive– tích cựcnegative– tiêu cựcneutral– trung lậptoxic– kích động, phản cảm
🧠 Mô hình nền
- Base model:
vinai/phobert-base - Fine-tuned trên dataset
vanhai123/vietnamese-social-commentsgồm 4,896 bình luận từ TikTok, Facebook, YouTube.
🧪 Kết quả đánh giá
- Accuracy: 86%
- Macro F1-score: 83%
💻 Sử dụng
from transformers import pipeline
classifier = pipeline("text-classification", model="vanhai123/phobert-vi-comment-4class")
classifier("Video này thật sự rất bổ ích và thú vị!")
📾 Dataset
👤 Tác giả
- Hà Văn Hải – [email protected]
- Hugging Face: vanhai123
- Downloads last month
- 46
Dataset used to train vanhai123/phobert-vi-comment-4class
Space using vanhai123/phobert-vi-comment-4class 1
Evaluation results
- accuracy on Vietnamese Social Commentsself-reported0.860
- f1_macro on Vietnamese Social Commentsself-reported0.830