IndoBERT Emotion Classification (5-Class)

Model ini merupakan hasil fine-tuning dari indobenchmark/indobert-base-p1 untuk tugas klasifikasi emosi dalam Bahasa Indonesia, dengan 5 label emosi: love, happiness, anger, fear, dan sadness.

🧠 Dataset

Model ini dilatih menggunakan PRDECT-ID Dataset, yaitu kumpulan ulasan produk berbahasa Indonesia dari e-commerce Tokopedia, yang sudah dianotasi dengan label emosi oleh ahli psikologi klinis.

  • 29 kategori produk
  • Anotasi emosi oleh tim profesional
  • Setiap entri memiliki 1 label emosi

πŸ›  Fine-tuning Details

  • Base model: indobenchmark/indobert-base-p1
  • Training epochs: 5 dari total 10 (early stopping dengan load_best_model_at_end=True)
  • Batch size: 8
  • Learning rate: 2e-5
  • Weight decay: 0.05
  • Validation strategy: per epoch
  • Evaluation metric: eval_accuracy (dengan greater_is_better=True)
  • Cross-validation: Stratified K-Fold (n_splits=5)

Eval Results (Best Model @ Epoch 3)

Metric Value
Accuracy 0.7167
F1 Score 0.7125
Precision 0.7179
Recall 0.7167
Eval Loss 0.7614

πŸš€ How to Use

from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline

model = AutoModelForSequenceClassification.from_pretrained("galennolan/indobert-b-p1-indoemotion-5class")
tokenizer = AutoTokenizer.from_pretrained("galennolan/indobert-b-p1-indoemotion-5class")

emotion_classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)

emotion_classifier("Produk ini bikin aku senang banget!")
Downloads last month
3
Safetensors
Model size
0.1B params
Tensor type
F32
Β·
Inference Providers NEW
This model isn't deployed by any Inference Provider. πŸ™‹ Ask for provider support

Model tree for galennolan/indobert-b-p1-indoemotion-5class

Finetuned
(94)
this model

Space using galennolan/indobert-b-p1-indoemotion-5class 1

Collection including galennolan/indobert-b-p1-indoemotion-5class

Evaluation results