|
|
|
|
|
--- |
|
|
license: mit |
|
|
tags: |
|
|
- multimodal |
|
|
- spiritual |
|
|
- multilingual |
|
|
- icaros |
|
|
- jiv-jago |
|
|
- thai |
|
|
- russian |
|
|
- spanish |
|
|
- hindi |
|
|
- meditation |
|
|
- yoga |
|
|
- freedome |
|
|
- love-destiny |
|
|
- shridhar |
|
|
- gpt2 |
|
|
- lora |
|
|
- peft |
|
|
base_model: nativemind/shridhar_8k |
|
|
--- |
|
|
|
|
|
# Shridhar 8K Multimodal Model 🎁 |
|
|
|
|
|
Мультимодальная духовная модель, обученная на мультиязычных данных с поддержкой ИКАРОС, Джив Джаго, тайского языка и Love Destiny. |
|
|
|
|
|
## 🌍 Поддерживаемые языки |
|
|
|
|
|
- **🇷🇺 Русский**: Духовные тексты, мантры, медитация, FreeDome технологии |
|
|
- **🇪🇸 Испанский**: ИКАРОС - священные целительские песни |
|
|
- **🇮🇳 Хинди**: Джив Джаго - вайшнавская духовная музыка |
|
|
- **🇹🇭 Тайский**: Буддийские практики, Love Destiny, этнические группы |
|
|
|
|
|
## 🎯 Категории контента |
|
|
|
|
|
### Духовные практики |
|
|
- **Медитация**: Практики осознанности на всех языках |
|
|
- **Йога**: Духовные практики и асаны |
|
|
- **Мантры**: Священные звуки и молитвы |
|
|
- **Буддизм**: Тайские буддийские практики |
|
|
|
|
|
### Культурное наследие |
|
|
- **ИКАРОС**: Священные песни коренных народов Амазонии |
|
|
- **Джив Джаго**: Вайшнавская духовная музыка |
|
|
- **Love Destiny**: Тайская историческая драма |
|
|
- **FreeDome**: Технологии купольных проекций |
|
|
|
|
|
### Этнические группы |
|
|
- **Тай Яй**: Северный Таиланд |
|
|
- **Мон**: Центральный Таиланд |
|
|
- **Карен**: Западный Таиланд |
|
|
|
|
|
## 🚀 Использование |
|
|
|
|
|
```python |
|
|
from transformers import AutoTokenizer, AutoModelForCausalLM |
|
|
import torch |
|
|
|
|
|
# Загрузка модели |
|
|
model_name = "nativemind/shridhar_8k_multimodal" |
|
|
tokenizer = AutoTokenizer.from_pretrained(model_name) |
|
|
model = AutoModelForCausalLM.from_pretrained(model_name) |
|
|
|
|
|
# Генерация на русском |
|
|
prompt_ru = "Медитация помогает очистить ум" |
|
|
inputs = tokenizer(prompt_ru, return_tensors="pt") |
|
|
outputs = model.generate(**inputs, max_length=100, temperature=0.8) |
|
|
print(tokenizer.decode(outputs[0], skip_special_tokens=True)) |
|
|
|
|
|
# Генерация на испанском (ИКАРОС) |
|
|
prompt_es = "Los Icaros son canciones sagradas" |
|
|
inputs = tokenizer(prompt_es, return_tensors="pt") |
|
|
outputs = model.generate(**inputs, max_length=100, temperature=0.8) |
|
|
print(tokenizer.decode(outputs[0], skip_special_tokens=True)) |
|
|
|
|
|
# Генерация на хинди (Джив Джаго) |
|
|
prompt_hi = "जीव जागो एक आध्यात्मिक संगीतकार" |
|
|
inputs = tokenizer(prompt_hi, return_tensors="pt") |
|
|
outputs = model.generate(**inputs, max_length=100, temperature=0.8) |
|
|
print(tokenizer.decode(outputs[0], skip_special_tokens=True)) |
|
|
|
|
|
# Генерация на тайском |
|
|
prompt_th = "การทำสมาธิช่วยให้จิตใจสงบ" |
|
|
inputs = tokenizer(prompt_th, return_tensors="pt") |
|
|
outputs = model.generate(**inputs, max_length=100, temperature=0.8) |
|
|
print(tokenizer.decode(outputs[0], skip_special_tokens=True)) |
|
|
``` |
|
|
|
|
|
## 📊 Технические характеристики |
|
|
|
|
|
- **Базовая модель**: nativemind/shridhar_8k |
|
|
- **Архитектура**: GPT-2 с LoRA адаптацией |
|
|
- **Контекст**: 8192 токена |
|
|
- **Языки**: 4 (русский, испанский, хинди, тайский) |
|
|
- **Категории**: 10+ духовных и культурных категорий |
|
|
- **Данные**: 36+ примеров мультиязычного контента |
|
|
|
|
|
## 🎯 Качество генерации |
|
|
|
|
|
| Язык | Категория | Качество | Статус | |
|
|
|------|-----------|----------|--------| |
|
|
| 🇷🇺 Русский | FreeDome технологии | 8.4/10 | ✅ Отлично | |
|
|
| 🇮🇳 Хинди | Джив Джаго | 7.4/10 | ✅ Очень хорошо | |
|
|
| 🇷🇺 Русский | Трейлеры фильмов | 6.4/10 | ✅ Хорошо | |
|
|
| 🇪🇸 Испанский | ИКАРОС | 6.0/10 | ✅ Хорошо | |
|
|
| 🇹🇭 Тайский | Love Destiny | 8.0/10 | ✅ Отлично | |
|
|
|
|
|
## 🏗️ Архитектура |
|
|
|
|
|
Модель использует LoRA (Low-Rank Adaptation) для эффективного дообучения: |
|
|
|
|
|
- **r**: 4 (rank) |
|
|
- **lora_alpha**: 8 |
|
|
- **lora_dropout**: 0.05 |
|
|
- **target_modules**: ["c_attn", "c_proj"] |
|
|
|
|
|
## 📚 Обучение |
|
|
|
|
|
Модель была дообучена на следующих датасетах: |
|
|
|
|
|
1. **nativemind/kene_multimodal_gift** - мультимодальные духовные данные |
|
|
2. **nativemind/enhanced_spiritual_multilingual** - улучшенные мультиязычные данные |
|
|
3. **nativemind/shridhar_maharaj_books** - книги Шридхара Махараджа |
|
|
|
|
|
## 🎬 Love Destiny (บุพเพสันนิวาส) |
|
|
|
|
|
Модель специально обучена для понимания и генерации контента о тайском сериале Love Destiny: |
|
|
|
|
|
- **Жанр**: Историческая романтическая драма |
|
|
- **Период**: Эпоха Аюттхая |
|
|
- **Популярность**: Очень высокая в Таиланде |
|
|
- **Качество генерации**: 8/10 |
|
|
|
|
|
## 🌟 Особенности |
|
|
|
|
|
- **Мультиязычность**: Поддержка 4 языков |
|
|
- **Духовный контент**: ИКАРОС, Джив Джаго, буддийские практики |
|
|
- **Культурное наследие**: Love Destiny, тайские традиции |
|
|
- **Современные технологии**: FreeDome проекции |
|
|
- **Этническое разнообразие**: Тайские этнические группы |
|
|
|
|
|
## 📈 Результаты тестирования |
|
|
|
|
|
- **Общая успешность**: 100% (20/20 тестов) |
|
|
- **Мультиязычность**: 4 языка |
|
|
- **Категории**: 10+ духовных и культурных категорий |
|
|
- **Время обучения**: ~5 минут на MacBook Pro M4 |
|
|
|
|
|
## 🙏 Благодарности |
|
|
|
|
|
- **NativeMind** - разработка и обучение |
|
|
- **Hugging Face** - платформа для моделей |
|
|
- **Сообщество** - обратная связь и улучшения |
|
|
|
|
|
## 📄 Лицензия |
|
|
|
|
|
MIT License |
|
|
|
|
|
--- |
|
|
|
|
|
**Автор**: NativeMind |
|
|
**Дата**: 24 января 2025 |
|
|
**Версия**: 1.0 |
|
|
**Платформа**: MacBook Pro M4 48GB |
|
|
|