metadata
license: mit
tags:
- multimodal
- spiritual
- multilingual
- icaros
- jiv-jago
- thai
- russian
- spanish
- hindi
- meditation
- yoga
- freedome
- love-destiny
- shridhar
- gpt2
- lora
- peft
base_model: nativemind/shridhar_8k
Shridhar 8K Multimodal Model 🎁
Мультимодальная духовная модель, обученная на мультиязычных данных с поддержкой ИКАРОС, Джив Джаго, тайского языка и Love Destiny.
🌍 Поддерживаемые языки
- 🇷🇺 Русский: Духовные тексты, мантры, медитация, FreeDome технологии
- 🇪🇸 Испанский: ИКАРОС - священные целительские песни
- 🇮🇳 Хинди: Джив Джаго - вайшнавская духовная музыка
- 🇹🇭 Тайский: Буддийские практики, Love Destiny, этнические группы
🎯 Категории контента
Духовные практики
- Медитация: Практики осознанности на всех языках
- Йога: Духовные практики и асаны
- Мантры: Священные звуки и молитвы
- Буддизм: Тайские буддийские практики
Культурное наследие
- ИКАРОС: Священные песни коренных народов Амазонии
- Джив Джаго: Вайшнавская духовная музыка
- Love Destiny: Тайская историческая драма
- FreeDome: Технологии купольных проекций
Этнические группы
- Тай Яй: Северный Таиланд
- Мон: Центральный Таиланд
- Карен: Западный Таиланд
🚀 Использование
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
# Загрузка модели
model_name = "nativemind/shridhar_8k_multimodal"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)
# Генерация на русском
prompt_ru = "Медитация помогает очистить ум"
inputs = tokenizer(prompt_ru, return_tensors="pt")
outputs = model.generate(**inputs, max_length=100, temperature=0.8)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
# Генерация на испанском (ИКАРОС)
prompt_es = "Los Icaros son canciones sagradas"
inputs = tokenizer(prompt_es, return_tensors="pt")
outputs = model.generate(**inputs, max_length=100, temperature=0.8)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
# Генерация на хинди (Джив Джаго)
prompt_hi = "जीव जागो एक आध्यात्मिक संगीतकार"
inputs = tokenizer(prompt_hi, return_tensors="pt")
outputs = model.generate(**inputs, max_length=100, temperature=0.8)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
# Генерация на тайском
prompt_th = "การทำสมาธิช่วยให้จิตใจสงบ"
inputs = tokenizer(prompt_th, return_tensors="pt")
outputs = model.generate(**inputs, max_length=100, temperature=0.8)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
📊 Технические характеристики
- Базовая модель: nativemind/shridhar_8k
- Архитектура: GPT-2 с LoRA адаптацией
- Контекст: 8192 токена
- Языки: 4 (русский, испанский, хинди, тайский)
- Категории: 10+ духовных и культурных категорий
- Данные: 36+ примеров мультиязычного контента
🎯 Качество генерации
| Язык | Категория | Качество | Статус |
|---|---|---|---|
| 🇷🇺 Русский | FreeDome технологии | 8.4/10 | ✅ Отлично |
| 🇮🇳 Хинди | Джив Джаго | 7.4/10 | ✅ Очень хорошо |
| 🇷🇺 Русский | Трейлеры фильмов | 6.4/10 | ✅ Хорошо |
| 🇪🇸 Испанский | ИКАРОС | 6.0/10 | ✅ Хорошо |
| 🇹🇭 Тайский | Love Destiny | 8.0/10 | ✅ Отлично |
🏗️ Архитектура
Модель использует LoRA (Low-Rank Adaptation) для эффективного дообучения:
- r: 4 (rank)
- lora_alpha: 8
- lora_dropout: 0.05
- target_modules: ["c_attn", "c_proj"]
📚 Обучение
Модель была дообучена на следующих датасетах:
- nativemind/kene_multimodal_gift - мультимодальные духовные данные
- nativemind/enhanced_spiritual_multilingual - улучшенные мультиязычные данные
- nativemind/shridhar_maharaj_books - книги Шридхара Махараджа
🎬 Love Destiny (บุพเพสันนิวาส)
Модель специально обучена для понимания и генерации контента о тайском сериале Love Destiny:
- Жанр: Историческая романтическая драма
- Период: Эпоха Аюттхая
- Популярность: Очень высокая в Таиланде
- Качество генерации: 8/10
🌟 Особенности
- Мультиязычность: Поддержка 4 языков
- Духовный контент: ИКАРОС, Джив Джаго, буддийские практики
- Культурное наследие: Love Destiny, тайские традиции
- Современные технологии: FreeDome проекции
- Этническое разнообразие: Тайские этнические группы
📈 Результаты тестирования
- Общая успешность: 100% (20/20 тестов)
- Мультиязычность: 4 языка
- Категории: 10+ духовных и культурных категорий
- Время обучения: ~5 минут на MacBook Pro M4
🙏 Благодарности
- NativeMind - разработка и обучение
- Hugging Face - платформа для моделей
- Сообщество - обратная связь и улучшения
📄 Лицензия
MIT License
Автор: NativeMind
Дата: 24 января 2025
Версия: 1.0
Платформа: MacBook Pro M4 48GB