Japan-AI-Consulting
/

Llama-3-Umievo-Shizuko-sqlcoder-2x8B

@@ -12,11 +12,7 @@ tags:
 このモデルは、MergeKitツールを使用して作成されたMixture of Experts (MoE) 言語モデルです。
-gguf版(今後拡充予定)は [こちら](https://huggingface.co/keitokei1994/Llama-3-Umievo-Shizuko-sqlcoder-2x8B-gguf) 。
-mradermacherさんがgguf形式での量子化を行ってくれました。[こちらから確認できます](https://huggingface.co/mradermacher/Llama-3-Umievo-Shizuko-sqlcoder-2x8B-GGUF)
-umiyukiさんが公開している[Llama-3-Umievo-itr014-Shizuko-8b](https://huggingface.co/umiyuki/Llama-3-Umievo-itr014-Shizuko-8b) に、SQLデータセットでファインチューニングされた[rdefog/llama-3-sqlcoder-8b](https://huggingface.co/defog/llama-3-sqlcoder-8b)を合わせることで、日本語能力とSQL生成能力を両立させようとしたMoEモデルです。
 ### モデルの詳細
@@ -28,18 +24,17 @@ umiyukiさんが公開している[Llama-3-Umievo-itr014-Shizuko-8b](https://hug
 #### 要求スペック
 Q4_K_M量子化モデルであれば、RTX3060 12GBでフルロード可能です。
-筆者はWSL2やGoogle Colaboratotry Proでの作成後、Llama.cppとLMstudioにて動作確認を行なっています。
 - CPU: Ryzen 5 3600
 - GPU: GeForce RTX 3060 12GB
 - RAM: DDR4-3200 96GB
-- OS: Windows 10
 ---
 ### Model Description
 This model is a Mixture of Experts (MoE) language model created using the MergeKit tool.
-The gguf version (planned to be expanded in the future) can be found [here](https://huggingface.co/keitokei1994/Llama-3-Umievo-Shizuko-sqlcoder-2x8B-gguf).
 This MoE model aims to achieve both Japanese language ability and SQL generation capability by combining [Llama-3-Umievo-itr014-Shizuko-8b](https://huggingface.co/umiyuki/Llama-3-Umievo-itr014-Shizuko-8b), released by umiyuki, with [rdefog/llama-3-sqlcoder-8b](https://huggingface.co/defog/llama-3-sqlcoder-8b), which has been fine-tuned on an SQL dataset.
 ### Model Details

 このモデルは、MergeKitツールを使用して作成されたMixture of Experts (MoE) 言語モデルです。
+[Llama-3-Umievo-itr014-Shizuko-8b](https://huggingface.co/umiyuki/Llama-3-Umievo-itr014-Shizuko-8b) に、SQLデータセットでファインチューニングされた[rdefog/llama-3-sqlcoder-8b](https://huggingface.co/defog/llama-3-sqlcoder-8b)を合わせることで、日本語能力とSQL生成能力を両立させようとしたMoEモデルです。
 ### モデルの詳細
 #### 要求スペック
 Q4_K_M量子化モデルであれば、RTX3060 12GBでフルロード可能です。
+WSL2やGoogle Colaboratotry Proでの作成後、Llama.cppとLMstudioにて動作確認を行なっています。
 - CPU: Ryzen 5 3600
 - GPU: GeForce RTX 3060 12GB
 - RAM: DDR4-3200 96GB
+- OS: Windows 11
 ---
 ### Model Description
 This model is a Mixture of Experts (MoE) language model created using the MergeKit tool.
 This MoE model aims to achieve both Japanese language ability and SQL generation capability by combining [Llama-3-Umievo-itr014-Shizuko-8b](https://huggingface.co/umiyuki/Llama-3-Umievo-itr014-Shizuko-8b), released by umiyuki, with [rdefog/llama-3-sqlcoder-8b](https://huggingface.co/defog/llama-3-sqlcoder-8b), which has been fine-tuned on an SQL dataset.
 ### Model Details