Upload folder using huggingface_hub

Browse files

Files changed (5) hide show

README.md +15 -19
config.json +366 -0
model_b4_s256.rknn +1 -1
model_b4_s512.rknn +1 -1
rknn/model_w8a8.rknn +2 -2

README.md CHANGED Viewed

@@ -8,6 +8,8 @@ tags:
 - rk-transformers
 - rk3588
 license: apache-2.0
 model_name: bert-base-uncased
 base_model: google-bert/bert-base-uncased
 library_name: rk-transformers
@@ -23,7 +25,7 @@ library_name: rk-transformers
 - **Original Model:** [google-bert/bert-base-uncased](https://huggingface.co/google-bert/bert-base-uncased)
 - **Target Platform:** rk3588
 - **rknn-toolkit2 Version:** 2.3.2
-- **rk-transformers Version:** 0.1.0
 ### Available Model Files
@@ -42,40 +44,32 @@ library_name: rk-transformers
 ### Installation
-Install `rk-transformers` to use this model:
 ```bash
-pip install rk-transformers
 ```
-#### RKTransformers API
 ```python
-from rktransformers import RKRTModelForFeatureExtraction
 from transformers import AutoTokenizer
-# Load tokenizer and model
 tokenizer = AutoTokenizer.from_pretrained("rk-transformers/bert-base-uncased")
-model = RKRTModelForFeatureExtraction.from_pretrained(
     "rk-transformers/bert-base-uncased",
     platform="rk3588",
     core_mask="auto",
 )
-# Tokenize and run inference
-inputs = tokenizer(
-    ["Sample text for encoding"],
-    padding="max_length",
-    max_length=256,
-    truncation=True,
-    return_tensors="np"
-)
 outputs = model(**inputs)
-print(outputs.shape)
 # Load specific optimized/quantized model file
-model = RKRTModelForFeatureExtraction.from_pretrained(
     "rk-transformers/bert-base-uncased",
     platform="rk3588",
     file_name="rknn/model_w8a8.rknn"
@@ -84,10 +78,12 @@ model = RKRTModelForFeatureExtraction.from_pretrained(
 ## Configuration
-The full configuration for all exported RKNN models is available in the [rknn.json](./rknn.json) file.
 </details>
 # BERT base model (uncased)
 Pretrained model on English language using a masked language modeling (MLM) objective. It was introduced in

 - rk-transformers
 - rk3588
 license: apache-2.0
+datasets:
+- sentence-transformers/natural-questions
 model_name: bert-base-uncased
 base_model: google-bert/bert-base-uncased
 library_name: rk-transformers
 - **Original Model:** [google-bert/bert-base-uncased](https://huggingface.co/google-bert/bert-base-uncased)
 - **Target Platform:** rk3588
 - **rknn-toolkit2 Version:** 2.3.2
+- **rk-transformers Version:** 0.3.0
 ### Available Model Files
 ### Installation
+Install `rk-transformers` with inference dependencies to use this model:
 ```bash
+pip install rk-transformers[inference]
 ```
+#### RK-Transformers API
 ```python
+from rktransformers import RKModelForMaskedLM
 from transformers import AutoTokenizer
 tokenizer = AutoTokenizer.from_pretrained("rk-transformers/bert-base-uncased")
+model = RKModelForMaskedLM.from_pretrained(
     "rk-transformers/bert-base-uncased",
     platform="rk3588",
     core_mask="auto",
 )
+inputs = tokenizer("The capital of France is [MASK].", return_tensors="np")
 outputs = model(**inputs)
+logits = outputs.logits
+print(logits.shape)
 # Load specific optimized/quantized model file
+model = RKModelForMaskedLM.from_pretrained(
     "rk-transformers/bert-base-uncased",
     platform="rk3588",
     file_name="rknn/model_w8a8.rknn"
 ## Configuration
+The full configuration for all exported RKNN models is available in the [config.json](./config.json) file.
 </details>
+---
 # BERT base model (uncased)
 Pretrained model on English language using a masked language modeling (MLM) objective. It was introduced in

config.json CHANGED Viewed

@@ -17,6 +17,372 @@
   "num_hidden_layers": 12,
   "pad_token_id": 0,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
   "transformers_version": "4.55.4",
   "type_vocab_size": 2,

   "num_hidden_layers": 12,
   "pad_token_id": 0,
   "position_embedding_type": "absolute",
+  "rknn": {
+    "model.rknn": {
+      "batch_size": 1,
+      "custom_string": null,
+      "dynamic_input": null,
+      "float_dtype": "float16",
+      "inputs_yuv_fmt": null,
+      "max_seq_length": 512,
+      "mean_values": null,
+      "model_input_names": [
+        "input_ids",
+        "attention_mask",
+        "token_type_ids"
+      ],
+      "opset": 19,
+      "optimization": {
+        "compress_weight": false,
+        "enable_flash_attention": true,
+        "model_pruning": false,
+        "optimization_level": 0,
+        "remove_reshape": false,
+        "remove_weight": false,
+        "sparse_infer": false
+      },
+      "quantization": {
+        "auto_hybrid_cos_thresh": 0.98,
+        "auto_hybrid_euc_thresh": null,
+        "dataset_columns": null,
+        "dataset_name": null,
+        "dataset_size": 128,
+        "dataset_split": null,
+        "dataset_subset": null,
+        "do_quantization": false,
+        "quant_img_RGB2BGR": false,
+        "quantized_algorithm": "normal",
+        "quantized_dtype": "w8a8",
+        "quantized_hybrid_level": 0,
+        "quantized_method": "channel"
+      },
+      "rktransformers_version": "0.3.0",
+      "single_core_mode": false,
+      "std_values": null,
+      "target_platform": "rk3588",
+      "task": "auto",
+      "task_kwargs": null
+    },
+    "model_b1_s256.rknn": {
+      "batch_size": 1,
+      "custom_string": null,
+      "dynamic_input": null,
+      "float_dtype": "float16",
+      "inputs_yuv_fmt": null,
+      "max_seq_length": 256,
+      "mean_values": null,
+      "model_input_names": [
+        "input_ids",
+        "attention_mask",
+        "token_type_ids"
+      ],
+      "opset": 19,
+      "optimization": {
+        "compress_weight": false,
+        "enable_flash_attention": true,
+        "model_pruning": false,
+        "optimization_level": 0,
+        "remove_reshape": false,
+        "remove_weight": false,
+        "sparse_infer": false
+      },
+      "quantization": {
+        "auto_hybrid_cos_thresh": 0.98,
+        "auto_hybrid_euc_thresh": null,
+        "dataset_columns": null,
+        "dataset_name": null,
+        "dataset_size": 128,
+        "dataset_split": null,
+        "dataset_subset": null,
+        "do_quantization": false,
+        "quant_img_RGB2BGR": false,
+        "quantized_algorithm": "normal",
+        "quantized_dtype": "w8a8",
+        "quantized_hybrid_level": 0,
+        "quantized_method": "channel"
+      },
+      "rktransformers_version": "0.3.0",
+      "single_core_mode": false,
+      "std_values": null,
+      "target_platform": "rk3588",
+      "task": "auto",
+      "task_kwargs": null
+    },
+    "model_b4_s256.rknn": {
+      "batch_size": 4,
+      "custom_string": null,
+      "dynamic_input": null,
+      "float_dtype": "float16",
+      "inputs_yuv_fmt": null,
+      "max_seq_length": 256,
+      "mean_values": null,
+      "model_input_names": [
+        "input_ids",
+        "attention_mask",
+        "token_type_ids"
+      ],
+      "opset": 19,
+      "optimization": {
+        "compress_weight": false,
+        "enable_flash_attention": true,
+        "model_pruning": false,
+        "optimization_level": 0,
+        "remove_reshape": false,
+        "remove_weight": false,
+        "sparse_infer": false
+      },
+      "quantization": {
+        "auto_hybrid_cos_thresh": 0.98,
+        "auto_hybrid_euc_thresh": null,
+        "dataset_columns": null,
+        "dataset_name": null,
+        "dataset_size": 128,
+        "dataset_split": null,
+        "dataset_subset": null,
+        "do_quantization": false,
+        "quant_img_RGB2BGR": false,
+        "quantized_algorithm": "normal",
+        "quantized_dtype": "w8a8",
+        "quantized_hybrid_level": 0,
+        "quantized_method": "channel"
+      },
+      "rktransformers_version": "0.3.0",
+      "single_core_mode": false,
+      "std_values": null,
+      "target_platform": "rk3588",
+      "task": "auto",
+      "task_kwargs": null
+    },
+    "model_b4_s512.rknn": {
+      "batch_size": 4,
+      "custom_string": null,
+      "dynamic_input": null,
+      "float_dtype": "float16",
+      "inputs_yuv_fmt": null,
+      "max_seq_length": 512,
+      "mean_values": null,
+      "model_input_names": [
+        "input_ids",
+        "attention_mask",
+        "token_type_ids"
+      ],
+      "opset": 19,
+      "optimization": {
+        "compress_weight": false,
+        "enable_flash_attention": true,
+        "model_pruning": false,
+        "optimization_level": 0,
+        "remove_reshape": false,
+        "remove_weight": false,
+        "sparse_infer": false
+      },
+      "quantization": {
+        "auto_hybrid_cos_thresh": 0.98,
+        "auto_hybrid_euc_thresh": null,
+        "dataset_columns": null,
+        "dataset_name": null,
+        "dataset_size": 128,
+        "dataset_split": null,
+        "dataset_subset": null,
+        "do_quantization": false,
+        "quant_img_RGB2BGR": false,
+        "quantized_algorithm": "normal",
+        "quantized_dtype": "w8a8",
+        "quantized_hybrid_level": 0,
+        "quantized_method": "channel"
+      },
+      "rktransformers_version": "0.3.0",
+      "single_core_mode": false,
+      "std_values": null,
+      "target_platform": "rk3588",
+      "task": "auto",
+      "task_kwargs": null
+    },
+    "rknn/model_o1.rknn": {
+      "batch_size": 1,
+      "custom_string": null,
+      "dynamic_input": null,
+      "float_dtype": "float16",
+      "inputs_yuv_fmt": null,
+      "max_seq_length": 512,
+      "mean_values": null,
+      "model_input_names": [
+        "input_ids",
+        "attention_mask",
+        "token_type_ids"
+      ],
+      "opset": 19,
+      "optimization": {
+        "compress_weight": false,
+        "enable_flash_attention": true,
+        "model_pruning": false,
+        "optimization_level": 1,
+        "remove_reshape": false,
+        "remove_weight": false,
+        "sparse_infer": false
+      },
+      "quantization": {
+        "auto_hybrid_cos_thresh": 0.98,
+        "auto_hybrid_euc_thresh": null,
+        "dataset_columns": null,
+        "dataset_name": null,
+        "dataset_size": 128,
+        "dataset_split": null,
+        "dataset_subset": null,
+        "do_quantization": false,
+        "quant_img_RGB2BGR": false,
+        "quantized_algorithm": "normal",
+        "quantized_dtype": "w8a8",
+        "quantized_hybrid_level": 0,
+        "quantized_method": "channel"
+      },
+      "rktransformers_version": "0.3.0",
+      "single_core_mode": false,
+      "std_values": null,
+      "target_platform": "rk3588",
+      "task": "auto",
+      "task_kwargs": null
+    },
+    "rknn/model_o2.rknn": {
+      "batch_size": 1,
+      "custom_string": null,
+      "dynamic_input": null,
+      "float_dtype": "float16",
+      "inputs_yuv_fmt": null,
+      "max_seq_length": 512,
+      "mean_values": null,
+      "model_input_names": [
+        "input_ids",
+        "attention_mask",
+        "token_type_ids"
+      ],
+      "opset": 19,
+      "optimization": {
+        "compress_weight": false,
+        "enable_flash_attention": true,
+        "model_pruning": false,
+        "optimization_level": 2,
+        "remove_reshape": false,
+        "remove_weight": false,
+        "sparse_infer": false
+      },
+      "quantization": {
+        "auto_hybrid_cos_thresh": 0.98,
+        "auto_hybrid_euc_thresh": null,
+        "dataset_columns": null,
+        "dataset_name": null,
+        "dataset_size": 128,
+        "dataset_split": null,
+        "dataset_subset": null,
+        "do_quantization": false,
+        "quant_img_RGB2BGR": false,
+        "quantized_algorithm": "normal",
+        "quantized_dtype": "w8a8",
+        "quantized_hybrid_level": 0,
+        "quantized_method": "channel"
+      },
+      "rktransformers_version": "0.3.0",
+      "single_core_mode": false,
+      "std_values": null,
+      "target_platform": "rk3588",
+      "task": "auto",
+      "task_kwargs": null
+    },
+    "rknn/model_o3.rknn": {
+      "batch_size": 1,
+      "custom_string": null,
+      "dynamic_input": null,
+      "float_dtype": "float16",
+      "inputs_yuv_fmt": null,
+      "max_seq_length": 512,
+      "mean_values": null,
+      "model_input_names": [
+        "input_ids",
+        "attention_mask",
+        "token_type_ids"
+      ],
+      "opset": 19,
+      "optimization": {
+        "compress_weight": false,
+        "enable_flash_attention": true,
+        "model_pruning": false,
+        "optimization_level": 3,
+        "remove_reshape": false,
+        "remove_weight": false,
+        "sparse_infer": false
+      },
+      "quantization": {
+        "auto_hybrid_cos_thresh": 0.98,
+        "auto_hybrid_euc_thresh": null,
+        "dataset_columns": null,
+        "dataset_name": null,
+        "dataset_size": 128,
+        "dataset_split": null,
+        "dataset_subset": null,
+        "do_quantization": false,
+        "quant_img_RGB2BGR": false,
+        "quantized_algorithm": "normal",
+        "quantized_dtype": "w8a8",
+        "quantized_hybrid_level": 0,
+        "quantized_method": "channel"
+      },
+      "rktransformers_version": "0.3.0",
+      "single_core_mode": false,
+      "std_values": null,
+      "target_platform": "rk3588",
+      "task": "auto",
+      "task_kwargs": null
+    },
+    "rknn/model_w8a8.rknn": {
+      "batch_size": 1,
+      "custom_string": null,
+      "dynamic_input": null,
+      "float_dtype": "float16",
+      "inputs_yuv_fmt": null,
+      "max_seq_length": 512,
+      "mean_values": null,
+      "model_input_names": [
+        "input_ids",
+        "attention_mask",
+        "token_type_ids"
+      ],
+      "opset": 19,
+      "optimization": {
+        "compress_weight": false,
+        "enable_flash_attention": true,
+        "model_pruning": false,
+        "optimization_level": 0,
+        "remove_reshape": false,
+        "remove_weight": false,
+        "sparse_infer": false
+      },
+      "quantization": {
+        "auto_hybrid_cos_thresh": 0.98,
+        "auto_hybrid_euc_thresh": null,
+        "dataset_columns": [
+          "answer"
+        ],
+        "dataset_name": "sentence-transformers/natural-questions",
+        "dataset_size": 1024,
+        "dataset_split": [
+          "train"
+        ],
+        "dataset_subset": null,
+        "do_quantization": true,
+        "quant_img_RGB2BGR": false,
+        "quantized_algorithm": "normal",
+        "quantized_dtype": "w8a8",
+        "quantized_hybrid_level": 0,
+        "quantized_method": "channel"
+      },
+      "rktransformers_version": "0.3.0",
+      "single_core_mode": false,
+      "std_values": null,
+      "target_platform": "rk3588",
+      "task": "auto",
+      "task_kwargs": null
+    }
+  },
   "torch_dtype": "float32",
   "transformers_version": "4.55.4",
   "type_vocab_size": 2,

model_b4_s256.rknn CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:abad409b4f884e6a49c4d1a2144dd90f5a70ec9a615014da2fc62747fb755457
 size 283424646

 version https://git-lfs.github.com/spec/v1
+oid sha256:38f32b5d5c75fe48a8ec7e6b2e40797ba3c2f31268ab4fc45f3a6c743eb6fa44
 size 283424646

model_b4_s512.rknn CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0c777bf44463b5738af0693ce5a5fe54cf4f4516c6bff68e7979f89d8c11ee80
 size 294075782

 version https://git-lfs.github.com/spec/v1
+oid sha256:7b36b02fc89525575f596032dcba6150ad8eafcc3eb97f1f0f16a0b871d98eb0
 size 294075782

rknn/model_w8a8.rknn CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2b35b9cf8db6760f45b2fd9cc700e5bd88f8af73a69ecc87fe70799aa8ecd5b0
-size 140070675

 version https://git-lfs.github.com/spec/v1
+oid sha256:695fef86da5879cbe7359404db7a2549ab8e9fdaaaa80bf91dc67d82247cfe9a
+size 140071443