Update rm_model.md
Browse files- rm_model.md +75 -72
rm_model.md
CHANGED
|
@@ -1,73 +1,76 @@
|
|
| 1 |
-
# 水下目标识别与定位模型库
|
| 2 |
-
|
| 3 |
-
|
| 4 |
-
|
| 5 |
-
|
| 6 |
-
##
|
| 7 |
-
|
| 8 |
-
|
| 9 |
-
|
| 10 |
-
|
| 11 |
-
|
|
| 12 |
-
|
| 13 |
-
|
|
| 14 |
-
|
| 15 |
-
|
| 16 |
-
|
| 17 |
-
|
| 18 |
-
|
| 19 |
-
|
| 20 |
-
-
|
| 21 |
-
-
|
| 22 |
-
|
| 23 |
-
|
| 24 |
-
|
| 25 |
-
|
| 26 |
-
|
| 27 |
-
|
|
| 28 |
-
|
| 29 |
-
|
|
| 30 |
-
|
|
| 31 |
-
|
|
| 32 |
-
|
|
| 33 |
-
|
|
| 34 |
-
|
|
| 35 |
-
|
| 36 |
-
|
| 37 |
-
|
| 38 |
-
|
| 39 |
-
|
| 40 |
-
|
| 41 |
-
|
| 42 |
-
|
| 43 |
-
|
| 44 |
-
|
| 45 |
-
|
| 46 |
-
|
| 47 |
-
|
| 48 |
-
|
| 49 |
-
|
| 50 |
-
|
| 51 |
-
|
| 52 |
-
|
| 53 |
-
|
| 54 |
-
|
| 55 |
-
|
| 56 |
-
|
| 57 |
-
|
| 58 |
-
|
| 59 |
-
|
| 60 |
-
|
| 61 |
-
|
| 62 |
-
|
| 63 |
-
|
| 64 |
-
|
| 65 |
-
}
|
| 66 |
-
|
| 67 |
-
|
| 68 |
-
|
| 69 |
-
|
| 70 |
-
|
| 71 |
-
|
| 72 |
-
|
|
|
|
|
|
|
|
|
|
| 73 |
|
|
|
|
| 1 |
+
# 水下目标识别与定位模型库
|
| 2 |
+
|
| 3 |
+
- [English](README.md)
|
| 4 |
+
- [中文](README-zh.md)
|
| 5 |
+
|
| 6 |
+
## 项目概述
|
| 7 |
+
本仓库包含一系列用于水下目标识别与定位的深度学习模型,包括专为水下声学场景设计的MCL/MEG系列网络,以及迁移自计算机视觉领域的通用识别模型。这些模型基于声纹识别技术,实现对水下目标的分类与定位,可应用于海洋监测、水下安防等领域。
|
| 8 |
+
|
| 9 |
+
## 模型说明
|
| 10 |
+
### 1. 专用网络系列(识别+定位)
|
| 11 |
+
| 模型名称 | 描述 | 输入特征 | 功能 |
|
| 12 |
+
|---------|------|---------|------|
|
| 13 |
+
| MCL | 基础网络,无混合专家模型 | GFCC/STFT | 识别+定位 |
|
| 14 |
+
| MEG | 在MCL基础上加入混合专家模型 | GFCC/STFT | 识别+定位 |
|
| 15 |
+
| MEG_BLC | MEG变体,加入负载均衡机制 | GFCC/STFT | 识别+定位 |
|
| 16 |
+
| MEG_MIX | MEG变体,多特征混合输入 | 多种特征融合 | 识别+定位 |
|
| 17 |
+
|
| 18 |
+
### 2. 通用CV网络(仅识别)
|
| 19 |
+
迁移自计算机视觉领域的经典模型,适配水下声纹识别任务:
|
| 20 |
+
- DenseNet121
|
| 21 |
+
- MobileNetV2
|
| 22 |
+
- ResNet18
|
| 23 |
+
- ResNet50
|
| 24 |
+
- Swin-Transformer
|
| 25 |
+
|
| 26 |
+
## 性能指标
|
| 27 |
+
| Network | ACC(%) | MAE-R (km) | MAE-D (m) |
|
| 28 |
+
|---------|--------|------------|-----------|
|
| 29 |
+
| MEG (STFT) | 95.93 | **0.2011** | **20.61** |
|
| 30 |
+
| MCL (STFT) | **96.07** | 0.2565 | 27.68 |
|
| 31 |
+
| MEG(GFCC) | 95.75 | **0.1707** | **19.43** |
|
| 32 |
+
| MCL(GFCC) | **96.10** | 0.3384 | 35.42 |
|
| 33 |
+
| densenet121 | 86.61 | - | - |
|
| 34 |
+
| resnet18 | 84.99 | - | - |
|
| 35 |
+
| mobilenetv2 | 83.60 | - | - |
|
| 36 |
+
| resnet50 | 76.34 | - | - |
|
| 37 |
+
| swin-transformer | 63.08 | - | - |
|
| 38 |
+
|
| 39 |
+
*注:ACC为识别准确率,MAE-R为距离定位平均绝对误差,MAE-D为深度定位平均绝对误差*
|
| 40 |
+
|
| 41 |
+
## 使用方法
|
| 42 |
+
|
| 43 |
+
### 1. 模型下载
|
| 44 |
+
可从Hugging Face Hub 或者 魔搭社区 下载各模型权重文件,通过以下链接获取完整项目代码:
|
| 45 |
+
- Gitee: <mcurl name="UWTRL-MEG" url="https://gitee.com/open-ocean/UWTRL-MEG"></mcurl>
|
| 46 |
+
- GitHub: <mcurl name="UWTRL-MEG" url="https://github.com/Perry44001/UWTRL-MEG"></mcurl>
|
| 47 |
+
|
| 48 |
+
### 2. 模型使用
|
| 49 |
+
使用超参数--resume指定权重文件所在文件夹即可,默认加载model.pth
|
| 50 |
+
```c
|
| 51 |
+
python train_mtl.py --features stft --task_type mtl --resume './models/meg(stft)'
|
| 52 |
+
```
|
| 53 |
+
|
| 54 |
+
### 3. 输入输出
|
| 55 |
+
- 输入:声学特征(GFCC/STFT等)
|
| 56 |
+
- 输出:目标类别、距离估计、深度估计
|
| 57 |
+
详细输入输出格式及训练/推理代码请参考项目仓库文档。
|
| 58 |
+
|
| 59 |
+
## 引用信息
|
| 60 |
+
相关研究论文正在审查中,预计2025年9月发表于MDPI《Remote Sensing》期刊。如使用本项目模型,请引用以下论文(发表后更新):
|
| 61 |
+
```
|
| 62 |
+
@article{uwtrl2025,
|
| 63 |
+
title={Multi-Task Mixture-of-Experts Model for Underwater Target Localization and Recognition},
|
| 64 |
+
author={Peng Qian, Jingyi Wang, Yining Liu, Yingxuan Chen, Pengjiu Wang, Yanfa Deng, Peng Xiao* and Zhenglin Li},
|
| 65 |
+
journal={Remote Sensing},
|
| 66 |
+
year={2025},
|
| 67 |
+
publisher={MDPI}
|
| 68 |
+
}
|
| 69 |
+
```
|
| 70 |
+
|
| 71 |
+
## 联系方式
|
| 72 |
+
如有问题或合作意向,请联系:[[email protected]]
|
| 73 |
+
|
| 74 |
+
---
|
| 75 |
+
*本项目仅供学术研究使用,商业用途请联系作者获取授权。*
|
| 76 |
|