peng7554 commited on
Commit
9e573ce
·
verified ·
1 Parent(s): 84c7f9e

Update rm_model.md

Browse files
Files changed (1) hide show
  1. rm_model.md +75 -72
rm_model.md CHANGED
@@ -1,73 +1,76 @@
1
- # 水下目标识别与定位模型库
2
-
3
- ## 项目概述
4
- 本仓库包含一系列用于水下目标识别与定位的深度学习模型,包括专为水下声学场景设计的MCL/MEG系列网络,以及迁移自计算机视觉领域的通用识别模型。这些模型基于声纹识别技术,实现对水下目标的分类与定位,可应用于海洋监测、水下安防等领域。
5
-
6
- ## 模型说明
7
- ### 1. 专用网络系列(识别+定位)
8
- | 模型名称 | 描述 | 输入特征 | 功能 |
9
- |---------|------|---------|------|
10
- | MCL | 基础网络,无混合专家模型 | GFCC/STFT | 识别+定位 |
11
- | MEG | 在MCL基础上加入混合专家模型 | GFCC/STFT | 识别+定位 |
12
- | MEG_BLC | MEG变体,加入负载均衡机制 | GFCC/STFT | 识别+定位 |
13
- | MEG_MIX | MEG变体,多特征混合输入 | 多种特征融合 | 识别+定位 |
14
-
15
- ### 2. 通用CV网络(仅识别)
16
- 迁移自计算机视觉领域的经典模型,适配水下声纹识别任务:
17
- - DenseNet121
18
- - MobileNetV2
19
- - ResNet18
20
- - ResNet50
21
- - Swin-Transformer
22
-
23
- ## 性能指标
24
- | Network | ACC(%) | MAE-R (km) | MAE-D (m) |
25
- |---------|--------|------------|-----------|
26
- | MEG (STFT) | 95.93 | **0.2011** | **20.61** |
27
- | MCL (STFT) | **96.07** | 0.2565 | 27.68 |
28
- | MEG(GFCC) | 95.75 | **0.1707** | **19.43** |
29
- | MCL(GFCC) | **96.10** | 0.3384 | 35.42 |
30
- | densenet121 | 86.61 | - | - |
31
- | resnet18 | 84.99 | - | - |
32
- | mobilenetv2 | 83.60 | - | - |
33
- | resnet50 | 76.34 | - | - |
34
- | swin-transformer | 63.08 | - | - |
35
-
36
- *注:ACC为识别准确率,MAE-R为距离定位平均绝对误差,MAE-D为深度定位平均绝对误差*
37
-
38
- ## 使用方法
39
-
40
- ### 1. 模型下载
41
- 可从Hugging Face Hub 或者 魔搭社区 下载各模型权重文件,通过以下链接获取完整项目代码:
42
- - Gitee: <mcurl name="UWTRL-MEG" url="https://gitee.com/open-ocean/UWTRL-MEG"></mcurl>
43
- - GitHub: <mcurl name="UWTRL-MEG" url="https://github.com/Perry44001/UWTRL-MEG"></mcurl>
44
-
45
- ### 2. 模型使用
46
- 使用超参数--resume指定权重文件所在文件夹即可,默认加载model.pth
47
- ```c
48
- python train_mtl.py --features stft --task_type mtl --resume './models/meg(stft)'
49
- ```
50
-
51
- ### 3. 输入输出
52
- - 输入:声学特征(GFCC/STFT等)
53
- - 输出:目标类别、距离估计、深度估计
54
- 详细输入输出格式及训练/推理代码请参考项目仓库文档。
55
-
56
- ## 引用信息
57
- 相关研究论文正在审查中,预计2025年9月发表于MDPI《Remote Sensing》期刊。如使用本项目模型,请引用以下论文(发表后更新):
58
- ```
59
- @article{uwtrl2025,
60
- title={Multi-Task Mixture-of-Experts Model for Underwater Target Localization and Recognition},
61
- author={Peng Qian, Jingyi Wang, Yining Liu, Yingxuan Chen, Pengjiu Wang, Yanfa Deng, Peng Xiao* and Zhenglin Li},
62
- journal={Remote Sensing},
63
- year={2025},
64
- publisher={MDPI}
65
- }
66
- ```
67
-
68
- ## 联系方式
69
- 如有问题或合作意向,请联系:[[email protected]]
70
-
71
- ---
72
- *本项目仅供学术研究使用,商业用途请联系作者获取授权。*
 
 
 
73
 
 
1
+ # 水下目标识别与定位模型库
2
+
3
+ - [English](README.md)
4
+ - [中文](README-zh.md)
5
+
6
+ ## 项目概述
7
+ 本仓库包含一系列用于水下目标识别与定位的深度学习模型,包括专为水下声学场景设计的MCL/MEG系列网络,以及迁移自计算机视觉领域的通用识别模型。这些模型基于声纹识别技术,实现对水下目标的分类与定位,可应用于海洋监测、水下安防等领域。
8
+
9
+ ## 模型说明
10
+ ### 1. 专用网络系列(识别+定位)
11
+ | 模型名称 | 描述 | 输入特征 | 功能 |
12
+ |---------|------|---------|------|
13
+ | MCL | 基础网络,无混合专家模型 | GFCC/STFT | 识别+定位 |
14
+ | MEG | 在MCL基础上加入混合专家模型 | GFCC/STFT | 识别+定位 |
15
+ | MEG_BLC | MEG变体,加入负载均衡机制 | GFCC/STFT | 识别+定位 |
16
+ | MEG_MIX | MEG变体,多特征混合输入 | 多种特征融合 | 识别+定位 |
17
+
18
+ ### 2. 通用CV网络(仅识别)
19
+ 迁移自计算机视觉领域的经典模型,适配水下声纹识别任务:
20
+ - DenseNet121
21
+ - MobileNetV2
22
+ - ResNet18
23
+ - ResNet50
24
+ - Swin-Transformer
25
+
26
+ ## 性能指标
27
+ | Network | ACC(%) | MAE-R (km) | MAE-D (m) |
28
+ |---------|--------|------------|-----------|
29
+ | MEG (STFT) | 95.93 | **0.2011** | **20.61** |
30
+ | MCL (STFT) | **96.07** | 0.2565 | 27.68 |
31
+ | MEG(GFCC) | 95.75 | **0.1707** | **19.43** |
32
+ | MCL(GFCC) | **96.10** | 0.3384 | 35.42 |
33
+ | densenet121 | 86.61 | - | - |
34
+ | resnet18 | 84.99 | - | - |
35
+ | mobilenetv2 | 83.60 | - | - |
36
+ | resnet50 | 76.34 | - | - |
37
+ | swin-transformer | 63.08 | - | - |
38
+
39
+ *注:ACC为识别准确率,MAE-R为距离定位平均绝对误差,MAE-D为深度定位平均绝对误差*
40
+
41
+ ## 使用方法
42
+
43
+ ### 1. 模型下载
44
+ 可从Hugging Face Hub 或者 魔搭社区 下载各模型权重文件,通过以下链接获取完整项目代码:
45
+ - Gitee: <mcurl name="UWTRL-MEG" url="https://gitee.com/open-ocean/UWTRL-MEG"></mcurl>
46
+ - GitHub: <mcurl name="UWTRL-MEG" url="https://github.com/Perry44001/UWTRL-MEG"></mcurl>
47
+
48
+ ### 2. 模型使用
49
+ 使用超参数--resume指定权重文件所在文件夹即可,默认加载model.pth
50
+ ```c
51
+ python train_mtl.py --features stft --task_type mtl --resume './models/meg(stft)'
52
+ ```
53
+
54
+ ### 3. 输入输出
55
+ - 输入:声学特征(GFCC/STFT等)
56
+ - 输出:目标类别、距离估计、深度估计
57
+ 详细输入输出格式及训练/推理代码请参考项目仓库文档。
58
+
59
+ ## 引用信息
60
+ 相关研究论文正在审查中,预计2025年9月发表于MDPI《Remote Sensing》期刊。如使用本项目模型,请引用以下论文(发表后更新):
61
+ ```
62
+ @article{uwtrl2025,
63
+ title={Multi-Task Mixture-of-Experts Model for Underwater Target Localization and Recognition},
64
+ author={Peng Qian, Jingyi Wang, Yining Liu, Yingxuan Chen, Pengjiu Wang, Yanfa Deng, Peng Xiao* and Zhenglin Li},
65
+ journal={Remote Sensing},
66
+ year={2025},
67
+ publisher={MDPI}
68
+ }
69
+ ```
70
+
71
+ ## 联系方式
72
+ 如有问题或合作意向,请联系:[[email protected]]
73
+
74
+ ---
75
+ *本项目仅供学术研究使用,商业用途请联系作者获取授权。*
76