ntutaipei1

community

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

zenyn authored a paper 7 days ago

SAKE: Towards Editing Auditory Attribute Knowledge of Large Audio-Language Models

zenyn authored a paper 7 days ago

Investigating Safety Vulnerabilities of Large Audio-Language Models Under Speaker Emotional Variations

dmnph authored a paper 22 days ago

ML-SUPERB: Multilingual Speech Universal PERformance Benchmark

View all activity

zenyn

authored 2 papers 7 days ago

SAKE: Towards Editing Auditory Attribute Knowledge of Large Audio-Language Models

Paper • 2510.16917 • Published 9 days ago • 19

Investigating Safety Vulnerabilities of Large Audio-Language Models Under Speaker Emotional Variations

Paper • 2510.16893 • Published 9 days ago • 17

dmnph

authored 3 papers 22 days ago

ML-SUPERB: Multilingual Speech Universal PERformance Benchmark

Paper • 2305.10615 • Published May 18, 2023 • 1

REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR

Paper • 2402.03988 • Published Feb 6, 2024

Hierarchical Programmatic Reinforcement Learning via Learning to Compose Programs

Paper • 2301.12950 • Published Jan 30, 2023

WeiChihChen

authored 2 papers 22 days ago

Dynamic-SUPERB Phase-2: A Collaboratively Expanding Benchmark for Measuring the Capabilities of Spoken Language Models with 180 Tasks

Paper • 2411.05361 • Published Nov 8, 2024 • 3

BreezyVoice: Adapting TTS for Taiwanese Mandarin with Enhanced Polyphone Disambiguation -- Challenges and Insights

Paper • 2501.17790 • Published Jan 29 • 3

dmnph

authored a paper 22 days ago

DeSTA2.5-Audio: Toward General-Purpose Large Audio Language Model with Self-Generated Cross-Modal Alignment

Paper • 2507.02768 • Published Jul 3 • 18

WeiChihChen

authored 3 papers 22 days ago

DeSTA2.5-Audio: Toward General-Purpose Large Audio Language Model with Self-Generated Cross-Modal Alignment

Paper • 2507.02768 • Published Jul 3 • 18

Analyzing Mitigation Strategies for Catastrophic Forgetting in End-to-End Training of Spoken Language Models

Paper • 2505.17496 • Published May 23 • 2

Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models

Paper • 2408.07665 • Published Aug 14, 2024

dmnph

authored a paper 22 days ago

Game-Time: Evaluating Temporal Dynamics in Spoken Language Models

Paper • 2509.26388 • Published 28 days ago • 26

WeiChihChen

authored a paper 22 days ago

Game-Time: Evaluating Temporal Dynamics in Spoken Language Models

Paper • 2509.26388 • Published 28 days ago • 26

dlion168

authored 7 papers 29 days ago

Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models

Paper • 2408.07665 • Published Aug 14, 2024

EMO-Debias: Benchmarking Gender Debiasing Techniques in Multi-Label Speech Emotion Recognition

Paper • 2506.04652 • Published Jun 5 • 1

Fake-Mamba: Real-Time Speech Deepfake Detection Using Bidirectional Mamba as Self-Attention's Alternative

Paper • 2508.09294 • Published Aug 12

Meta-PerSER: Few-Shot Listener Personalized Speech Emotion Recognition via Meta-learning

Paper • 2505.16220 • Published May 22 • 1

AI & ML interests

Recent Activity

Team members 13

taipei1's activity