Internatinal Conference

International Conference

End-to-End Speaker Verification with Uncertainty-Aware Evidential Scoring

M.H, Han, C. Moon, J.Y. Kang, N.S. Kim

IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)

2026

FastEnhancer: Speed-Optimized Streaming Neural Speech Enhancement

S. Ahn, J. Han, B.J. Woo, N.S. Kim

IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)

2026

SNR-Aligned Consistent Diffusion for Adaptive Speech Enhancement

Y. Jun, B. Woo, M. Jeong, N. Kim

Proc. Interspeech

Aug. 2025

Evidential-TTS: High Fidelity Zero-Shot Text-to-Speech Using Evidential Deep Learning

M. Jeong, M. Kim, S. Kim and N. S. Kim

IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)

2025

FADEL: Uncertainty-aware Fake Audio Detection with Evidential Deep Learning

J. Y. Kang, J. W. Yoon, S. Kim, M. H. Han and N. S. Kim

IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)

2025

EEND-EM: End-to-End Neural Speaker Diarization with EM-Network

B. J. Woo, J. W. Yoon, M. H. Han, C. Moon, and N. S. Kim

Proc. Asia Pacific Signal and Information Processing Association Annual Summit and Conference(APSIPA ASC)

Dec. 2024

HuBERT-EE: Early Exiting HuBERT for Efficient Speech Recognition

J. W. Yoon, B. J. Woo, and N. S. Kim

Proc. Interspeech

Sep. 2024

MakeSinger: A Semi-Supervised Training Method for Data-Efficient Singing Voice Synthesis via Classifier-free Diffusion Guidance

S. Kim, M. Jeong, H. Lee, M. Kim, B. J. Choi, and N. S. Kim

Proc. Interspeech

Sep. 2024

High Fidelity Text-to-Speech Via Discrete Tokens Using Token Transducer and Group Masked Language Model

J. Y. lee, M. Jeong, M. Kim, J. Lee, H. Cho, and N. S. Kim

Proc. Interspeech

Sep. 2024

Transduce and Speak: Neural Transducer for Text-to-Speech with Semantic Token Prediction

M. Kim, M. Jeong, B. J. Choi, D. Lee, and N. S. Kim

IEEE Automatic Speech Recognition and Understanding(ASRU)

Dec. 2023

International Conference

End-to-End Speaker Verification with Uncertainty-Aware Evidential Scoring

FastEnhancer: Speed-Optimized Streaming Neural Speech Enhancement

SNR-Aligned Consistent Diffusion for Adaptive Speech Enhancement

Evidential-TTS: High Fidelity Zero-Shot Text-to-Speech Using Evidential Deep Learning

FADEL: Uncertainty-aware Fake Audio Detection with Evidential Deep Learning

EEND-EM: End-to-End Neural Speaker Diarization with EM-Network

HuBERT-EE: Early Exiting HuBERT for Efficient Speech Recognition

MakeSinger: A Semi-Supervised Training Method for Data-Efficient Singing Voice Synthesis via Classifier-free Diffusion Guidance

High Fidelity Text-to-Speech Via Discrete Tokens Using Token Transducer and Group Masked Language Model

Transduce and Speak: Neural Transducer for Text-to-Speech with Semantic Token Prediction

Human Interface Laboratory / 휴먼인터페이스 연구실