Tài liệu tham khảo |
Loại |
Chi tiết |
[1] Y. A. Chung, Y. Wang, W. N. Hsu, Y. Zhang and R. J. Skerry-Ryan, "Semi-supervised training for improving data efficiency in end-to-end speech synthesis," ICASSP 2019- 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 6940-6944, 2019 |
Sách, tạp chí |
Tiêu đề: |
Semi-supervised training for improving data efficiency in end-to-end speech synthesis |
Tác giả: |
Y. A. Chung, Y. Wang, W. N. Hsu, Y. Zhang, R. J. Skerry-Ryan |
Nhà XB: |
ICASSP 2019- 2019 IEEE International Conference on Acoustics, Speech and Signal Processing |
Năm: |
2019 |
|
[2] Y. Yan, X. Tan, B. Li, Q. Tao, S. Zhao, Y. Shen and T.-Y. Liu, "Adaspeech 2: Adaptive text to speech with untranscribed data," in 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2021 |
Sách, tạp chí |
Tiêu đề: |
Adaspeech 2: Adaptive text to speech with untranscribed data |
Tác giả: |
Y. Yan, X. Tan, B. Li, Q. Tao, S. Zhao, Y. Shen, T.-Y. Liu |
Nhà XB: |
2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) |
Năm: |
2021 |
|
[3] Y. Yan, B. L. Xu Tan, G. Zhang, T. Qin, S. Zhao, Y. Shen, W.-Q. Zhang and T.-Y. Liu, "Adaspeech 3: Adaptive text to speech for spontaneous style," in INTERSPEECH, 2021 |
Sách, tạp chí |
Tiêu đề: |
Adaspeech 3: Adaptive text to speech for spontaneous style |
Tác giả: |
Y. Yan, B. L. Xu Tan, G. Zhang, T. Qin, S. Zhao, Y. Shen, W.-Q. Zhang, T.-Y. Liu |
Nhà XB: |
INTERSPEECH |
Năm: |
2021 |
|
[4] J. K. T. Yamagishi, "Average-voice-based speech synthesis using HSMM-based speaker adaptation and adaptive training," IEICE Trans. Inf. & Syst, Vols. Vols. E90- D, 2007 |
Sách, tạp chí |
Tiêu đề: |
Average-voice-based speech synthesis using HSMM-based speaker adaptation and adaptive training |
Tác giả: |
J. K. T. Yamagishi |
Nhà XB: |
IEICE Trans. Inf. & Syst |
Năm: |
2007 |
|
[5] Q. Xie, X. Tian, G. Liu, K. Song, L. Xie, Z. Wu and X. Xu, "The multi-speaker multi- style voice cloning challenge 2021," in In ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2021, June |
Sách, tạp chí |
Tiêu đề: |
The multi-speaker multi- style voice cloning challenge 2021 |
Tác giả: |
Q. Xie, X. Tian, G. Liu, K. Song, L. Xie, Z. Wu, X. Xu |
Nhà XB: |
ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and Signal Processing |
Năm: |
2021 |
|
[6] N. T. T. Trang, N. H. Ky, P. Q. Minh and V. Manh, "Remaining problems with state- of-the-art techniques in proceedings of the seventh international workshop on Vietnamese language and speech processing," VLSP 2020, 2020 |
Sách, tạp chí |
Tiêu đề: |
Remaining problems with state- of-the-art techniques in proceedings of the seventh international workshop on Vietnamese language and speech processing |
Tác giả: |
N. T. T. Trang, N. H. Ky, P. Q. Minh, V. Manh |
Nhà XB: |
VLSP 2020 |
Năm: |
2020 |
|
[7] P. T. Son, V. T. Thang and C. T. Dương, "Nghiên cứu nâng cao chất lượng tổng hợp tiếng nói tiếng Việt dựa trên mô hình Markov ẩn và đặc trưng ngôn ngữ," Kỷ yếu Hội thảo Quốc gia lần thứ XV “Một số vấn đề chọn lọc của Công nghệ thông tin và Truyền thông, Hà Nội, pp. 238-242, 2013 |
Sách, tạp chí |
Tiêu đề: |
Nghiên cứu nâng cao chất lượng tổng hợp tiếng nói tiếng Việt dựa trên mô hình Markov ẩn và đặc trưng ngôn ngữ |
Tác giả: |
P. T. Son, V. T. Thang, C. T. Dương |
Nhà XB: |
Kỷ yếu Hội thảo Quốc gia lần thứ XV “Một số vấn đề chọn lọc của Công nghệ thông tin và Truyền thông |
Năm: |
2013 |
|
[8] D. K. Ninh, "A speaker-adaptive hmm-based vietnamese text-to-speech system," 2019 11th International Conference on Knowledge and Systems Engineering (KSE), pp. 1-5, 2019 |
Sách, tạp chí |
Tiêu đề: |
A speaker-adaptive hmm-based vietnamese text-to-speech system |
Tác giả: |
D. K. Ninh |
Nhà XB: |
2019 11th International Conference on Knowledge and Systems Engineering (KSE) |
Năm: |
2019 |
|
[9] H. Zen, A. Senior and M. Schuster, "Statistical parametric speech synthesis using deep neural networks," 2013 ieee international conference on acoustics, speech and signal processing. IEEE, pp. 7962-7966, 2013 |
Sách, tạp chí |
Tiêu đề: |
Statistical parametric speech synthesis using deep neural networks |
|
[10] A. v. d. Oord, S. Dieleman, H. Zen, K. Simonyan, O. Vinyals, A. Graves, N. Kalchbrenner, A. Senior and K. Koray, "Wavenet: A generative model for raw audio,"arXiv preprint arXiv:1609.03499, 2016 |
Sách, tạp chí |
Tiêu đề: |
Wavenet: A generative model for raw audio |
Tác giả: |
A. v. d. Oord, S. Dieleman, H. Zen, K. Simonyan, O. Vinyals, A. Graves, N. Kalchbrenner, A. Senior, K. Koray |
Nhà XB: |
arXiv preprint |
Năm: |
2016 |
|
[11] Y. Ren, Y. Ruan, X. Tan, T. Qin, S. Zhao, Z. Zhao and T.-Y. Liu, "Fastspeech: Fast, robust and controllable text to speech," in In NeurIPS, 2019 |
Sách, tạp chí |
Tiêu đề: |
Fastspeech: Fast, robust and controllable text to speech |
Tác giả: |
Y. Ren, Y. Ruan, X. Tan, T. Qin, S. Zhao, Z. Zhao, T.-Y. Liu |
Nhà XB: |
NeurIPS |
Năm: |
2019 |
|
[12] E. Cooper, C.-I. Lai, Y. Yasuda, F. Fang, X. Wang, N. Chen and J. Yamagishi, "Zero- shot multi-speaker text-to-speech with state-of-the-art neural speaker embeddings," in ICASSP 2020-2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020 |
Sách, tạp chí |
Tiêu đề: |
Zero- shot multi-speaker text-to-speech with state-of-the-art neural speaker embeddings |
Tác giả: |
E. Cooper, C.-I. Lai, Y. Yasuda, F. Fang, X. Wang, N. Chen, J. Yamagishi |
Nhà XB: |
ICASSP 2020-2020 IEEE International Conference on Acoustics, Speech and Signal Processing |
Năm: |
2020 |
|
[13] M. Chen, X. Tan, B. Li, Y. Liu, T. Qin, S. Zhao and T. Y. Liu, "AdaSpeech: Adaptive Text to Speech for Custom Voice.," arXiv preprint arXiv:2103.00993, 2021 |
Sách, tạp chí |
Tiêu đề: |
AdaSpeech: Adaptive Text to Speech for Custom Voice |
Tác giả: |
M. Chen, X. Tan, B. Li, Y. Liu, T. Qin, S. Zhao, T. Y. Liu |
Nhà XB: |
arXiv |
Năm: |
2021 |
|
[14] Z. Wu, P. Swietojanski, C. Veaux, S. Renals and S. King, "A study of speaker adaptation for dnn-based speech synthesis," in Sixteenth Annual Conference of the International Speech Communication Association, 2015 |
Sách, tạp chí |
Tiêu đề: |
A study of speaker adaptation for dnn-based speech synthesis |
Tác giả: |
Z. Wu, P. Swietojanski, C. Veaux, S. Renals, S. King |
Nhà XB: |
Sixteenth Annual Conference of the International Speech Communication Association |
Năm: |
2015 |
|
[15] I. Tokuda, "The Source–Filter Theory of Speech," in Oxford Research Encyclopedia of Linguistics, 2021 |
Sách, tạp chí |
Tiêu đề: |
The Source–Filter Theory of Speech |
|
[16] Damper, C. H. Shadle and R. I, "Prospects for articulatory synthesis: A position paper," in In 4th ISCA Tutorial and Research Workshop (ITRW) on Speech Synthesis, 2001 |
Sách, tạp chí |
Tiêu đề: |
Prospects for articulatory synthesis: A position paper |
Tác giả: |
C. H. Damper, R. I. Shadle |
Nhà XB: |
4th ISCA Tutorial and Research Workshop (ITRW) on Speech Synthesis |
Năm: |
2001 |
|
[17] P. Seeviour, J. Holmes and M. Judd, "Automatic generation of control signals for a parallel formant speech synthesizer," in In ICASSP’76. IEEE International Conference on Acoustics, Speech, and Signal Processing, 1976 |
Sách, tạp chí |
Tiêu đề: |
Automatic generation of control signals for a parallel formant speech synthesizer |
Tác giả: |
P. Seeviour, J. Holmes, M. Judd |
Nhà XB: |
IEEE International Conference on Acoustics, Speech, and Signal Processing |
Năm: |
1976 |
|
[18] A. J. Hunt and Alan W Black, "Unit selection in a concatenative speech synthesis system using a large speech database," in 1996 IEEE International Conference on Acoustics, Speech and Signal Processing Conference Proceedings olume 1, pages 373–376. IEEE,, 1996 |
Sách, tạp chí |
Tiêu đề: |
Unit selection in a concatenative speech synthesis system using a large speech database |
Tác giả: |
A. J. Hunt, Alan W Black |
Nhà XB: |
IEEE |
Năm: |
1996 |
|
[19] K. Tokuda, T. Yoshimura, T. Masuko, T. Kobayashi and T. Kitamura, "Speech parameter generation algorithms for hmm-based speech synthesis," in IEE2000 E International Conference on Acoustics, Speech, and Signal Processing. Proceedings, 2000 |
Sách, tạp chí |
Tiêu đề: |
Speech parameter generation algorithms for hmm-based speech synthesis |
Tác giả: |
K. Tokuda, T. Yoshimura, T. Masuko, T. Kobayashi, T. Kitamura |
Nhà XB: |
IEE2000 E International Conference on Acoustics, Speech, and Signal Processing |
Năm: |
2000 |
|
[20] K. Tokuda, T. Kobayashi, T. Masuko and S. Imai, "Mel-generalized cepstral analysis-a unified approach to speech spectral estimation," in Third International Conference on Spoken Language Processing, 1994 |
Sách, tạp chí |
Tiêu đề: |
Mel-generalized cepstral analysis-a unified approach to speech spectral estimation |
|