본문 바로가기
오늘의 자연어 처리

[2022-11-07] 오늘의 자연어처리

by 지환이아빠 2022. 11. 7.
반응형

A speech corpus for chronic kidney disease

 

In this study, we present a speech corpus of patients with chronic kidney disease (CKD) that will be used for research on pathological voice analysis, automatic illness identification, and severity prediction. This paper introduces the steps involved in creating this corpus, including the choice of speech-related parameters and speech lists as well as the recording technique. The speakers in this corpus, 289 CKD patients with varying degrees of severity who were categorized based on estimated glomerular filtration rate (eGFR), delivered sustained vowels, sentence, and paragraph stimuli. This study compared and analyzed the voice characteristics of CKD patients with those of the control group; the results revealed differences in voice quality, phoneme-level pronunciation, prosody, glottal source, and aerodynamic parameters.

 

이 연구에서, 우리는 만성 신장을 가진 환자들의 언어 말뭉치를 제시한다. 병리학적 음성 분석에 대한 연구에 사용될 질병(CKD), 자동 질병 식별 및 심각도 예측. 이 종이 선택을 포함하여 이 말뭉치를 만드는 데 관련된 단계를 소개한다. 음성 관련 매개 변수와 음성 목록 및 녹음 기술. 이 말뭉치의 화자는 289명의 CKD 환자이며, 중증도는 다양합니다. 추정 사구체 여과율(eGFR)에 기초하여 분류되었다. 지속적인 모음, 문장 및 단락 자극을 전달했습니다. 이 연구 CKD 환자의 음성 특성을 비교하고 분석했습니다. 대조군; 결과는 음성 품질의 차이를 드러냈습니다. 음소 수준의 발음, 운율, 성문 출처 및 공기역학 매개 변수 

 

 

A speech corpus for chronic kidney disease

 

In this study, we present a speech corpus of patients with chronic kidney disease (CKD) that will be used for research on pathological voice analysis, automatic illness identification, and severity prediction. This paper introduces the steps involved in creating this corpus, including the choice of speech-related parameters and speech lists as well as the recording technique. The speakers in this corpus, 289 CKD patients with varying degrees of severity who were categorized based on estimated glomerular filtration rate (eGFR), delivered sustained vowels, sentence, and paragraph stimuli. This study compared and analyzed the voice characteristics of CKD patients with those of the control group; the results revealed differences in voice quality, phoneme-level pronunciation, prosody, glottal source, and aerodynamic parameters.

 

이 연구에서, 우리는 만성 신장을 가진 환자들의 언어 말뭉치를 제시한다. 병리학적 음성 분석에 대한 연구에 사용될 질병(CKD), 자동 질병 식별 및 심각도 예측. 이 종이 선택을 포함하여 이 말뭉치를 만드는 데 관련된 단계를 소개한다. 음성 관련 매개 변수와 음성 목록 및 녹음 기술. 이 말뭉치의 화자는 289명의 CKD 환자이며, 중증도는 다양합니다. 추정 사구체 여과율(eGFR)에 기초하여 분류되었다. 지속적인 모음, 문장 및 단락 자극을 전달했습니다. 이 연구 CKD 환자의 음성 특성을 비교하고 분석했습니다. 대조군; 결과는 음성 품질의 차이를 드러냈습니다. 음소 수준의 발음, 운율, 성문 출처 및 공기역학 매개 변수 

 

 

Probing Statistical Representations For End-To-End ASR

 

End-to-End automatic speech recognition (ASR) models aim to learn a generalised speech representation to perform recognition. In this domain there is little research to analyse internal representation dependencies and their relationship to modelling approaches. This paper investigates cross-domain language model dependencies within transformer architectures using SVCCA and uses these insights to exploit modelling approaches. It was found that specific neural representations within the transformer layers exhibit correlated behaviour which impacts recognition performance. Altogether, this work provides analysis of the modelling approaches affecting contextual dependencies and ASR performance, and can be used to create or adapt better performing End-to-End ASR models and also for downstream tasks.

 

종단 간 자동 음성 인식(ASR) 모델은 다음을 학습하는 것을 목표로 한다. 인식을 수행하기 위한 일반화된 음성 표현. 이 도메인에서는 내부 표현 의존성과 그 의존성을 분석하기 위한 연구는 거의 없다. 모델링 접근법에 대한 관계. 이 논문은 교차 도메인을 조사한다. SVCCA를 사용하는 변압기 아키텍처 내의 언어 모델 종속성 이러한 통찰력을 사용하여 모델링 접근 방식을 활용합니다. 그것은 특정한 것으로 밝혀졌다. 변압기 층 내의 신경 표현은 상관관계를 나타낸다. 인식 성능에 영향을 미치는 동작. 전체적으로, 이 연구는 영향을 미치는 모델링 접근법에 대한 분석을 제공한다. 문맥 의존성 및 ASR 성능, 생성 또는 적응에 사용할 수 있음 엔드 투 엔드 ASR 모델 및 다운스트림 작업에 대해 더 나은 성능을 제공합니다. 

 

 

반응형

댓글