본문 바로가기
오늘의 자연어 처리

[2022-09-29] 오늘의 자연어처리

by 지환이아빠 2022. 9. 29.
반응형

Sentiment is all you need to win US Presidential elections

 

Election speeches play an integral role in communicating the vision and mission of the candidates. From lofty promises to mud-slinging, the electoral candidate accounts for all. However, there remains an open question about what exactly wins over the voters. In this work, we used state-of-the-art natural language processing methods to study the speeches and sentiments of the Republican candidate, Donald Trump, and Democratic candidate, Joe Biden, fighting for the 2020 US Presidential election. Comparing the racial dichotomy of the United States, we analyze what led to the victory and defeat of the different candidates. We believe this work will inform the election campaigning strategy and provide a basis for communicating to diverse crowds.

 

선거 연설은 비전을 전달하는 데 필수적인 역할을 한다. 후보자의 사명 고상한 약속에서 진흙탕 싸움에 이르기까지, 선거인은 후보가 모두를 설명하다. 그러나, 무엇에 대한 열린 질문이 남아 있다. 정확히 유권자들을 이긴다. 이 작업에서는 최첨단 내추럴을 사용했습니다. 연설과 감정을 연구하기 위한 언어 처리 방법 공화당 후보인 도널드 트럼프와 민주당 후보인 조 바이든은 2020년 미국 대통령 선거를 위해 싸우고 있다. 인종 이분법 비교 미국의, 우리는 무엇이 승리와 패배를 이끌었는지 분석한다. 다른 후보자들 우리는 이 작업이 선거 운동에 정보를 줄 것이라고 믿는다. 전략을 세우고 다양한 군중과 소통할 수 있는 기반을 제공합니다. 

 

 

Improving Multilingual Neural Machine Translation System for Indic Languages

 

Machine Translation System (MTS) serves as an effective tool for communication by translating text or speech from one language to another language. The need of an efficient translation system becomes obvious in a large multilingual environment like India, where English and a set of Indian Languages (ILs) are officially used. In contrast with English, ILs are still entreated as low-resource languages due to unavailability of corpora. In order to address such asymmetric nature, multilingual neural machine translation (MNMT) system evolves as an ideal approach in this direction. In this paper, we propose a MNMT system to address the issues related to low-resource language translation. Our model comprises of two MNMT systems i.e. for English-Indic (one-to-many) and the other for Indic-English (many-to-one) with a shared encoder-decoder containing 15 language pairs (30 translation directions). Since most of IL pairs have scanty amount of parallel corpora, not sufficient for training any machine translation model. We explore various augmentation strategies to improve overall translation quality through the proposed model. A state-of-the-art transformer architecture is used to realize the proposed model. Trials over a good amount of data reveal its superiority over the conventional models. In addition, the paper addresses the use of language relationships (in terms of dialect, script, etc.), particularly about the role of high-resource languages of the same family in boosting the performance of low-resource languages. Moreover, the experimental results also show the advantage of backtranslation and domain adaptation for ILs to enhance the translation quality of both source and target languages. Using all these key approaches, our proposed model emerges to be more efficient than the baseline model in terms of evaluation metrics i.e BLEU (BiLingual Evaluation Understudy) score for a set of ILs.

 

MTS(Machine Translation System)는 다음과 같은 작업을 위한 효과적인 도구 역할을 합니다. 한 언어에서 다른 언어로 텍스트나 말을 번역함으로써 의사소통 언어. 효율적인 번역 시스템의 필요성은 다음과 같이 명백해집니다. 영어와 인도어 집합이 있는 인도와 같은 대규모 다국어 환경 언어(IL)가 공식적으로 사용됩니다. 영어와 대조적으로 IL은 여전히 말뭉치를 사용할 수 없기 때문에 저자원 언어로 처리됩니다. 유효한 이러한 비대칭적 특성을 다루기 위해, 다국어 신경 기계 번역 (MNMT) 시스템은 이 방향으로 이상적인 접근 방식으로 진화한다. 이 논문에서, 우리는 저자원 언어와 관련된 문제를 해결하기 위한 MNMT 시스템을 제안하다. 번역. 우리의 모델은 두 개의 MNMT 시스템, 즉 영어-인덱스로 구성된다. (일 대 다) 및 다른 하나는 Indic-English(다 대 일)를 공유합니다. 15개의 언어 쌍(30개의 번역 방향)을 포함하는 인코더-클라이언트. 부터 대부분의 IL 쌍은 병렬 코퍼스의 양이 적고, 충분하지 않습니다. 기계 번역 모델을 교육합니다. 우리는 다양한 증대를 탐구한다. 제안된 모델을 통해 전반적인 번역 품질을 개선하기 위한 전략. a 제안된 것을 실현하기 위해 최첨단 변압기 아키텍처가 사용된다. 모델. 많은 양의 데이터에 대한 시행은 그 우수성을 드러낸다. 재래식 모델 게다가, 그 논문은 언어의 사용을 다룬다. 관계 (사투리, 대본 등의 측면에서), 특히 역할에 대한. 같은 계열의 고자원 언어의 성능을 향상시키는 데 있어. 저자원 언어 게다가, 실험 결과는 또한 다음을 보여준다. IL을 위한 역번역 및 도메인 적응의 이점 소스 및 대상 언어 모두의 번역 품질. 이 모든 키 사용 접근 방식, 우리가 제안한 모델은 기준보다 더 효율적인 것으로 나타난다. 평가 지표 측면에서 모델(예: BLEU(BiLanguage Evaluation Understudy) IL 세트를 위해 점수를 매기다. 

 

 

Interactivism in Spoken Dialogue Systems

 

The interactivism model introduces a dynamic approach to language, communication and cognition. In this work, we explore this fundamental theory in the context of dialogue modelling for spoken dialogue systems (SDS). To extend such a theoretical framework, we present a set of design principles which adhere to central psycholinguistic and communication theories to achieve interactivism in SDS. From these, key ideas are linked to constitute the basis of our proposed design principles.

 

상호주의 모델은 언어에 대한 역동적인 접근을 도입한다. 커뮤니케이션과 인지 이 작업에서, 우리는 이 기본 이론을 탐구한다. 음성 대화 시스템(SDS)을 위한 대화 모델링의 맥락에서. 로. 그러한 이론적 틀을 확장하여, 우리는 일련의 설계 원칙을 제시한다. 성취하기 위해 중심 심리 언어 이론과 의사소통 이론을 고수한다. SDS의 상호작용주의. 이것들로부터, 주요 아이디어들은 기초를 구성하기 위해 연결되어 있다. 우리가 제안한 설계 원칙의. 

 

 

반응형

댓글