본문 바로가기
오늘의 자연어 처리

[2023-01-03] 오늘의 자연어처리

by 지환이아빠 2023. 1. 3.
반응형

Leveraging World Knowledge in Implicit Hate Speech Detection

 

While much attention has been paid to identifying explicit hate speech, implicit hateful expressions that are disguised in coded or indirect language are pervasive and remain a major challenge for existing hate speech detection systems. This paper presents the first attempt to apply Entity Linking (EL) techniques to both explicit and implicit hate speech detection, where we show that such real world knowledge about entity mentions in a text does help models better detect hate speech, and the benefit of adding it into the model is more pronounced when explicit entity triggers (e.g., rally, KKK) are present. We also discuss cases where real world knowledge does not add value to hate speech detection, which provides more insights into understanding and modeling the subtleties of hate speech.

 

노골적인 혐오 발언을 식별하는 데 많은 관심이 기울여졌지만, 코드화되거나 간접적인 언어로 위장된 암묵적인 혐오 표현들 광범위하고 기존 혐오 발언 탐지의 주요 과제로 남아 있다. 시스템들. 본 논문에서는 엔티티 연결(EL)을 적용하기 위한 첫 번째 시도를 제시합니다. 명시적이고 암묵적인 혐오 발언 탐지를 위한 기술, 우리가 보여주는 곳. 실체에 대한 그러한 실제 지식이 텍스트에서 언급하는 것은 모델에 도움이 된다. 혐오 발언을 더 잘 감지하고, 모델에 추가하는 것의 이점은 더 크다. 명시적 엔티티 트리거(예: 랠리, KKK)가 있을 때 발음됩니다. 우리가 또한 현실 세계의 지식이 혐오 발언에 가치를 부여하지 않는 경우를 논의한다. 탐지, 이것은 이해와 모델링에 대한 더 많은 통찰력을 제공합니다. 혐오 표현의 미묘한 점 

 

 

Twitter's Agenda-Setting Role: A Study of Twitter Strategy for Political Diversion

 

This study verified the effectiveness of Donald Trump's Twitter campaign in guiding agen-da-setting and deflecting political risk and examined Trump's Twitter communication strategy and explores the communication effects of his tweet content during Covid-19 pandemic. We collected all tweets posted by Trump on the Twitter platform from January 1, 2020 to December 31, 2020.We used Ordinary Least Squares (OLS) regression analysis with a fixed effects model to analyze the existence of the Twitter strategy. The correlation between the number of con-firmed daily Covid-19 diagnoses and the number of particular thematic tweets was investigated using time series analysis. Empirical analysis revealed Twitter's strategy is used to divert public attention from negative Covid-19 reports during the epidemic, and it posts a powerful political communication effect on Twitter. However, findings suggest that Trump did not use false claims to divert political risk and shape public opinion.

 

이 연구는 도널드 트럼프의 트위터 캠페인의 효과를 검증했다. 의제 설정을 안내하고 정치적 위험을 회피하며 트럼프의 정책을 검토했다. 트위터 커뮤니케이션 전략과 그의 커뮤니케이션 효과를 탐구한다. 코로나19 범유행 중 트윗 내용. 우리는 트럼프가 올린 모든 트윗을 수집했다. 2020년 1월 1일부터 12월 31일까지 트위터 플랫폼에서.우리는 사용했다. 고정 효과 모형을 사용한 일반 최소 제곱(OLS) 회귀 분석 트위터 전략의 존재를 분석하다 사이의 상관 관계 일일 코로나19 확진자 수 및 특정 환자 수 주제 트윗은 시계열 분석을 사용하여 조사되었다. 경험적 분석 트위터의 전략은 대중의 관심을 부정적인 것에서 돌리기 위해 사용된다고 밝혔다. 코로나19는 전염병 동안 보고되고, 그것은 강력한 정치적인 것을 게시한다. 트위터의 커뮤니케이션 효과. 그러나 조사 결과에 따르면 트럼프는 그렇지 않았다. 정치적 위험을 분산시키고 여론을 형성하기 위해 거짓 주장을 사용한다. 

 

 

ResGrad: Residual Denoising Diffusion Probabilistic Models for Text to Speech

 

Denoising Diffusion Probabilistic Models (DDPMs) are emerging in text-to-speech (TTS) synthesis because of their strong capability of generating high-fidelity samples. However, their iterative refinement process in high-dimensional data space results in slow inference speed, which restricts their application in real-time systems. Previous works have explored speeding up by minimizing the number of inference steps but at the cost of sample quality. In this work, to improve the inference speed for DDPM-based TTS model while achieving high sample quality, we propose ResGrad, a lightweight diffusion model which learns to refine the output spectrogram of an existing TTS model (e.g., FastSpeech 2) by predicting the residual between the model output and the corresponding ground-truth speech. ResGrad has several advantages: 1) Compare with other acceleration methods for DDPM which need to synthesize speech from scratch, ResGrad reduces the complexity of task by changing the generation target from ground-truth mel-spectrogram to the residual, resulting into a more lightweight model and thus a smaller real-time factor. 2) ResGrad is employed in the inference process of the existing TTS model in a plug-and-play way, without re-training this model. We verify ResGrad on the single-speaker dataset LJSpeech and two more challenging datasets with multiple speakers (LibriTTS) and high sampling rate (VCTK). Experimental results show that in comparison with other speed-up methods of DDPMs: 1) ResGrad achieves better sample quality with the same inference speed measured by real-time factor; 2) with similar speech quality, ResGrad synthesizes speech faster than baseline methods by more than 10 times. Audio samples are available at this https URL.

 

노이즈 제거 확산 확률 모델(DDPM)은 다음과 같이 나타나고 있다. TTS(Text-to-Speech) 합성은 생성하는 강력한 능력 때문에 고순도 샘플 그러나, 그들의 반복적인 정제 과정은 고차원 데이터 공간은 느린 추론 속도를 초래하며, 이는 제한을 가한다. 실시간 시스템에 적용할 수 있습니다. 이전 작품들은 속도를 탐구했다. 추론 단계의 수를 최소화함으로써, 그러나 샘플 비용으로. 퀄리티. 본 연구에서, DDPM 기반 TTS 모델의 추론 속도를 향상시키기 위해. 높은 샘플 품질을 달성하면서 경량인 ResGrad를 제안합니다. 기존의 출력 스펙트럼 프로그램을 개선하는 방법을 배우는 확산 모델 모델 간 잔차를 예측하여 TTS 모델(예: FastSpeech 2) 출력 및 해당 지상파 음성. ResGrad에는 여러 개가 있습니다. 장점: 1) 다음이 필요한 DDPM의 다른 가속 방법과 비교합니다. 음성을 처음부터 합성합니다. ResGrad는 다음과 같이 작업의 복잡성을 줄입니다. 지상 관측 멜 분광 프로그램에서 다음으로 발전 목표를 변경합니다. 잔여, 결과적으로 더 가벼운 모델이 되고 따라서 더 작은 실시간이 된다. 인자 2) ResGrad는 기존 TTS의 추론 과정에 사용된다. 플러그 앤 플레이 방식으로 이 모델을 재교육하지 않고 사용할 수 있습니다. ResGrad를 확인합니다. 단일 스피커 데이터 세트 LJSpeech 및 두 개 이상의 까다로운 데이터 세트에 대해 다중 스피커(LibriTTS) 및 높은 샘플링 속도(VCTK). 실험적 결과는 DDPM의 다른 속도 향상 방법과 비교하여 다음을 보여준다: 1) ResGrad는 측정된 동일한 추론 속도로 더 나은 샘플 품질을 달성한다. 실시간 요인에 의해; 2) 유사한 음성 품질로 ResGrad는 음성을 합성한다. 기본 방법보다 10배 이상 더 빠릅니다. 오디오 샘플을 사용할 수 있습니다. 이 https URL에서. 

 

 

반응형

댓글