본문 바로가기
오늘의 자연어 처리

[2023-08-18] 오늘의 자연어처리

by 지환이아빠 2023. 8. 18.

Sarcasm Detection in a Disaster Context


During natural disasters, people often use social media platforms such as Twitter to ask for help, to provide information about the disaster situation, or to express contempt about the unfolding event or public policies and guidelines. This contempt is in some cases expressed as sarcasm or irony. Understanding this form of speech in a disaster-centric context is essential to improving natural language understanding of disaster-related tweets. In this paper, we introduce HurricaneSARC, a dataset of 15,000 tweets annotated for intended sarcasm, and provide a comprehensive investigation of sarcasm detection using pre-trained language models. Our best model is able to obtain as much as 0.70 F1 on our dataset. We also demonstrate that the performance on HurricaneSARC can be improved by leveraging intermediate task transfer learning. We release our data and code at this https URL.


자연재해 동안, 사람들은 종종 다음과 같은 소셜 미디어 플랫폼을 사용한다 트위터는 도움을 요청하고, 재난 상황에 대한 정보를 제공하고, 혹은 전개되는 사건이나 공공 정책에 대해 경멸을 표하기 위해 지침서. 이러한 경멸은 어떤 경우에는 빈정거림이나 아이러니로 표현된다. 재해 중심적인 맥락에서 이러한 형태의 연설을 이해하는 것은 필수적이다 재난 관련 트윗의 자연어 이해력 향상. 이 점에서. 종이, 우리는 허리케인을 소개한다SARC, 주석이 달린 15,000개의 트윗 데이터 세트 의도된 빈정거림과 빈정거림에 대한 포괄적인 조사를 제공하다 사전 훈련된 언어 모델을 사용한 탐지. 우리의 최고의 모델은 다음을 얻을 수 있다 데이터 세트에서 0.70 F1만큼. 우리는 또한 에 대한 성능을 입증한다 허리케인중간 작업 전송을 활용하여 SARC를 개선할 수 있습니다 학문의. 데이터 및 코드는 다음 위치에서 공개됩니다 이 https URL. 



SummHelper: Collaborative Human-Computer Summarization


Current approaches for text summarization are predominantly automatic, with rather limited space for human intervention and control over the process. In this paper, we introduce SummHelper, a 2-phase summarization assistant designed to foster human-machine collaboration. The initial phase involves content selection, where the system recommends potential content, allowing users to accept, modify, or introduce additional selections. The subsequent phase, content consolidation, involves SummHelper generating a coherent summary from these selections, which users can then refine using visual mappings between the summary and the source text. Small-scale user studies reveal the effectiveness of our application, with participants being especially appreciative of the balance between automated guidance and opportunities for personal input.


텍스트 요약에 대한 현재의 접근 방식은 대부분 자동이며, 다음과 같다 프로세스에 대한 인간의 개입과 통제를 위한 다소 제한된 공간. 인 본 논문에서는 설계된 2단계 요약 보조자인 Sum Helper를 소개한다 인간과 기계의 협력을 촉진하기 위해. 초기 단계에는 내용이 포함됩니다 시스템이 잠재적인 콘텐츠를 추천하는 선택, 사용자가 다음을 수행할 수 있도록 허용 추가 선택 항목을 승인, 수정 또는 도입합니다. 그 다음 단계는, 컨텐츠 통합, SumHelper가 일관성 있는 요약을 생성하는 것을 포함합니다 사용자가 시각적 매핑을 사용하여 조정할 수 있는 이러한 선택 사항 요약 및 원본 텍스트. 소규모 사용자 연구를 통해 효과 확인 참가자들이 특히 감사하는 우리의 지원서에 대해 자동화된 안내와 개인 입력 기회 사이의 균형. 



Sarcasm Detection in a Disaster Context


During natural disasters, people often use social media platforms such as Twitter to ask for help, to provide information about the disaster situation, or to express contempt about the unfolding event or public policies and guidelines. This contempt is in some cases expressed as sarcasm or irony. Understanding this form of speech in a disaster-centric context is essential to improving natural language understanding of disaster-related tweets. In this paper, we introduce HurricaneSARC, a dataset of 15,000 tweets annotated for intended sarcasm, and provide a comprehensive investigation of sarcasm detection using pre-trained language models. Our best model is able to obtain as much as 0.70 F1 on our dataset. We also demonstrate that the performance on HurricaneSARC can be improved by leveraging intermediate task transfer learning. We release our data and code at this https URL.


자연재해 동안, 사람들은 종종 다음과 같은 소셜 미디어 플랫폼을 사용한다 트위터는 도움을 요청하고, 재난 상황에 대한 정보를 제공하고, 혹은 전개되는 사건이나 공공 정책에 대해 경멸을 표하기 위해 지침서. 이러한 경멸은 어떤 경우에는 빈정거림이나 아이러니로 표현된다. 재해 중심적인 맥락에서 이러한 형태의 연설을 이해하는 것은 필수적이다 재난 관련 트윗의 자연어 이해력 향상. 이 점에서. 종이, 우리는 허리케인을 소개한다SARC, 주석이 달린 15,000개의 트윗 데이터 세트 의도된 빈정거림과 빈정거림에 대한 포괄적인 조사를 제공하다 사전 훈련된 언어 모델을 사용한 탐지. 우리의 최고의 모델은 다음을 얻을 수 있다 데이터 세트에서 0.70 F1만큼. 우리는 또한 에 대한 성능을 입증한다 허리케인중간 작업 전송을 활용하여 SARC를 개선할 수 있습니다 학문의. 데이터 및 코드는 다음 위치에서 공개됩니다 이 https URL. 



