본문 바로가기
오늘의 자연어 처리

[2022-08-23] 오늘의 자연어처리

by 지환이아빠 2022. 8. 23.
반응형

Beyond Text Generation: Supporting Writers with Continuous Automatic Text Summaries

 

We propose a text editor to help users plan, structure and reflect on their writing process. It provides continuously updated paragraph-wise summaries as margin annotations, using automatic text summarization. Summary levels range from full text, to selected (central) sentences, down to a collection of keywords. To understand how users interact with this system during writing, we conducted two user studies (N=4 and N=8) in which people wrote analytic essays about a given topic and article. As a key finding, the summaries gave users an external perspective on their writing and helped them to revise the content and scope of their drafted paragraphs. People further used the tool to quickly gain an overview of the text and developed strategies to integrate insights from the automated summaries. More broadly, this work explores and highlights the value of designing AI tools for writers, with Natural Language Processing (NLP) capabilities that go beyond direct text generation and correction.

 

우리는 사용자가 계획, 구조화 및 성찰할 수 있도록 텍스트 편집기를 제안한다. 글쓰기 과정 다음과 같이 지속적으로 업데이트된 단락별 요약을 제공합니다. 여백 주석, 자동 텍스트 요약 사용. 요약 수준 범위 전체 텍스트에서 선택된 (중심) 문장, 컬렉션에 이르기까지 키워드 사용자가 글을 쓰는 동안 이 시스템과 상호 작용하는 방식을 이해하기 위해 사람들이 분석적 에세이를 작성하는 두 가지 사용자 연구(N=4 및 N=8)를 수행했다. 주어진 주제와 기사에 대해서. 주요 소견으로, 요약은 사용자에게 다음을 제공했습니다. 그들의 글에 대한 외부적 관점 그리고 그들이 내용을 수정하는 것을 도왔습니다 그리고 그들의 초안 단락의 범위. 사람들은 빠르게 얻기 위해 도구를 더 사용했다. 텍스트의 개요와 통찰을 통합하기 위해 개발된 전략 자동 요약 보다 광범위하게, 이 작업은 가치를 탐색하고 강조합니다. 자연어 처리(NLP)를 통해 작가들을 위한 AI 도구를 설계하는 것. 직접 텍스트 생성 및 수정 이상의 기능을 제공합니다. 

 

 

Sparse Optimization for Unsupervised Extractive Summarization of Long Documents with the Frank-Wolfe Algorithm

 

We address the problem of unsupervised extractive document summarization, especially for long documents. We model the unsupervised problem as a sparse auto-regression one and approximate the resulting combinatorial problem via a convex, norm-constrained problem. We solve it using a dedicated Frank-Wolfe algorithm. To generate a summary with $k$ sentences, the algorithm only needs to execute $\approx k$ iterations, making it very efficient. We explain how to avoid explicit calculation of the full gradient and how to include sentence embedding information. We evaluate our approach against two other unsupervised methods using both lexical (standard) ROUGE scores, as well as semantic (embedding-based) ones. Our method achieves better results with both datasets and works especially well when combined with embeddings for highly paraphrased summaries.

 

우리는 감독되지 않은 추출 문서 요약의 문제를 다룬다. 특히 긴 문서의 경우. 우리는 감독되지 않은 문제를 희박한 것으로 모델링한다. 자동 회귀 분석 1을 통해 결과 조합 문제를 근사화합니다. 볼록하고 규범에 구속된 문제 프랭크-울프 전담자를 이용해서 해결하죠 알고리즘. $k$ 문장으로 요약을 생성하려면 알고리즘이 필요한 것은 $\approxk$ 반복을 실행하여 매우 효율적이다. 방법을 설명합니다. 전체 그라데이션 및 문장 포함 방법에 대한 명시적 계산을 피한다. 정보를 삽입하는 것 우리는 다른 두 명의 감독되지 않은 사람들에 대해 우리의 접근 방식을 평가한다. 어휘(표준) ROUGE 점수 및 의미론적 점수를 모두 사용하는 방법 (일반적으로) 한 개. 우리의 방법은 두 데이터 세트 모두에서 더 나은 결과를 달성한다. 그리고 특히 고도로 패러프레이즈된 임베딩과 결합될 때 잘 작동한다. 요약 

 

 

Understanding Interpersonal Conflict Types and their Impact on Perception Classification

 

Studies on interpersonal conflict have a long history and contain many suggestions for conflict typology. We use this as the basis of a novel annotation scheme and release a new dataset of situations and conflict aspect annotations. We then build a classifier to predict whether someone will perceive the actions of one individual as right or wrong in a given situation, outperforming previous work on this task. Our analyses include conflict aspects, but also generated clusters, which are human validated, and show differences in conflict content based on the relationship of participants to the author. Our findings have important implications for understanding conflict and social norms.

 

대인관계 갈등에 대한 연구는 오랜 역사를 가지고 있고 많은 것을 포함하고 있다. 충돌 유형학에 대한 제안 우리는 이것을 소설의 기초로 사용한다. 상황 및 충돌 측면의 새로운 데이터 세트 구성 및 릴리스 주석 그런 다음 우리는 누군가가 할 것인지 아닌지를 예측하기 위해 분류기를 만든다. 주어진 상황에서 한 개인의 행동을 옳고 그름으로 인식한다. 이 작업에 대한 이전 작업을 능가합니다. 우리의 분석은 갈등을 포함한다. 측면뿐만 아니라 생성된 클러스터, 즉 사람이 검증하고 다음을 보여줍니다. 에 대한 참가자의 관계에 기초한 갈등 내용의 차이 저자 우리의 발견은 갈등을 이해하는 데 중요한 영향을 미친다. 그리고 사회 규범. 

 

 

반응형

댓글