본문 바로가기
오늘의 자연어 처리

[2023-04-15] 오늘의 자연어처리

by 지환이아빠 2023. 4. 15.
반응형

PGTask: Introducing the Task of Profile Generation from Dialogues

 

Recent approaches have attempted to personalize dialogue systems by leveraging profile information into models. However, this knowledge is scarce and difficult to obtain, which makes the extraction/generation of profile information from dialogues a fundamental asset. To surpass this limitation, we introduce the Profile Generation Task (PGTask). We contribute with a new dataset for this problem, comprising profile sentences aligned with related utterances, extracted from a corpus of dialogues. Furthermore, using state-of-the-art methods, we provide a benchmark for profile generation on this novel dataset. Our experiments disclose the challenges of profile generation, and we hope that this introduces a new research direction.

 

최근의 접근법은 대화 시스템을 개인화하기 위해 시도되었다 모델에 프로필 정보를 활용합니다. 그러나, 이 지식은 부족하다 프로파일을 추출/생성하는 것을 어렵게 만드는 것 대화를 통해 얻은 정보는 기본 자산입니다. 이 한계를 극복하기 위해, 우리는 프로필 생성 작업(PGT 작업)을 소개합니다. 우리는 새로운 것으로 기여한다 관련된 프로파일 문장으로 구성된 이 문제에 대한 데이터 세트 대화의 말뭉치에서 추출한 발언. 또한, 사용하기 최첨단 방법, 우리는 이것에 대한 프로필 생성을 위한 벤치마크를 제공한다 새로운 데이터 세트. 우리의 실험은 프로파일 생성의 어려움을 드러낸다, 그리고 우리는 이것이 새로운 연구 방향을 도입하기를 바란다. 

 

 

Computational modeling of semantic change

 

In this chapter we provide an overview of computational modeling for semantic change using large and semi-large textual corpora. We aim to provide a key for the interpretation of relevant methods and evaluation techniques, and also provide insights into important aspects of the computational study of semantic change. We discuss the pros and cons of different classes of models with respect to the properties of the data from which one wishes to model semantic change, and which avenues are available to evaluate the results.

 

이 장에서 우리는 의미론적 계산 모델링의 개요를 제공한다 큰 텍스트 말뭉치와 반 큰 텍스트 말뭉치를 사용하여 변경합니다. 우리는 다음을 위한 열쇠를 제공하는 것을 목표로 한다 관련된 방법과 평가 기법의 해석, 그리고 의미론적 컴퓨터 연구의 중요한 측면에 대한 통찰력을 제공하다 변화. 우리는 다른 종류의 모델들의 장단점을 논의한다 의미론적 모델링을 원하는 데이터의 속성에 대한 존중 변경 및 결과를 평가하는 데 사용할 수 있는 방법. 

 

 

PDF-VQA: A New Dataset for Real-World VQA on PDF Documents

 

Document-based Visual Question Answering examines the document understanding of document images in conditions of natural language questions. We proposed a new document-based VQA dataset, PDF-VQA, to comprehensively examine the document understanding from various aspects, including document element recognition, document layout structural understanding as well as contextual understanding and key information extraction. Our PDF-VQA dataset extends the current scale of document understanding that limits on the single document page to the new scale that asks questions over the full document of multiple pages. We also propose a new graph-based VQA model that explicitly integrates the spatial and hierarchically structural relationships between different document elements to boost the document structural understanding. The performances are compared with several baselines over different question types and tasks\footnote{The full dataset will be released after paper acceptance.

 

문서 기반 시각적 질문 응답은 문서 이해도를 검사합니다 자연어 질문의 조건에서 문서 이미지의. 우리는 제안했다 새로운 문서 기반 VQA 데이터 세트인 PDF-VQA를 사용하여 종합적으로 검토할 수 있습니다 문서 요소를 포함한 다양한 측면에서의 문서 이해 인식, 문서 레이아웃 구조적 이해 및 상황별 이해 이해 및 핵심 정보 추출. PDF-VQA 데이터 세트는 다음과 같이 확장됩니다 현재 문서 척도단일 문서 페이지에서 제한하는 이해 여러 페이지의 전체 문서에 대한 질문을 하는 새로운 척도로. 우리는 또한 명시적으로 통합하는 새로운 그래프 기반 VQA 모델을 제안한다 서로 다른 문서 간의 공간적, 계층적 구조적 관계 문서의 구조적 이해를 높이기 위한 요소. 공연은 다양한 질문 유형에 대한 여러 기준선과 비교하여 태스크\작업전체 데이터 세트는 용지 승인 후 공개됩니다. 

 

 

반응형

댓글