본문 바로가기
오늘의 자연어 처리

[2023-09-01] 오늘의 자연어처리

by 지환이아빠 2023. 9. 1.
반응형

Proceedings 39th International Conference on Logic Programming

 

This volume contains the Technical Communications presented at the 39th International Conference on Logic Programming (ICLP 2023), held at Imperial College London, UK from July 9 to July 15, 2023. Technical Communications included here concern the Main Track, the Doctoral Consortium, the Application and Systems/Demo track, the Recently Published Research Track, the Birds-of-a-Feather track, the Thematic Tracks on Logic Programming and Machine Learning, and Logic Programming and Explainability, Ethics, and Trustworthiness.

 

이 볼륨에는 39번째에 제시된 기술 커뮤니케이션이 포함되어 있습니다 ICLP 2023, 임페리얼에서 개최되는 논리 프로그래밍 국제 회의 2023년 7월 9일부터 7월 15일까지 영국 칼리지 런던. 기술 커뮤니케이션 여기에 포함된 것은 메인 트랙, 박사 컨소시엄, 신청서에 관한 것이다 그리고 시스템/데모 트랙, 최근 발행된 연구 트랙 새의 깃털 트랙, 논리 프로그래밍 및 기계에 대한 테마 트랙 학습, 그리고 논리 프로그래밍과 설명성, 윤리, 그리고 신뢰성. 

 

 

Conti Inc.: Understanding the Internal Discussions of a large Ransomware-as-a-Service Operator with Machine Learning

 

Ransomware-as-a-service (RaaS) is increasing the scale and complexity of ransomware attacks. Understanding the internal operations behind RaaS has been a challenge due to the illegality of such activities. The recent chat leak of the Conti RaaS operator, one of the most infamous ransomware operators on the international scene, offers a key opportunity to better understand the inner workings of such organizations. This paper analyzes the main topic discussions in the Conti chat leak using machine learning techniques such as Natural Language Processing (NLP) and Latent Dirichlet Allocation (LDA), as well as visualization strategies. Five discussion topics are found: 1) Business, 2) Technical, 3) Internal tasking/Management, 4) Malware, and 5) Customer Service/Problem Solving. Moreover, the distribution of topics among Conti members shows that only 4% of individuals have specialized discussions while almost all individuals (96%) are all-rounders, meaning that their discussions revolve around the five topics. The results also indicate that a significant proportion of Conti discussions are non-tech related. This study thus highlights that running such large RaaS operations requires a workforce skilled beyond technical abilities, with individuals involved in various tasks, from management to customer service or problem solving. The discussion topics also show that the organization behind the Conti RaaS oper5086933ator shares similarities with a large firm. We conclude that, although RaaS represents an example of specialization in the cybercrime industry, only a few members are specialized in one topic, while the rest runs and coordinates the RaaS operation.

 

RaaS(Randomware as a Service)는 RaaS의 규모와 복잡성을 증가시키고 있습니다 랜섬웨어 공격. RaaS의 내부 운영을 이해하는 것은 그러한 활동의 불법성으로 인한 도전. 의 최근 채팅 유출 가장 악명 높은 랜섬웨어 운영자 중 하나인 콘티 RaaS 운영자 국제적인 장면, 내부를 더 잘 이해할 수 있는 중요한 기회를 제공한다 그런 기관들의 업무. 이 논문은 주요 주제 논의를 분석한다 Natural과 같은 기계 학습 기술을 사용한 Conti chat 누출에서 언어 처리(NLP) 및 잠재 디리클릿 할당(Latent Dirichlet Allocation) 및 시각화 전략. 5가지 토론 주제를 찾을 수 있습니다: 1) 비즈니스, 2) 기술적, 3) 내부 태스크/관리, 4) 멀웨어 및 5) 고객 서비스/문제 해결. 게다가 콘티 사이의 주제 분포 회원들은 개인의 4%만이 전문적인 토론을 한다는 것을 보여준다 거의 모든 개인(96%)은 만능주의자이며, 이는 그들의 토론을 의미한다 다섯 가지 논제를 중심으로 전개하다. 결과는 또한 유의한 결과를 나타냅니다 콘티 토론의 비율은 기술과 관련이 없습니다. 따라서 이 연구는 이러한 대규모 RaaS 작업을 실행하려면 숙련된 인력이 필요합니다 기술적 능력을 넘어, 다양한 업무에 참여하는 개인들과 함께 고객 서비스 또는 문제 해결에 대한 관리. 토론 주제 또한 콘티 RaaS 운영자 5086933의 지분 뒤에 있는 조직이 공유한다는 것을 보여준다 대기업과의 유사성. 우리는 RaaS가 다음과 같이 결론짓는다 사이버 범죄 산업의 전문화의 예, 단지 소수의 회원들만이 하나의 주제에 특화된 반면, 나머지는 RaaS를 실행하고 조정한다 작동. 

 

 

ParaGuide: Guided Diffusion Paraphrasers for Plug-and-Play Textual Style Transfer

 

Textual style transfer is the task of transforming stylistic properties of text while preserving meaning. Target "styles" can be defined in numerous ways, ranging from single attributes (e.g, formality) to authorship (e.g, Shakespeare). Previous unsupervised style-transfer approaches generally rely on significant amounts of labeled data for only a fixed set of styles or require large language models. In contrast, we introduce a novel diffusion-based framework for general-purpose style transfer that can be flexibly adapted to arbitrary target styles at inference time. Our parameter-efficient approach, ParaGuide, leverages paraphrase-conditioned diffusion models alongside gradient-based guidance from both off-the-shelf classifiers and strong existing style embedders to transform the style of text while preserving semantic information. We validate the method on the Enron Email Corpus, with both human and automatic evaluations, and find that it outperforms strong baselines on formality, sentiment, and even authorship style transfer.

 

텍스트 스타일 전송은 스타일 특성을 변환하는 작업이다 의미를 보존하면서 텍스트를 입력합니다. 대상 "스타일"은 다양한 방식으로 정의될 수 있습니다, 단일 속성(예: 형식)에서 저자(예, 셰익스피어). 이전의 감독되지 않은 스타일 전송 접근 방식은 일반적으로 다음에 의존한다 고정된 스타일 집합 또는 요구사항에 대해서만 상당한 양의 레이블이 지정된 데이터 큰 언어 모델. 대조적으로, 우리는 새로운 확산 기반을 도입한다 유연하게 적응할 수 있는 범용 스타일 전송을 위한 프레임워크 추론 시간에 임의의 대상 스타일입니다. 우리의 매개변수 효율적인 접근법은, ParaGuide, 파라프레이즈 조건 확산 모델과 함께 활용 기성 분류자와 강력한 기존 분류자의 기울기 기반 지침 시맨틱을 유지하면서 텍스트 스타일을 변환하는 스타일 임베더 정보. 우리는 인간과 함께 엔론 이메일 코퍼스에서 방법을 검증한다 그리고 자동 평가를 통해 강력한 기준선을 능가하는 성능을 확인할 수 있습니다 형식, 감정, 그리고 심지어 작가 스타일의 이전. 

 

 

반응형

댓글