본문 바로가기
오늘의 자연어 처리

[2022-09-23] 오늘의 자연어처리

by 지환이아빠 2022. 9. 23.
반응형

Setting the rhythm scene: deep learning-based drum loop generation from arbitrary language cues

 

Generative artificial intelligence models can be a valuable aid to music composition and live performance, both to aid the professional musician and to help democratize the music creation process for hobbyists. Here we present a novel method that, given an English word or phrase, generates 2 compasses of a 4-piece drum pattern that embodies the "mood" of the given language cue, or that could be used for an audiovisual scene described by the language cue. We envision this tool as composition aid for electronic music and audiovisual soundtrack production, or an improvisation tool for live performance. In order to produce the training samples for this model, besides manual annotation of the "scene" or "mood" terms, we have designed a novel method to extract the consensus drum track of any song. This consists of a 2-bar, 4-piece drum pattern that represents the main percussive motif of a song, which could be imported into any music loop device or live looping software. These two key components (drum pattern generation from a generalizable input, and consensus percussion extraction) present a novel approach to computer-aided composition and provide a stepping stone for more comprehensive rhythm generation.

 

생성적 인공지능 모델은 음악에 귀중한 도움이 될 수 있다. 작곡과 라이브 공연, 전문 음악가를 돕기 위해 그리고 둘 다. 취미 활동가들을 위한 음악 창작 과정을 민주화하는 것을 돕습니다. 여기서 우리는 발표한다. 영어 단어나 구가 주어지면 2개의 나침반을 생성하는 새로운 방법 주어진 언어 큐의 "모양"을 구현하는 4피스 드럼 패턴, 또는 언어 큐에 의해 묘사된 시청각 장면에서 사용될 수 있다. 우리가 전자 음악과 시청각의 작곡 보조 도구로서 이 도구를 상상하라. 사운드트랙 제작 또는 라이브 공연을 위한 즉흥적인 도구. 유효한 수동 주석 외에 이 모델에 대한 교육 샘플을 생산합니다. "구체적" 또는 "구체적" 용어, 우리는 그것을 추출하기 위한 새로운 방법을 설계했다. 어떤 노래든 컨센서스 드럼 트랙. 2바, 4피스 드럼으로 구성되어 있습니다. 노래의 주요 충돌 모티브를 나타내는 패턴, 그것은 다음과 같을 수 있다. 음악 루프 장치 또는 라이브 루프 소프트웨어로 가져옵니다. 이 두 개의 열쇠 구성 요소(일반화할 수 있는 입력에서 패턴 생성 및 합의) 타악기 추출)을 통해 컴퓨터 지원 작곡에 대한 새로운 접근 방식을 제시한다. 그리고 보다 포괄적인 리듬 생성을 위한 발판을 제공합니다. 

 

 

emojiSpace: Spatial Representation of Emojis

 

In the absence of nonverbal cues during messaging communication, users express part of their emotions using emojis. Thus, having emojis in the vocabulary of text messaging language models can significantly improve many natural language processing (NLP) applications such as online communication analysis. On the other hand, word embedding models are usually trained on a very large corpus of text such as Wikipedia or Google News datasets that include very few samples with emojis. In this study, we create emojiSpace, which is a combined word-emoji embedding using the word2vec model from the Genism library in Python. We trained emojiSpace on a corpus of more than 4 billion tweets and evaluated it by implementing sentiment analysis on a Twitter dataset containing more than 67 million tweets as an extrinsic task. For this task, we compared the performance of two different classifiers of random forest (RF) and linear support vector machine (SVM). For evaluation, we compared emojiSpace performance with two other pre-trained embeddings and demonstrated that emojiSpace outperforms both.

 

메시지 통신 중 비언어적 단서가 없는 경우, 사용자는 이모티콘을 사용해서 그들의 감정의 일부를 표현한다. 그러므로, 이모티콘을 가지고 있다. 문자 메시지 언어 모델의 어휘는 많은 것을 크게 향상시킬 수 있다. 온라인 통신과 같은 자연어 처리(NLP) 응용 프로그램 분석. 반면에, 단어 임베딩 모델은 일반적으로 a에 대해 훈련된다. 위키피디아나 구글 뉴스 데이터 세트와 같은 매우 큰 텍스트 말뭉치. 이모티콘이 있는 샘플은 거의 없다. 이 연구에서는 이모지스페이스를 만듭니다. 그것은 단어 2vec 모델을 사용한 결합된 단어-언어 임베딩이다. 파이썬의 유전학 라이브러리. 우리는 4개 이상의 말뭉치에서 이모지스페이스를 훈련시켰다. 트위터에 감정 분석을 구현하여 평가한 트윗은 10억 개입니다. 외부 작업으로 6,700만 개 이상의 트윗을 포함하는 데이터 세트. 이를 위해 과제, 우리는 랜덤 포레스트의 두 가지 다른 분류기의 성능을 비교했다. (RF)와 선형 서포트 벡터 머신 (SVM)을 비교하였습니다. 사전 훈련된 두 개의 다른 임베딩과 시연된 emojiSpace 성능 이모지스페이스가 둘 다 능가한다는 것. 

 

 

Fast Few shot Self-attentive Semi-supervised Political Inclination Prediction

 

With the rising participation of the common mass in social media, it is increasingly common now for policymakers/journalists to create online polls on social media to understand the political leanings of people in specific locations. The caveat here is that only influential people can make such an online polling and reach out at a mass scale. Further, in such cases, the distribution of voters is not controllable and may be, in fact, biased. On the other hand,if we can interpret the publicly available data over social media to probe the political inclination of users, we will be able to have controllable insights about the survey population, keep the cost of survey low and also collect publicly available data without involving the concerned persons. Hence we introduce a self-attentive semi-supervised framework for political inclination detection to further that objective. The advantage of our model is that it neither needs huge training data nor does it need to store social network parameters. Nevertheless, it achieves an accuracy of 93.7\% with no annotated data; further, with only a few annotated examples per class it achieves competitive performance. We found that the model is highly efficient even in resource-constrained settings, and insights drawn from its predictions match the manual survey outcomes when applied to diverse real-life scenarios.

 

소셜 미디어에서 일반 대중들의 참여가 증가함에 따라, 그것은 정책 입안자/언론인들이 에 대한 온라인 여론조사를 만드는 것이 이제 점점 더 보편화되고 있다. 사람들의 정치적 성향을 구체적으로 이해하기 위한 소셜 미디어 위치 여기서 주의할 점은 영향력 있는 사람들만이 그런 것을 만들 수 있다는 것이다. 온라인 투표와 대규모로 연락하는 것. 더 나아가, 이러한 경우, 유권자의 분포는 통제할 수 없으며, 사실 편향되어 있을 수 있다. 에서 다른 한편으로, 만약 우리가 소셜 미디어를 통해 공개적으로 이용 가능한 데이터를 해석할 수 있다면. 사용자의 정치적 성향을 조사하면, 우리는 통제할 수 있을 것이다. 조사 인구에 대한 통찰력, 조사 비용을 낮게 유지하고 또한 관계자를 포함하지 않고 공개적으로 이용 가능한 데이터를 수집한다. 이런 이유로 우리는 정치를 위한 자율적인 준감독 프레임워크를 도입한다. 그 목표를 더 나아가기 위한 기울기 감지. 우리 모델의 장점은 거대한 훈련 데이터도 필요하지 않으며 소셜 저장도 필요하지 않습니다. 네트워크 매개 변수 그럼에도 불구하고, 그것은 93.7%의 정확도를 달성한다. 주석이 달린 데이터; 더 나아가, 클래스당 주석이 달린 몇 가지 예만 있다. 경쟁력 있는 성과를 달성합니다. 우리는 그 모델이 자원이 제한된 상황에서도 매우 효율적이라는 것을 발견했다. 설정 및 예측에서 도출된 통찰력은 수동 설문 조사와 일치한다. 다양한 실제 시나리오에 적용될 때의 결과. 

 

 

반응형

댓글