Vivendo o meme: AI tão engraçada quanto seres humanos para gerar legendas de imagem

Featured, News

É possível obter um certificado de pós-graduação para criar memes. Pelo menos se você usar deep learning para fazer isso.

Basta perguntar a Lawrence Peirson.

O jovem de 23 anos está fazendo um doutorado em astrofísica teórica em Stanford, mas decidiu se inscrever em alguns cursos de AI este ano. Ele e seu colega E. Meltem Tolunay criaram uma rede neural que coloca legendas em memes para um projeto de classe, agora publicado em um white paper oficialmente intitulado “Dank Learning.” (“Dank” significa “maneiro”)

Existem muitos exemplos de treinamento de modelos de deep learning para produzir legendas literais para uma imagem. Por exemplo, legendar com precisão uma imagem como “homem surfando em prancha” ou “criança com sorvete de casquinha”. Com os memes, o desafio de Peirson era ver se uma rede neural poderia ir além da interpretação literal e criar legendas engraçadas.

Embora inicialmente duvidasse que os memes seriam engraçados, Peirson descobriu que o modelo de deep learning produzia “um humor bastante interessante e original”.

Em busca do meme perfeito

A rede de deep learning legendou este meme, uma variação do popular modelo de conselhos de animais. Para coletar dados de treinamento para o modelo de deep learning, Peirson coletou cerca de 400 mil memes gerados pelo usuário no site memegenerator.net. O site fornece modelos de memes e permite que os usuários criem suas próprias legendas.

O conjunto de dados incluiu cerca de três mil imagens de base, cada uma com muitas legendas diferentes. Como os dados de entrada foram obtidos por crowdsourcing, havia uma ampla gama de qualidade nas legendas dos memes que o modelo de deep learning processou.

“Com 400 mil memes, a maioria não vai ser tão engraçada, mas pelo menos ensinam ao sistema o que é um meme, qual piada é relevante”, disse ele.

Os memes da Internet circulam pela Web há anos, com forte presença em sites como Reddit, Facebook, 9GAG e Quick Meme. Os mais populares podem obter mais de 2 milhões de legendas exclusivas criadas.

Os memes costumam referenciar a cultura pop, eventos atuais ou partes esotéricas de uma subcultura particular da internet. (Peirson roda uma página de meme chamada “The specific heat capacity of europium at standard temperature and pressure.”)

Como resultado, eles absorvem tanto o que é bom quanto o que é ruim da cultura digital. O artigo observa um viés nos dados de treinamento em relação a memes desnecessários, racistas e sexistas. Peirson vê a necessidade de filtrá-los em trabalhos futuros, mas ressalta que “é um grande problema no processamento de linguagem natural em geral”, não um específico dos memes.

O modelo de deep learning foi programado em CUDA e usou uma placa de vídeo NVIDIA TITAN Xp. Peirson e Tolunay tentaram usar dados não rotulados e dados rotulados com o título do meme (por exemplo, “success kid” ou “trollface”), mas não viram diferença significativa na qualidade dos memes.

“Eles são muito engraçados de um jeito que quase faz sentido, mas não faz”, disse Peirson. “Os memes se prestam a esse tipo de humor.”

A rede de deep learning legendou este meme, uma variação do modelo popular de conselhos de animais

Não é qualquer meme que pode ser “maneiro”

Para avaliar o sucesso do modelo de deep learning, os colaboradores calcularam uma pontuação de perplexidade, que verifica se a rede neural consegue identificar padrões claros nos dados. Eles calcularam essa métrica para algumas centenas de memes com formatos predefinidos, como o meme de Boromir, que sempre começa com a frase “one does not simply”.

Mas o verdadeiro teste de um meme é se é engraçado.

Em uma pesquisa qualitativa, Peirson e seu coautor apresentaram às pessoas um meme gerado pelo homem e um profundo gerado por deep learning, lado a lado. Eles fizeram duas perguntas: se o sujeito achava que o meme foi criado por um humano ou computador e como o sujeito avaliaria o humor do meme.

Os dados mostram que os memes profundos de deep learning “eram bastante indistinguíveis dos memes reais,” diz Peirson.

Eles também investigaram como a rede neural capturaria imagens que não estavam entre os modelos no conjunto de dados de treinamento. Nesses casos, o algoritmo infere padrões da imagem desconhecida com base no que foi visto nos dados de treinamento. Peirson até mostrou ao sistema de deep learning uma foto de seu próprio rosto para testar isso, com resultados interessantes.

Quando Peirson executou o modelo de deep learning em uma foto de seu próprio rosto, esta foi uma das legendas que surgiu

Os memes costumam se tornar virais, e parece que os white papers com base em memes não são exceção. Peirson diz que ficou “extremamente surpreso” com a cobertura da mídia e o grande interesse no projeto. Um aplicativo móvel complementar, também chamado de Dank Learning, estará disponível em breve na App Store.

Esse projeto, diz ele, ofereceu uma nova perspectiva sobre como os memes podem ser poderosos. Milhões de usuários em todo o mundo consomem memes diariamente nas redes sociais.

Peirson vê o potencial de uma IA forte para produzir memes rapidamente sobre os eventos atuais e influenciar a opinião pública, ou fazer com que os anunciantes usem os memes para reconhecimento da marca: “Ter essa viralização é uma maneira incrível de promover algo”.

 

traduzido do artigo de

Isha Salian escreve sobre deep learning, ciência e saúde, entre outros tópicos, como parte da equipe de comunicação corporativa da NVIDIA. Ela ingressou na empresa como estagiária no verão de 2015. Isha tem  mestrado em jornalismo, bem como graduação em comunicação e inglês, de Stanford. Fora do trabalho, ela gosta de dança clássica indiana, leitura, Netflix e descobrir novos lugares para comer.


Professor, pseudo PC Gamer e ex jogador de RPG, escreve uns textos e grava uns vídeos mas na verdade mesmo só quer mesmo é dormir e perder a pança sem fazer exercícios.