This page is also available in English, French and German.
Este artigo é um relatório informal do estudo publicado em Humanities and Social Sciences Communications por Antoine Mazieres, Telmo Menezes e Camille Roth.
Os debates atuais sobre o viés de gênero na mídia apoiam-se em um esforço acadêmico de longa data para capturar, analisar e desconstruir representações do feminino e do masculino em uma variedade de meios, tais como TV, livros e rádio. Desde os anos 50 que os pesquisadores têm vindo a identificar estereótipos sexuais, assim como preconceitos em papéis ocupacionais, encenação corporal, casamento e estupro, e a descobrir padrões claros e estáveis, por exemplo, de mulheres que aparecem como "dependentes de homens", "menos inteligentes", "menos competitivas", "mais sexualizadas" (Linda Busby, 1975).
Este tipo de análise requer um trabalho árduo, exigindo que os muitos pesquisadores concordem sobre a forma de anotar uma mídia, sobre como definir um entendimento comum de características e significados e, é claro, sobre como avaliar o conteúdo, tendo que o escutar, ler, ou a ele muitas vezes assistir. Isto permite a sistematização de uma avaliação e compreensão profunda das representações em causa, mas limita a possibilidade da sua reprodução em grande escala e/ou em vários pontos no tempo, tendo em vista a captura das tendências subjacentes.
Nosso trabalho explora a possibilidade de utilizar a inteligência artificial assim como algoritmos de aprendizagem para lidar com essas limitações. Por um lado, não é possível a um computador a captura sistemática de representações detalhadas sobre conceitos como dependência, inteligência, competitividade ou sexualização (pelo menos por enquanto). Por outro lado, os algoritmos conseguem realizar dezenas de milhões de tarefas simples, tais como a contagem de ocorrências, em pouco tempo. Concentramo-nos portanto em uma tarefa muito simples:
Selecionamos filmes que são amplamente compartilhados nas redes peer-to-peer, assim como bem documentados no IMDb, sendo o objetivo o de captar obras que sejam tanto típicas das várias representações culturais quanto influentes na sua formação. Para cada filme extraímos uma imagem a cada dois segundos, às quais aplicamos algoritmos de análise de imagem para detectar a presença de rostos, que são também classificados como masculinos ou femininos. Apresentamos abaixo os exemplos de classificações correctas e erradas. A existência de erros não significa necessariamente que o protocolo seja defeituoso. O importante é indicar precisamente quando e como os algoritmos cometem erros, a fim de corrigir a precisão das observações em todo o conjunto de dados, que consiste em mais de 12 milhões de imagens.
Em média, em todo o conjunto de dados, apenas 34,52% dos rostos exibidos em um filme são classificados como femininos. Para ilustrar informalmente o que esta proporção significa na prática, aqui estão alguns exemplos retirados de filmes de grande bilheteria. Primeiro, entre os filmes com uma alta porcentagem de rostos masculinos (proporção de rostos femininos < 25%) encontramos casos como Piratas do Caribe (2007), Star Wars (2005), Matrix (2003), Dia da Independência (1996) ou Forest Gump (1994), todos com uma proporção de cerca de 23%. Filmes como The Hunger Games (2014), Jurassic World (2015), Rogue One (2016) e Gravity (2013) se encontram próximos da paridade feminino-masculino, com uma proporção entre 45% e 55%. Finalmente, o filme com a maior proporção de rostos femininos (68%) é Bad Moms (2016), seguido de perto por filmes como Sisters (2015), Life of the Party (2018) e Cake (2014).
Como está evoluindo esta proporção com o tempo? Dividimos temporalmente nosso conjunto de dados em 4 partes, compostas por um número igual de filmes. Observamos um aumento significativo do número de rostos de mulheres. De 1985 a 1998, esta proporção é de 27% e chega ao ponto mais próximo da paridade mulher-homem no período mais recente, de 2014 a 2019, com uma proporção de 44,9%. Além disso, a diversidade de situações (formalmente, a variância desta proporção) tem vindo a aumentar. Isso significa que os filmes produzidos recentemente tendem a explorar uma gama mais diversificada de proporções mulher-homem na tela.
A interpretação destes resultados deve ser feita com cuidado. De forma resumida: contamos o número de faces, o que é um bom indicador da presença física na tela, mas isso significa que estamos lidando apenas com medidas simples de sobre ou sub-representação, não com a forma como mulheres e homens são realmente representados. Há ainda um esforço substancial de pesquisa a ser feito para que possamos deduzir mais sobre as reais representações de mulheres e homens a partir das quantificações que propomos. Embora as produtoras possam ter fortes incentivos para encorajar uma maior presença de mulheres nos filmes, este esforço pode facilmente resultar em mero "purplewashing", reproduzindo os estereótipos conservadores de gênero.
A proporção de rostos femininos varia significativamente de um tipo de filme para outro. Os filmes de crime apresentaram o menor número de rostos femininos (31,3%), enquanto que os filmes de terror apresentaram o maior número, com uma proporção de 37,1%, seguidos de perto por romances e comédias. Usamos esta variação para comparar nossa métrica com uma outra baseada em um critério famoso, o chamado “teste de Bechdel”: um filme passa este teste se pelo menos duas mulheres cujo nome seja conhecido falarem uma com a outra sobre algo que não um homem. Ambas as medidas estão altamente correlacionadas, mesmo em suas variações entre os tipos de filmes, sugerindo que a contagem de rostos pode ser um indicador relevante de características semânticas.
Examinamos além disso os metadados do IMDb, tais como orçamento, nota deixada por utilizadores, número de avaliadores e sua demografia. Será que "mais mulheres em um filme" se correlaciona com mais ou menos dinheiro investido ou feito por um filme? O valor da classificação de um filme no IMDb por mulheres ou homens é indicativo da participação de mulheres na tela? O número de críticos também é indicativo? Parece que, apesar de padrões interessantes, não há uma forte correlação (positiva ou negativa) entre essas características e a proporção de rostos femininos em um filme, exceto em um caso: a proporção de mulheres entre os críticos. Isto significa que, enquanto que a pontuação que as mulheres dão a um filme não reflete o número de proporção de mulheres nesse filme, existe uma correlação entre a proporção de mulheres entre os críticos e a proporção de mulheres no filme.
Et Voilà! Insistimos em limitar nossas conclusões ao nosso domínio: o uso parcimonioso de métodos computacionais nas ciências sociais. Evitamos saltar para interpretações especulativas no domínio dos estudos do gênero, uma área na qual temos grande interesse mas pouca experiência. A versão acadêmica deste artigo dá mais detalhes sobre nosso protocolo de pesquisa, sobre como lidamos com os erros dos algoritmos, sobre resultados menores sobre possíveis viés de gênero na mise-en-scène e mise-en-cadre de personagens, e muito mais. No entanto, se alguma pergunta ficar sem resposta, sinta-se à vontade para nos contatar por e-mail ou Twitter.
Pode baixar aqui o nosso conjunto de dados.
Se você gostaria de saber mais sobre os tópicos mencionados neste artigo, aqui estão algumas pistas a seguir: