Biais de genre dans les films grands publics

Une approche computationnelle

This page is also available in English, German and brazilian Portuguese.


Cet article est un compte-rendu informel de l'étude publiée dans Humanities and Social Sciences Communications par Antoine Mazieres, Telmo Menezes et Camille Roth.


Les débats actuels sur les préjugés sexistes dans les médias s'appuient notamment sur un effort académique de longue date visant à saisir, analyser et déconstruire les représentations du féminin et du masculin sur une variété de supports tels que la télévision, les livres et la radio. Depuis les années 1950, les chercheur·es ont identifié les stéréotypes sexuels, les biais dans les rôles professionnels, la mise en scène du corps, du mariage et du viol, et ont mis en évidence des motifs forts et constants, par exemple les femmes apparaissant "dépendantes des hommes", "moins intelligentes", "moins compétitives", "plus sexualisées" (Linda Busby, 1975).

Ces travaux requièrent un travail d'analyse manuelle massif qui nécessite que de nombreux chercheur·es se mettent d'accord sur la manière d'annoter un média, de définir une compréhension commune des variables et des significations, et, bien sûr, d'évaluer le contenu en le regardant, l'écoutant ou le lisant de nombreuses fois. Cela permet de systématiser une compréhension et une évaluation approfondies des représentations en jeu mais limite la possibilité de la reproduire à grande échelle et à plusieurs moments dans le temps pour saisir les tendances sous-jacentes.

Notre travail explore la possibilité d'utiliser l'intelligence artificielle et les algorithmes d'apprentissage automatique pour faire face à ces limites. S'il est impossible, du moins pour les algorithmes actuels, de capturer systématiquement des représentations fines sur des concepts tels que la dépendance, l'intelligence, la compétitivité ou la sexualisation, ceux-ci parviennent en revanche à exécuter rapidement des dizaines de millions de tâches simples, comme le comptage des occurrences. Donc,

Nous nous sommes concentrés sur une tâche très simple : compter les visages de femmes et d'hommes apparaissant dans plus de 3500 films grands publics couvrant plus de trois décennies.

Nous avons sélectionné ces films parce qu'ils sont à la fois amplement partagés sur les réseaux pair-à-pair et bien documentés sur IMDb: l'idée est de capturer des œuvres à la fois caractéristiques des représentations culturelles et susceptibles de les influencer. Pour chaque film, nous avons extrait une image toutes les deux secondes et appliqué des algorithmes permettant de détecter la présence de visages et de deviner s'il s'agit de femmes ou d'hommes: voir ci-dessous les exemples d'estimations réussies et d'erreurs illustratives. L'existence de ce type d'erreur n'est pas nécessairement fatale au protocole. Dans notre cas, il importe davantage en effet de savoir précisément dans quelle mesure les algorithmes se trompent pour corriger la précision des observations sur l'ensemble du jeu de données, qui comprend plus de 12 millions d'images.

Ratio de visages féminins et son évolution

En moyenne, sur l'ensemble du jeu de données, seuls 34,52% des visages affichés dans un film sont détectés comme féminins. Pour illustrer de manière informelle ce que ce ratio signifie en pratique, voici quelques exemples de la manière dont certains films à forte audience sont représentés. Premièrement, parmi les films présentant un pourcentage élevé de visages masculins (ratio de visages féminins < 25 %), on trouve des films tels que Pirates des Caraïbes (2007), Star Wars (2005), Matrix (2003), Independence Day (1996) ou Forest Gump (1994), qui présentent tous un ratio d'environ 23 %. Des films comme The Hunger Games (2014), Jurassic World (2015), Rogue One (2016) et Gravity (2013) se situent autour d'une parité femme-homme, avec un ratio compris entre 45 % et 55 %. Enfin, le film présentant le ratio le plus élevé de visages féminins (68%) est Bad Moms (2016), suivi de près par des films tels que Sisters (2015), Life of the Party (2018) et Cake (2014).

Comment ce ratio évolue-t-il dans le temps ? Nous avons divisé temporellement notre jeu de données en 4 groupes composés d'un nombre égal de films. Nous avons observé une augmentation significative du nombre de visages de femmes. De 1985 à 1998, ce ratio est de 27% et s'approche d'une parité femme-homme dans la période la plus récente, de 2014 à 2019, avec un ratio de 44,9%. De plus, la diversité des situations (formellement, la variance de ce ratio) augmente. Cela signifie que les films produits récemment ont tendance à explorer un spectre plus diversifié de valeurs du ratio femme-homme à l'écran.

Il convient d'être prudent dans l'interprétation de ces résultats. Dans l'ensemble, nous avons mesuré le nombre de visages, ce qui est un bon indicateur de la présence physique à l'écran. Nous en déduisons donc des sur- et sous-représentations, mais nous ne savons rien de la manière dont les femmes ou les hommes sont réellement représentés. Un effort de recherche conséquent reste à fournir afin de pouvoir déduire de la représentativité que nous avons évaluée des éléments sur les représentations réelles des femmes et des hommes dans les films. Il se peut en effet que les sociétés de production aient été fortement incitées à favoriser une présence accrue de femmes dans les films, mais que cet effort ait pu aboutir à un simple "purplewashing" où les stéréotypes de genre restent présents.

Autres résultats

Le ratio de visages féminins varie significativement d'un genre de film à l'autre. Les films policiers sont ceux qui affichent le moins de visages féminins (31,3%) alors que les films d'horreur en affichent le plus avec un ratio de 37,1%, suivis de près par les romances et les comédies. Nous avons utilisé cette variation pour comparer notre métrique avec une autre caractéristique célèbre appelée le test de Bechdel : on dit qu'un film réussit ce test lorsque au moins deux femmes nommées parlent entre elles d'autre chose que d'un homme. Il apparaît que les deux mesures sont fortement corrélées dans leurs variations d'un genre de film à l'autre, ce qui laisse supposer que le fait de compter les visages pourrait être un indicateur pertinent de caractéristiques plus sémantiques.

Nous avons également examiné les métadonnées d'IMDb telles que le budget, la note d´évaluation laissée par les utilisateur·es et le nombre d’évaluateur·es et leur caractéristiques démographiques. Existe-t-il une corrélation entre la présence des femmes à l’écran et le budget d’un film, ou le bénéfice qu’il a réalisé ? La note d'un film sur IMDb laissée par les femmes ou les hommes est-elle une indication du nombre de femmes à l'écran ? Le nombre d'évaluateur·es l'est-il également ? Il apparaît que, malgré des motifs intéressants, il n'existe pas de corrélation forte (positive ou négative) entre ces caractéristiques et la proportion de visages féminins dans un film, à l'exception d'une seule : la proportion d'évaluatrices. Cela signifie que si la valeur que les femmes accordent à un film n'est pas directement liée au nombre de femmes dans ce film, la proportion de femmes parmi les évaluateur·ices l’est.

Dernières remarques et quelques références

Et voilà ! Nous avons insisté pour limiter nos affirmations à ce que nous connaissons - l'utilisation parcimonieuse de méthodes computationnelles en sciences sociales - afin de ne pas risquer de tirer des conclusions hasardeuses concernant la représentation du genre à l'écran, dont nous ne sommes pas experts. La version académique de cet article fournit davantage de détails sur notre protocole de recherche, sur la façon dont nous avons traité les erreurs des algorithmes, sur les résultats mineurs concernant un éventuel biais de genre dans la mise-en-scène et la mise-en-cadre des personnages, et bien plus encore. N'hésitez pas quoi qu'il en soit à nous contacter par e-mail ou sur Twitter pour toute question.

Vous pouvez télécharger notre jeu de données ici.

Si vous souhaitez en savoir plus sur les sujets mentionnés dans cet article, voici quelques pistes à suivre :

  • En ce qui concerne le genre dans les médias, Linda Busby (1975) et Rena Rudy et al. (2010) fournissent d'excellents points de départ.
  • Le travail de Tanaya Guha et al. (2015, 2021) présente de nombreuses similitudes avec le nôtre, avec des algorithmes plus efficaces mais beaucoup moins de données (notamment, pas d'analyse temporelle).
  • L'institut Geena Davis (qui utilise la méthode de Guha) et le rapport annuel de GLAAD fournissent de nombreux chiffres et analyses sur la présence des femmes dans les médias.
  • Les travaux de Joy Buolamwini et Timnit Gebru (2018) et Kate Crawford et Trevor Paglen (2019) fournissent des critiques détaillées sur la fabrique et les performances des algorithmes d'analyse d'images.
  • Pour une vue d'ensemble de l'utilisation de l'analyse computationnelle d'image dans les sciences sociales, Taylor Arnold et Lauren Tilton (2019) est une référence intéressante.