
Repérer l’activité humaine dans les données d’utilisation d’Internet
Le nombre de blocs sensibles au changement (zone de cercle) par géolocalisation (dans une cellule de grille 2 × 2 ◦). Ensemble de données : 2020m1. Crédit: Actes de la conférence ACM 2023 sur la mesure Internet (2023). DOI : 10.1145/3618257.3624796
La plupart des gens qualifient une panne d’Internet de désagrément. Les chercheurs de l’ANT Lab (Analysis of Network Traffic) de l’USC appellent cela un point de données.
L’ANT Lab, basé à l’Institut des sciences de l’information (ISI) de l’USC Viterbi, analyse l’Internet public à la recherche de pannes depuis 2014. L’étudiant Xiao Song et John Heidemann, scientifique principal à l’ISI et professeur-chercheur en informatique à l’USC Viterbi School of Engineering, étudiaient ces données lorsque l’épidémie de COVID-19 a commencé en 2020.
Heidemann a déclaré : « Nous avons été inspirés par le réseau de l’ISI, où nous pouvions voir quatre ou cinq augmentations chaque semaine, correspondant à la semaine de travail. Après les vacances de Martin Luther King, nous avons vu quatre augmentations au cours de cette semaine de travail parce que personne n’y est venu. Lundi. Et puis nous avons vu le COVID frapper, et tout d’un coup, il n’y a eu plus de bosses. »
Les « bosses » qu’ils voyaient étaient les ordinateurs portables et les adresses IP des employés d’ISI se connectant au réseau ISI lorsqu’ils étaient au travail. Heidemann et Song ont pensé que cela pourrait peut-être être généralisé et appliqué à l’ensemble d’Internet, pour voir s’ils pouvaient capter des signaux d’activité humaine à partir des données d’utilisation d’Internet.
L’article qui en a résulté, « Inferring Changes in Daily Human Activity from Internet Response », est la première démonstration de la déduction de changements dans l’activité humaine, tels que la transition vers le travail à domicile, à partir de la réactivité IP, et un exemple important d’utilisation d’Internet. pour comprendre notre monde.
Heidemann et Song ont présenté leur article lors de la conférence Internet Measurement 2023, qui s’est tenue à Montréal, au Canada, du 24 au 26 octobre 2023.
Internet n’est pas disponible, mais les employés le sont
Depuis 2013, l’ANT Lab mène un projet en cours qui sonde activement Internet pour détecter les pannes dans le monde entier (actuellement 5 millions de réseaux mesurés toutes les 11 minutes).
Heidemann et Song ont utilisé ces données existantes pour rechercher et analyser les changements dans l’utilisation d’Internet dans le monde qui pourraient indiquer quelque chose sur le comportement humain. Ils ont développé des algorithmes pour nettoyer les données, extraire les tendances sous-jacentes et détecter les changements d’activité.
Ils ont découvert qu’en utilisant leurs algorithmes, ils pouvaient identifier les ordres de travail à domicile mis en place en raison de l’émergence du COVID-19 en 2020. Ils pouvaient également identifier d’autres changements dans l’activité humaine, tels que les jours fériés nationaux et les changements gouvernementaux. -des couvre-feux obligatoires.
Song a expliqué : « Nous avons recherché des changements significatifs dans nos cartes de changements de comportement humain et comparé ces dates d’événements de changement aux reportages d’actualité pour le même endroit. Par exemple, vers la fin mars 2020, l’utilisation du réseau a chuté à Manille, aux Philippines. La chronologie des informations a confirmé que le changement que nous avons constaté était en corrélation avec le confinement dû au COVID à Manille qui a commencé le 15 mars 2020. »
Événements du monde réel repérés via l’activité Internet : deux études de cas
La Chine en janvier 2020
Grâce à leur technique, l’équipe a détecté des changements d’activité en Chine fin janvier 2020. Ils ont corrélé ces changements avec deux événements simultanés : le confinement dû au COVID à Wuhan et la fête du Printemps d’une semaine, une fête nationale où les gens ne vont généralement pas dans leurs bureaux. Étant donné que le confinement de Wuhan et la Fête du Printemps étaient des événements simultanés, ils ne peuvent pas attribuer spécifiquement les changements de réseau à l’un ou l’autre.
L’Inde en février et mars 2020
L’équipe a détecté des changements de réseau pendant plusieurs jours en Inde, en février et mars 2020. Lorsqu’ils ont examiné l’actualité dans la région, ils ont constaté que l’activité du réseau en février était en corrélation avec des émeutes en Inde associées à des manifestations contre la loi sur l’immigration. Alors que l’activité du réseau en mars correspondait au premier couvre-feu lié au COVID en Inde et à l’ordre de verrouillage qui a suivi.
Ces études de cas suggèrent que les changements de comportement humain qui les conduisent à travailler à domicile peuvent avoir de multiples causes, mais que leurs conséquences sur Internet sont similaires.
Et après?
Heidemann a déclaré : « Notre premier objectif était simplement la curiosité : pouvons-nous voir l’activité humaine sur Internet ? » Maintenant que l’équipe a montré qu’elle en était capable, que peuvent-elles faire avec ces informations et en tirer des leçons ? Il a poursuivi : « Dans le contexte du COVID, nous pourrions explorer des questions telles que : quels pays ont des mesures de confinement ou de confinement à domicile ? ou est-ce qu’ils ne s’y conforment pas et se mettent quand même au travail ? »
Cette capacité à détecter les tendances de l’activité humaine à partir des données Internet offre une nouvelle capacité à comprendre notre monde, complétant d’autres sources d’informations publiques telles que les reportages et l’observation des virus des eaux usées.
Heidemann a expliqué : « Les gens utilisent des systèmes de détection des eaux usées pour comprendre le niveau de fond de COVID dans une ville. Et c’est formidable, car c’est une méthode anonyme et fiable pour juger de ce qui se passe dans une ville dans son ensemble. J’espère que notre technique pourrait fournir un type similaire d’observation anonyme, indépendante et tierce sur ce qui se passe, et cela pourrait alimenter les décisions de santé publique.
Plus d’information:
Xiao Song et al, Déduire des changements dans l’activité humaine quotidienne à partir de la réponse Internet, Actes de la conférence ACM 2023 sur la mesure Internet (2023). DOI : 10.1145/3618257.3624796
Fourni par l’Université de Californie du Sud
Citation: Repérer l’activité humaine dans les données d’utilisation d’Internet (1er novembre 2023) récupéré le 1er novembre 2023 sur
Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.