Uncovering population dynamics using mobile phone data : the case of Helsinki Metropolitan Area

Abstract

Understanding the whereabouts of people in time and space is necessary for unraveling how our societies function. Regardless, our understanding of human presence is predominantly based on static residential population data, which is often outdated and excludes certain population groups, such as commuters or tourists. In the light of development towards 24-hour societies and the needs for promoting sustainable and equitable urban planning, reliable data of population dynamics are needed. To this end, ubiquitous mobile phones provide an attractive source for estimating the spatiotemporal digital footprints of people. In this study, I set out to investigate 1) the feasibility of three different aggregated network-based mobile phone data – the number of voice calls, data transmission and general network connection attempts – as a proxy for human presence, 2) how does the population distribution vary in Helsinki Metropolitan Area over the course of a regular weekday and 3) the role of temporally-sensitive population data when analysing dynamic accessibility to grocery stores and transport hubs. To my best knowledge, this is the first attempt when mobile phone data is used to reveal population dynamics for scientific purposes in Finland. Mobile phone data collected by the mobile network operator Elisa in 2017–2018 and ancillary data about land cover, buildings and a time use survey were used to estimate the 24-hour population distribution of the Helsinki Metropolitan Area. The mobile phone data were allocated to statistical 250 m x 250 m grid cells using an advanced dasymetric interpolation method and validated against population register data from Statistics Finland. The resulting 24-hour population was used to map the pulse of the city and to introduce the first fully dynamic accessibility model in the study area. The results show that data use is a good proxy for people and outperforms voice calls or overall network connection attempts. During daytime, the static population overestimates the population in residential areas and underestimates the population in work and service areas. In general, the 24-hour population reveals the pulse of a city, which is highlighted especially in the inner city of Helsinki, where the relative share of population of the study area increases by 50 % from the share at night-time to its peak at noon. The results of the case study suggest that integrating dynamic population data to location-based accessibility analysis provides more realistic results compared to static population data, but the significance of dynamic population data depends on the study context and research questions. In summary, aggregated network-driven mobile phone data is a feasible alternative for dynamic population modelling, however, different mobile phone data types vary in representativeness, which should be taken into account when using mobile phone data in research. To this end, critical evaluation of data and transparent data description are essential. Overall, understanding 24-hour societies and supporting sustainable urban planning necessitates dynamic population data, but advancements in data policy and availability are needed to harvest these possibilities. The results of this study also provide new empirical insights of the population dynamics in the study area, which can be used to advance planning and decision making.Ymmärrys väestön alueellisen jakautumisen ajallisesta vaihtelusta on keskeistä yhteiskuntamme toiminnan ymmärtämiseksi. Tästä huolimatta ymmärrys ihmisten läsnäolosta on vähäistä ja perustuu pääasiassa staattisiin asuinpaikkakohtaisiin väestötietoihin, jotka ovat usein vanhentuneita ja saattavat johtaa eräiden väestöryhmien, kuten työmatkalaisten tai turistien, sivuuttamiseen. Kehityksen kohti ympärivuorokautista yhteiskuntaa ja kestävän ja tasa-arvoisen kaupunkisuunnittelun edistämisen tarpeiden valossa tarvitaan luotettavia tietoja väestön dynamiikasta. Tässä tutkimuksessa tarkastelin 1) kolmen eri verkkopohjaisen matkapuhelinaineiston – puheluiden, tiedonsiirtoyhteyksien ja verkkoyhteyksien muodostusyritysten lukumäärän – soveltuvuutta ihmisen läsnäolon kuvaajana, 2) miten väestöjakauma vaihtelee pääkaupunkiseudulla säännöllisen arkipäivän aikana ja 3) temporaalisten väestötietojen käytön roolia saavutettavuusmallinnuksessa tarkasteltaessa ruokakauppojen ja liikenteen solmukohtien saavutettavuutta joukkoliikenteellä. Parhaan tietämykseni mukaan tämä on ensimmäinen kerta, kun matkapuhelinaineistoja käytetään väestön dynamiikan tarkasteluun tieteellisiin tarkoituksiin Suomessa. Matkapuhelinoperaattori Elisan keräämiä matkapuhelinaineistoja (2017–2018) sekä aineistoja maankäytöstä, rakennuksista ja ajankäyttötutkimuksen tuloksia käytettiin pääkaupunkiseudun 24 tunnin väestöjakauman arvioimiseen. Matkapuhelimen tiedot allokoitiin 250 m x 250 m tilastoruutuihin käyttäen edistynyttä dasymetristä interpolointimenetelmää ja validoitiin Tilastokeskuksen väestörekisteritietoja käyttäen. Tuloksena saatua 24 tunnin väestöaineistoa käytettiin kaupungin pulssin analysointiin ja ensimmäisen täysin dynaamisen saavutettavuusmallin toteuttamiseen tutkimusalueella. Tutkimuksen tulokset osoittavat, että matkapuhelinten tiedonsiirto on hyvä kuvaaja ihmisten sijainnille ja parempi kuin puhelut tai verkkoyhteyksien muodostusyritykset. Päivän aikana staattinen väestöaineisto yliarvioi väestöä erityisesti asuinalueilla samalla aliarvioiden väestöä alueilla, joilla on työpaikka- tai palvelukeskittymiä. Yleisesti katsottuna 24 tunnin väestö paljastaa kaupungin pulssin, mikä korostuu erityisesti Helsingin keskustassa, jossa tutkimusalueen väestön suhteellinen osuus kasvaa 50 %:lla yöstä sen huippuun keskipäivällä. Tapaustutkimuksen tulokset havainnollistavat kuinka dynaamisen väestötietojen integroiminen sijaintipohjaiseen saavutettavuustarkasteluun tarjoaa realistisempia tuloksia verrattuna staattiseen väestöaineistoon, mutta dynaamisten väestötietojen integroimisen merkitys riippuu tutkimuksen kontekstista ja tutkimuskysymyksistä. Yhteenvetona voidaan todeta, että aggregoitu verkkopohjainen matkapuhelinaineisto on hyvä vaihtoehto dynaamisen väestön mallintamiseen, mutta soveltuvuus vaihtelee aineistojen välillä, mikä on tärkeä huomioida käytettäessä matkapuhelinaineistoja tutkimuksessa. Tätä vasten aineiston kriittinen tarkastelu ja läpinäkyvä aineiston dokumentointi on olennaista. Kaiken kaikkiaan 24 tunnin yhteiskuntien ymmärtäminen ja kestävän kaupunkisuunnittelun tukeminen edellyttävät dynaamisia väestötietoja, mutta tietopolitiikan ja aineistojen saatavuuden edistäminen on välttämätöntä tämän toteutumiseksi. Tämä työ tarjoaa myös uutta empiiristä tietoa väestön dynamiikasta pääkaupunkiseudulla, jota voidaan käyttää suunnittelun ja päätöksenteon tukena

    Similar works