The article analyzes new data sources in tourism, concentrating on opinions from social networking sites, examining them from administrative-legal, economic, and social perspectives. Growing big data sets have evolved from the classic 3V model (volume, variety, velocity) to expanded concepts, emphasizing the importance of data reliability (veracity, validity) and value. Although big data analysis yields benefits, it simultaneously poses serious threats to privacy and the risk of re-identification of individuals, necessitating cohesive and ethical regulations. In the legal context, the GDPR (RODO) is the paramount EU act concerning data protection. In Poland, the basis is the Act on Public Statistics, permitting the processing of personal data for the statistical purpose of monitoring tourism. At the EU level, Regulation (WE) No 223/2009 allows national statistical offices to obtain absolutely necessary data free of charge from private data holders if its use significantly reduces the burden on businesses. Furthermore, Regulation (UE) 2024/1028 (effective May 2026) imposes an obligation on short-term rental platform providers to transmit data concerning their activity monthly. Web scraping may prove to be the key method for acquiring big data for public statistics. This technique automates the collection of information from websites, accelerates data gathering, and allows for near real-time analysis. Scraping is a valuable resource supplementing official statistics, allowing for the assessment of the quality of the offering and the forecasting of tourist behavior. The empirical part of the article utilized web scraping to download 4,480 reviews from Google Maps for the Wawel Royal Castle. The experiment confirmed that extending the waiting time for a visit significantly lowers the rating provided. These results emphasize the crucial importance of efficient management of tourist traffic for visitor satisfaction. Future research should aim to integrate public data with scraped data, which has been termed the “Tourism Demand Horizon”.Artykuł analizuje nowe źródła danych w turystyce, koncentrując się na opiniach z serwisów społecznościowych, w ujęciu administracyjno-prawnym, ekonomicznym i społecznym. Rosnące zbiory big data ewoluowały od modelu 3V do rozbudowanych ujęć, podkreślających znaczenie wiarygodności i wartości danych. Choć analiza big data przynosi korzyści, rodzi jednocześnie poważne zagrożenia dla prywatności i ryzyko ponownej identyfikacji osób, co wymaga spójnych i etycznych regulacji. W kontekście prawnym, RODO jest nadrzędnym aktem UE w zakresie ochrony danych. W Polsce podstawę stanowi Ustawa o statystyce publicznej, zezwalająca na przetwarzanie danych osobowych do monitorowania turystyki. Na poziomie unijnym, Rozporządzenie (WE) nr 223/2009 pozwala krajowym urzędom statystycznym na bezpłatne pozyskanie absolutnie niezbędnych danych od prywatnych posiadaczy, jeśli zmniejsza to obciążenie przedsiębiorstw. Ponadto, Rozporządzenie (UE) 2024/1028 (obowiązujące od maja 2026 r.) nakłada na dostawców platform najmu krótkoterminowego obowiązek comiesięcznego przekazywania danych dotyczących działalności. Kluczową metodą pozyskiwania big data dla statystyki publicznej może okazać się web scraping. Technika ta automatyzuje gromadzenie informacji z witryn, przyspiesza zbieranie danych i umożliwia analizy w czasie niemal rzeczywistym. Scraping jest cennym zasobem uzupełniającym oficjalne statystyki, pozwalającym na ocenę jakości oferty i prognozowanie zachowań turystów. Część empiryczna artykułu wykorzystała web scraping do pobrania 4480 opinii z Google Maps dla Zamku Królewskiego na Wawelu. Eksperyment potwierdził, że wydłużanie czasu oczekiwania na wizytę znacząco obniża wystawioną ocenę. Wyniki te podkreślają kluczowe znaczenie sprawnego zarządzania ruchem turystycznym dla satysfakcji odwiedzających. Przyszłe badania powinny dążyć do integracji danych publicznych ze scrapowanymi, co nazwano „Tourism Demand Horizon”
Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.