96 research outputs found
Race, Religion and the City: Twitter Word Frequency Patterns Reveal Dominant Demographic Dimensions in the United States
Recently, numerous approaches have emerged in the social sciences to exploit
the opportunities made possible by the vast amounts of data generated by online
social networks (OSNs). Having access to information about users on such a
scale opens up a range of possibilities, all without the limitations associated
with often slow and expensive paper-based polls. A question that remains to be
satisfactorily addressed, however, is how demography is represented in the OSN
content? Here, we study language use in the US using a corpus of text compiled
from over half a billion geo-tagged messages from the online microblogging
platform Twitter. Our intention is to reveal the most important spatial
patterns in language use in an unsupervised manner and relate them to
demographics. Our approach is based on Latent Semantic Analysis (LSA) augmented
with the Robust Principal Component Analysis (RPCA) methodology. We find
spatially correlated patterns that can be interpreted based on the words
associated with them. The main language features can be related to slang use,
urbanization, travel, religion and ethnicity, the patterns of which are shown
to correlate plausibly with traditional census data. Our findings thus validate
the concept of demography being represented in OSN language use and show that
the traits observed are inherently present in the word frequencies without any
previous assumptions about the dataset. Thus, they could form the basis of
further research focusing on the evaluation of demographic data estimation from
other big data sources, or on the dynamical processes that result in the
patterns found here
Using Robust PCA to estimate regional characteristics of language use from geo-tagged Twitter messages
Principal component analysis (PCA) and related techniques have been
successfully employed in natural language processing. Text mining applications
in the age of the online social media (OSM) face new challenges due to
properties specific to these use cases (e.g. spelling issues specific to texts
posted by users, the presence of spammers and bots, service announcements,
etc.). In this paper, we employ a Robust PCA technique to separate typical
outliers and highly localized topics from the low-dimensional structure present
in language use in online social networks. Our focus is on identifying
geospatial features among the messages posted by the users of the Twitter
microblogging service. Using a dataset which consists of over 200 million
geolocated tweets collected over the course of a year, we investigate whether
the information present in word usage frequencies can be used to identify
regional features of language use and topics of interest. Using the PCA pursuit
method, we are able to identify important low-dimensional features, which
constitute smoothly varying functions of the geographic location
Szintaktikus fémhabok deformációja során fellépő szerkezeti változások: The structural changes in syntactic foams during deformation
The different manufacturing methods introduce different failures into the materials affecting the mechanical properties of the material during deformation. We investigated the effect of the unwanted pores (of the matrix) of an expanded clay aluminum syntactic foam, produced by the infiltration method on the deformation mechanism. For the investigation, X-ray microtomography was applied. To be able to study the effect of the unwanted porosity on the formation of the deformation band, we developed a new method to separate the pores of the matrix material and the clay particles.
Kivonat
Az anyagok előállítása során keletkező hibák felderítése alapvető fontosságú, hiszen ezek sokszor meghatározó szerepet játszanak az anyag deformációja során. Jelen cikkben infiltrációval előállított, alumínium mátrixú, duzzasztott agyagkavicsokat tartalmazó szintaktikus habok mátrixában jelentkező nem kívánt porozitás hatását vizsgáltuk röntgentomográfiával a deformáció előrehaladtával. A vizsgálat során olyan módszert fejlesztettünk ki, mellyel a mátrixban és az agyagkavicsokban jelenlévő porozitás szétválasztható, és ezáltal ezek hatása a deformációs sáv kialakulására vizsgálható
Szintaktikus fémhabok deformációja során fellépő szerkezeti változások
Az anyagok előállítása során keletkező hibák felderítése alapvető fontosságú, hiszen ezek sokszor meghatározó szerepet játszanak az anyag deformációja során. Jelen cikkben infiltrációval előállított, alumínium mátrixú, duzzasztott agyagkavicsokat tartalmazó szintaktikus habok mátrixában jelentkező nem kívánt porozitás hatását vizsgáltuk röntgentomográfiával a deformáció előrehaladtával. A vizsgálat során olyan módszert fejlesztettünk ki, mellyel a mátrixban és az agyagkavicsokban jelenlévő porozitás szétválasztható, és ezáltal ezek hatása a deformációs sáv kialakulására vizsgálható
- …