    A kvantitatív szövegelemzés lehetőségei a menedzsmenttudományban = Possibilities of quantitative text analysis in management science

    A kvantitatív szövegelemzés egyfajta dokumentum, valamint a dokumentumok tartalmát alkotó szavak, kifejezések csoportosítására szolgáló, statisztikai módszerekkel és eszközökkel megtámogatott eljárások halmaza. Legfőbb előnye, hogy a numerikus adatok által kinyerhetőkön túl lehetővé teszi a további, eddig elérhetetlennek tűnő információkhoz való hozzáférést. A kreatív szövegelemzést tehát leginkább akkor használják, amikor a szöveg több információt tartalmaz, mint amennyi a számszerűsített adatok alapján kinyerhető lenne. A szöveg- és tartalomelemzés mára az egyik legizgalmasabb és leginkább fókuszált területe az adatbányászatnak és az adatelemzésnek, mind matematikai, statisztikai, módszertani, mind szoftveres illeszkedés szempontjából. Ez a tanulmány egy konkrét példán keresztül a szövegelemző eljárások közül a látens Dirichlet-allokációt (latent Dirichlet allocation, LDA) mint egy lehetséges módszertani megközelítést mutatja be. Elsődleges cél azt bebizonyítani, hogy a szövegelemzés hosszú távú és újszerű perspektívákat jelenthet a menedzsmenttudomány területén. = Quantitative text analysis is a set of procedures for grouping documents and the words and expressions that make up the content of documents, supported by statistical methods and tools. Its main advantage is that in addition to the information that can be extracted from numerical data, it provides a solution for accessing additional information that previously seems unavailable. Thus, text analysis is most commonly used where the text contains more information than could be obtained from quantified data. Text and content analysis is today one of the most exciting and focused areas of data mining and data analysis, both in terms of mathematical, statistical, methodological, and software fit. In this study, latent Dirichlet allocation (LDA) is presented as a possible methodological approach through a concrete example. The primary aim of the article is to show that text analysis can provide long-term and novel perspectives in the fields of management science

    Modelling Digital Media Objects

    Exploiting side information in Bayesian nonparametric models and their applications

     My research is to exploit side information into advanced Bayesian nonparametric models. We have developed some novel models for data clustering and medical data analysis and also have made our methods scalable for large-scale data. I have published my research in several journal and conference papers