Pattern extraction and modelling of the behavior of Web users

Abstract

İnternetin yaygınlaşması ve her alanda bilgi sağlaması günlük yaşantımıza hızla girmesine neden olmuştur. Haber, ekonomi, kültür, eğitim, sağlık hizmetler ve reklam gibi bir çok alanda bilgi kaynağı olan İnternet ortamında, kullanıcı kendisi için gerekli bilgileri bulmakta çoğu zaman zorlanmaktadır. Bunun nedeni sorgulama araçlarının kısıtlı olması ve bilgilerin fazlalığı olarak görülmektedir. Bu çalışmada kullanıcının bir sonraki istek yapacağı sayfayı öngörerek hızlı ve yüksek oranda doğru öneri yapabilen bir yöntem önerilmiştir. Model tabanlı demetleme yönteminden yaralanarak, kullanıcı oturumları aynı demette bulunan oturumlardaki ortak sayfalarda benzer süreler geçirilmesine göre demetlenmiştir. Ortaya çıkan demetler yeni kullanıcılar için öneri kümesi oluşturmak için kullanılmıştır.Anahtar Kelimeler: Web kullanım madenciliği, kullanıcı örüntüleri, model tabanlı demetleme, Poisson dağılımı. Making recommendation requires predicting what is of interest to a user at a specific time. Even the same user may have different desires at different times. It is important to extract the aggregate interest of a user from his or her navigational path through the site in a session. In this paper, we present a new model that uses only the visiting time and visiting frequencies of pages without considering the access order of page requests in user sessions. The resulting model has lower run-time computation and memory requirements, while providing predictions that are at least as precise as previous proposals. Our objective in this paper is to assess the effectiveness of non-sequentially ordered pages in predicting navigation patterns. The key idea behind this work is that user sessions can be clustered according to the similar amount of time that is spent on similar pages within a session. We first partition user sessions into clusters such that only sessions which represent similar aggregate interest of users are placed in the same cluster. We employ a model-based clustering approach and partition user sessions according to similar amount of time in similar pages. In particular, we cluster sessions by learning a mixture of Poisson odels using Expectation Maximization algorithm. The resulting clusters are then used to recommend pages to a user that are most likely contain the information which is of interest to that user at that time.Keywords: Web usage mining, usage patterns, model based clustering, Poisson distribution

    Similar works