2 research outputs found

    Razvoj scienotometrije praćen kroz časopis Scientometrics od početka izlaženja 1978. do 2010. godine

    Get PDF
    Ciljevi ovog istraživanja su: 1. kvantitativno opisati glavno tijelo scientometrijske literature s posebnim fokusom na razvoj kroz vrijeme i 2. versatilno implementirati glavne scientometrijske postupke te opisati metodološku problematiku scientometrije. Prvi doprinos ovog rada je dakle u razumijevanju i uopće validaciji scientometrije kao zasebne pod- discipline informacijskih znanosti kroz primarno kvantitativnu obradu svih radova objavljenih u časopisu Scientometrics od početka objavljivanja 1978. do 2010. godine s posebnim naglaskom na članke. Među provedenim analizama posebno se mogu istaknuti analize autorstva i suradnje, citatne i ko-citatne analize te pregled u odnosu na glavnu tematiku radova. Drugi doprinos je u prikazu, implementaciji i povezivanju tradicionalnih metodoloških scientometrijskih postupaka s analizom mreža i tekstova radova. S obzirom na kompleksnost ulaznih podataka koji u većini slučajeva nisu stvoreni pod kontrolom istraživača, u sklopu prikaza metodologije posebno je detaljno prikazana i priprema podataka. Rad pruža kratak uvod o znanosti i istraživanjima znanosti s fokusom na proučavanje znanosti kroz znanstvenu literaturu. Nakon toga slijedi poglavlje o metodologiji podijeljeno u dva dijela: priprema i analiza. Radi promatranja ovog tijela literature s više aspekata, rezultati i rasprava su prikazani zajedno i slijede nakon metodologije. Rad završava kratkim zaključkom o razvoju i relevantnosti scientometrije kao i o sve većoj zainteresiranosti za istu. U prilogu 1. prenesen je Python kôd kojim su implementirani postupci opisani u metodologiji, kao i proizvedene tablice i većina slika koji se koriste u tekstu

    Clustering of scientific fields by integrating text mining and bibliometrics.

    Get PDF
    De toenemende verspreiding van wetenschappelijke en technologische publicaties via het internet, en de beschikbaarheid ervan in grootschalige bibliografische databanken, leiden tot enorme mogelijkheden om de wetenschap en technologie in kaart te brengen. Ook de voortdurende toename van beschikbare rekenkracht en de ontwikkeling van nieuwe algoritmen dragen hiertoe bij. Belangrijke uitdagingen blijven echter bestaan. Dit proefschrift bevestigt de hypothese dat de nauwkeurigheid van zowel het clusteren van wetenschappelijke kennisgebieden als het classificeren van publicaties nog verbeterd kunnen worden door het integreren van tekstontginning en bibliometrie. Zowel de tekstuele als de bibliometrische benadering hebben voor- en nadelen, en allebei bieden ze een andere kijk op een corpus van wetenschappelijke publicaties of patenten. Enerzijds is er een schat aan tekstinformatie aanwezig in dergelijke documenten, anderzijds vormen de onderlinge citaties grote netwerken die extra informatie leveren. We integreren beide gezichtspunten en tonen hoe bestaande tekstuele en bibliometrische methoden kunnen verbeterd worden. De dissertatie is opgebouwd uit drie delen: Ten eerste bespreken we het gebruik van tekstontginningstechnieken voor informatievergaring en voor het in kaart brengen van kennis vervat in teksten. We introduceren en demonstreren het raamwerk voor tekstontginning, evenals het gebruik van agglomeratieve hiërarchische clustering. Voorts onderzoeken we de relatie tussen enerzijds de performantie van het clusteren en anderzijds het gewenste aantal clusters en het aantal factoren bij latent semantische indexering. Daarnaast beschrijven we een samengestelde, semi-automatische strategie om het aantal clusters in een verzameling documenten te bepalen. Ten tweede behandelen we netwerken die bestaan uit citaties tussen wetenschappelijke documenten en netwerken die ontstaan uit onderlinge samenwerkingsverbanden tussen auteurs. Dergelijke netwerken kunnen geanalyseerd worden met technieken van de bibliometrie en de grafentheorie, met als doel het rangschikken van relevante entiteiten, het clusteren en het ontdekken van gemeenschappen. Ten derde tonen we de complementariteit aan van tekstontginning en bibliometrie en stellen we mogelijkheden voor om beide werelden op correcte wijze te integreren. De performantie van ongesuperviseerd clusteren en van classificeren verbetert significant door het samenvoegen van de tekstuele inhoud van wetenschappelijke publicaties en de structuur van citatienetwerken. Een methode gebaseerd op statistische meta-analyse behaalt de beste resultaten en overtreft methoden die enkel gebaseerd zijn op tekst of citaties. Onze geïntegreerde of hybride strategieën voor informatievergaring en clustering worden gedemonstreerd in twee domeinstudies. Het doel van de eerste studie is het ontrafelen en visualiseren van de conceptstructuur van de informatiewetenschappen en het toetsen van de toegevoegde waarde van de hybride methode. De tweede studie omvat de cognitieve structuur, bibliometrische eigenschappen en de dynamica van bio-informatica. We ontwikkelen een methode voor dynamisch en geïntegreerd clusteren van evoluerende bibliografische corpora. Deze methode vergelijkt en volgt clusters doorheen de tijd. Samengevat kunnen we stellen dat we voor de complementaire tekst- en netwerkwerelden een hybride clustermethode ontwerpen die tegelijkertijd rekening houdt met beide paradigma's. We tonen eveneens aan dat de geïntegreerde zienswijze een beter begrip oplevert van de structuur en de evolutie van wetenschappelijke kennisgebieden.SISTA;
    corecore