10 research outputs found

    Myriad : a distributed machine vision application framework

    Get PDF
    This thesis examines the potential for the application of distributed computing frameworks to industrial and also lightweight consumer-level Machine Vision (MV) applications. Traditional, stand-alone MV systems have many benefits in well-defined, tightly- controlled industrial settings, but expose limitations in interactive, de-localised and small-task applications that seek to utilise vision techniques. In these situations, single-computer solutions fail to suffice and greater flexibility in terms of system construction, interactivity and localisation are required. Network-connected and distributed vision systems are proposed as a remedy to these problems, providing dynamic, componentised systems that may optionally be independent of location, or take advantage of networked computing tools and techniques, such as web servers, databases, proxies, wireless networking, secure connectivity, distributed computing clusters, web services and load balancing. The thesis discusses a system named Myriad, a distributed computing framework for Machine Vision applications. Myriad is composed components, such as image processing engines and equipment controllers, which behave as enhanced web servers and communicate using simple HTTP requests. The roles of HTTP-based distributed computing servers in simplifying rapid development of networked applications and integrating those applications with existing networked tools and business processes are explored. Prototypes of Myriad components, written in Java, along with supporting PHP, Perl and Prolog scripts and user interfaces in C , Java, VB and C++/Qt are examined. Each component includes a scripting language named MCS, enabling remote clients (or other Myriad components) to issue single commands or execute sequences of commands locally to the component in a sustained session. The advantages of server- side scripting in this manner for distributed computing tasks are outlined with emphasis on Machine Vision applications, as a means to overcome network connection issues and address problems where consistent processing is required. Furthermore, the opportunities to utilise scripting to form complex distributed computing network topologies and fully-autonomous federated networked applications are described, and examples given on how to achieve functionality such as clusters of image processing nodes. Through the medium of experimentation involving the remote control of a model train set, cameras and lights, the ability of Myriad to perform traditional roles of fixed, stand-alone Machine Vision systems is supported, along with discussion of opportunities to incorporate these elements into network-based dynamic collaborative inspection applications. In an example of 2D packing of remotely-acquired shapes, distributed computing extensions to Machine Vision tasks are explored, along with integration into larger business processes. Finally, the thesis examines the use of Machine Vision techniques and Myriad components to construct distributed computing applications with the addition of vision capabilities, leading to a new class of image-data-driven applications that exploit mobile computing and Pervasive Computing trends

    English semantic loans, loan translations, and loan renditions in informal Polish of computer users

    Get PDF
    Głównym celem niniejszej monografii jest całościowe opisanie zapożyczeń semantycznych oraz kalk leksykalnych i frazeologicznych (dokładnych i niedokładnych) w polskim języku informatyki (w jego odmianie potocznej). Celem dodatkowym jest obszerne omówienie teoretyczne problematyki zapożyczeń semantycznych i kalk, a w szczególności wskazanie rozbieżności oraz różnego rodzaju luk w stanowiskach badaczy zajmujących się ww. typami zapożyczeń, a także podkreślenie trudności metodologicznych, przed jakimi staje językoznawca je badający. Wspomniane trudności dotyczą przede wszystkim niejasnych kryteriów wyodrębniania zapożyczeń semantycznych i kalk od jednostek nimi niebędących: opisano zatem szczegółowo proces różnicowania pomiędzy zapożyczeniami semantycznymi a rodzimymi neosemantyzmami, zapożyczeniami semantycznymi a (ponownymi) zapożyczeniami leksykalnymi, kalkami frazeologicznymi a rodzimymi neofrazeologizmami, kalkami a zapożyczeniami leksykalnymi, zapożyczeniami semantycznymi a kalkami frazeologicznymi, kalkami frazeologicznymi dokładnymi a niedokładnymi oraz półkalkami a hybrydami. Autor zaproponował tutaj własne kryteria pomocne w odróżnianiu ww. zjawisk językowych. Podstawą badań jest samodzielnie zebrany przez autora monografii korpus polszczyzny specjalistycznej. W jego skład wchodzą krótkie notki (wpisy, posty) pochodzące z wybranych 32 forów internetowych o tematyce komputerowo-internetowej. Z każdego z 32 forów zebrano próbki wypowiedzi użytkowników (każda próbka liczy między 20.000 a 60.000 słów; w większości przypadków ich wielkość waha się pomiędzy 45.000 a 55.000 słów). Łączna wielkość korpusu to ponad półtora miliona słów (1.541.449) rozumianych ortograficznie, tj. jako szereg liter oddzielonych spacją. Korpus jest zatem stosunkowo duży i może być uznany za w pełni reprezentatywny dla nieformalnej polszczyzny informatycznej. Jest on bardzo zróżnicowany tematycznie, zawiera bowiem wpisy dotyczące zarówno sprzętu komputerowego (jednostki centralne, procesory, twarde dyski, wentylatory chłodzące, obudowy, drukarki, pamięci, myszy, klawiatury, słuchawki, skanery itd.), jak i oprogramowania (systemy operacyjne, edytory tekstu, arkusze kalkulacyjne, gry komputerowe, programowanie itd.) oraz Internetu (przeglądarki internetowe, komuni katory, programy antywirusowe, wirusy itd.). Autor stoi na stanowisku, że własnoręcznie zebrany korpus jest znacznie cenniejszym narzędziem badawczym niż gotowe korpusy dostępne w Internecie (takie jak Narodowy Korpus Języka Polskiego), które nie są najwłaściwszym wyborem dla celów badań nad językiem specjalistycznym. Korpus taki jest również lepszą podstawą badań niż artykuły prasowe zamieszczane w prasie komputerowej, które często są adaptacjami tekstów, które powstały wcześniej w języku angielskim. Praca zawiera także omówienie języka Internetu, ze szczególnym uwzględnieniem forów internetowych. Bardzo dokładnie opisano również proces tworzenia własnego korpusu językowego, zarówno od strony technicznej, jak i metodologiczno-materiałowej. W pracy zebrano i dokładnie opisano 204 typy angielskich zapożyczeń semantycznych (derywaty nie są traktowane jako odrębne typy, zatem np. formy akcelerator i akceleracja są traktowane jako ten sam typ), które wystąpiły łącznie 42.638 razy w korpusie oraz 529 typów angielskich kalk (16 leksykalnych i 513 frazeologicznych; 440 kalk dokładnych oraz 89 niedokładnych), które wystąpiły łącznie 8.228 razy. Tym samym niniejsza monografia jest - wedle najlepszej wiedzy autora - najobszerniejszym omówieniem ww. typów zapożyczeń w potocznym języku informatyki. Co istotne, większość omówionych kalk i zapożyczeń semantycznych nie została do tej pory odnotowana w literaturze przedmiotu ani w słownikach języka polskiego (Uniwersalnym słowniku języka polskiego pod red. S. Dubisza oraz Słowniku języka polskiego PWN pod red. L. Drabik i E. Sobol). Niniejsza monografia jest ilustracją tezy, że we współczesnej polszczyźnie stale wzrasta liczba angielskich zapożyczeń semantycznych oraz kalk frazeologicznych (kalki leksykalne są stosunkowo nieliczne). Są one wzajemnie od siebie zależne, tzn. - jak pokazała niniejsza analiza - powstawanie zapożyczeń semantycznych sprzyja powstawaniu kalk, a powstawanie kalk sprzyja powstawaniu zapożyczeń semantycznych. Kalki, które nie zawierają wyrazu użytego w nowym znaczeniu pod wpływem obcym (a zatem zapożyczenia semantycznego) są bowiem stosunkowo nieliczne. I odwrotnie - większość zapożyczeń semantycznych pojawia się razem z kalkami je zawierającymi. Jak wskazuje niniejsza praca, angielskie zapożyczenia semantyczne i kalki frazeologiczne nie są nieznaczną i niewielką grupą w porównaniu do anglicyzmów leksykalnych; nie tylko ich liczba, ale także rola w języku polskim stale się powiększa. Są one szczególnie widoczne w języku specjalistycznym, takim jak język informatyki; język taki, co istotne, podlega nieustannym zmianom, co jest odbiciem stałego rozwoju technologicznego. Badania nad zapożyczeniami semantycznymi i kalkami, zwłaszcza -choć nie wyłącznie - w szybko zmieniającym się języku specjalistycznym, są zatem koniecznością. Autor ma nadzieję, że niniejsza praca będzie postrzegana jako odpowiedź na taką konieczność

    From tools and databases to clinically relevant applications in miRNA research

    Get PDF
    While especially early research focused on the small portion of the human genome that encodes proteins, it became apparent that molecules responsible for many key functions were also encoded in the remaining regions. Originally, non-coding RNAs, i.e., molecules that are not translated into proteins, were thought to be composed of only two classes (ribosomal RNAs and transfer RNAs). However, starting from the early 1980s many other non-coding RNA classes were discovered. In the past two decades, small non-coding RNAs (sncRNAs) and in particular microRNAs (miRNAs), have become essential molecules in biological and biomedical research. In this thesis, five aspects of miRNA research have been addressed. Starting from the development of advanced computational software to analyze miRNA data (1), an in-depth understanding of human and non-human miRNAs was generated and databases hosting this knowledge were created (2). In addition, the effects of technological advances were evaluated (3). We also contributed to the understanding on how miRNAs act in an orchestrated manner to target human genes (4). Finally, based on the insights gained from the tools and resources of the mentioned aspects we evaluated the suitability of miRNAs as biomarkers (5). With the establishment of next-generation sequencing, the primary goal of this thesis was the creation of an advanced bioinformatics analysis pipeline for high-throughput miRNA sequencing data, primarily focused on human. Consequently, miRMaster, a web-based software solution to analyze hundreds sequencing samples within few hours was implemented. The tool was implemented in a way that it could support different sequencing technologies and library preparation techniques. This flexibility allowed miRMaster to build a consequent user-base, resulting in over 120,000 processed samples and 1,5 billion processed reads, as of July 2021, and therefore laid out the basis for the second goal of this thesis. Indeed, the implementation of a feature allowing users to share their uploaded data contributed strongly to the generation of a detailed annotation of the human small non-coding transcriptome. This annotation was integrated into a new miRNA database, miRCarta, modelling thousands of miRNA candidates and corresponding read expression profiles. A subset of these candidates was then evaluated in the context of different diseases and validated. The thereby gained knowledge was subsequently used to validate additional miRNA candidates and to generate an estimate of the number of miRNAs in human. The large collection of samples, gathered over many years with miRMaster was also integrated into a web server evaluating miRNA arm shifts and switches, miRSwitch. Finally, we published an updated version of miRMaster, expanding its scope to other species and adding additional downstream analysis capabilities. The second goal of this thesis was further pursued by investigating the distribution of miRNAs across different human tissues and body fluids, as well as the variability of miRNA profiles over the four seasons of the year. Furthermore, small non-coding RNAs in zoo animals were examined and a tissue atlas of small non-coding RNAs for mice was generated. The third goal, the assessment of technological advances, was addressed by evaluating the new combinatorial probe-anchor synthesis-based sequencing technology published by BGI, analyzing the effect of RNA integrity on sequencing data, analyzing low-input library preparation protocols, and comparing template-switch based library preparation protocols to ligation-based ones. In addition, an antibody-based labeling sequencing chemistry, CoolMPS, was investigated. Deriving an understanding of the orchestrated regulation by miRNAs, the fourth goal of this thesis, was pursued in a first step by the implementation of a web server visualizing miRNA-gene interaction networks, miRTargetLink. Subsequently, miRPathDB, a database incorporating pathways affected by miRNAs and their targets was implemented, as well as miEAA 2.0, a web server offering quick miRNA set enrichment analyses in over 130,000 categories spanning 10 different species. In addition, miRSNPdb, a database evaluating the effects of single nucleotide polymorphisms and variants in miRNAs or in their target genes was created. Finally, the fifth goal of the thesis, the evaluation of the suitability of miRNAs as biomarkers for human diseases was tackled by investigating the expression profiles of miRNAs with machine learning. An Alzheimer's disease cohort with over 400 individuals was analyzed, as well as another neurodegenerative disease cohort with multiple time points of Parkinson's disease patients and healthy controls. Furthermore, a lung cancer cohort covering 3,000 individuals was examined to evaluate the suitability of an early detection test. In addition, we evaluated the expression profile changes induced by aging on a cohort of 1,334 healthy individuals and over 3,000 diseased patients. Altogether, the herein described tools, databases and research papers present valuable advances and insights into the miRNA research field and have been used and cited by the research community over 2,000 times as of July 2021.Während insbesondere die frühe Genetik-Forschung sich auf den kleinen Teil des menschlichen Genoms konzentrierte, der für Proteine kodiert, wurde deutlich, dass auch in den übrigen Regionen Moleküle kodiert werden, die für viele wichtige Funktionen verantwortlich sind. Ursprünglich ging man davon aus, dass nicht codierende RNAs, d. h. Moleküle, die nicht in Proteine übersetzt werden, nur aus zwei Klassen bestehen (ribosomale RNAs und Transfer-RNAs). Seit den frühen 1980er Jahren wurden jedoch viele andere nicht-kodierende RNA-Klassen entdeckt. In den letzten zwei Jahrzehnten sind kleine nichtcodierende RNAs (sncRNAs) und insbesondere microRNAs (miRNAs) zu wichtigen Molekülen in der biologischen und biomedizinischen Forschung geworden. In dieser Arbeit werden fünf Aspekte der miRNA-Forschung behandelt. Ausgehend von der Entwicklung fortschrittlicher Computersoftware zur Analyse von miRNA-Daten (1) wurde ein tiefgreifendes Verständnis menschlicher und nicht-menschlicher miRNAs entwickelt und Datenbanken mit diesem Wissen erstellt (2). Darüber hinaus wurden die Auswirkungen des technologischen Fortschritts bewertet (3). Wir haben auch dazu beigetragen, zu verstehen, wie miRNAs koordiniert agieren, um menschliche Gene zu regulieren (4). Schließlich bewerteten wir anhand der Erkenntnisse, die wir mit den Tools und Ressourcen der genannten Aspekte gewonnen hatten, die Eignung von miRNAs als Biomarker (5). Mit der Etablierung der Sequenzierung der nächsten Generation war das primäre Ziel dieser Arbeit die Schaffung einer fortschrittlichen bioinformatischen Analysepipeline für Hochdurchsatz-MiRNA-Sequenzierungsdaten, die sich in erster Linie auf den Menschen konzentriert. Daher wurde miRMaster, eine webbasierte Softwarelösung zur Analyse von Hunderten von Sequenzierproben innerhalb weniger Stunden, implementiert. Das Tool wurde so implementiert, dass es verschiedene Sequenzierungstechnologien und Bibliotheksvorbereitungstechniken unterstützen kann. Diese Flexibilität ermöglichte es miRMaster, eine konsequente Nutzerbasis aufzubauen, die im Juli 2021 über 120.000 verarbeitete Proben und 1,5 Milliarden verarbeitete Reads umfasste, womit die Grundlage für das zweite Ziel dieser Arbeit geschaffen wurde. Die Implementierung einer Funktion, die es den Nutzern ermöglicht, ihre hochgeladenen Daten mit anderen zu teilen, trug wesentlich zur Erstellung einer detaillierten Annotation des menschlichen kleinen nicht-kodierenden Transkriptoms bei. Diese Annotation wurde in eine neue miRNA-Datenbank, miRCarta, integriert, die Tausende von miRNA-Kandidaten und entsprechende Expressionsprofile abbildet. Eine Teilmenge dieser Kandidaten wurde dann im Zusammenhang mit verschiedenen Krankheiten bewertet und validiert. Die so gewonnenen Erkenntnisse wurden anschließend genutzt, um weitere miRNA-Kandidaten zu validieren und eine Schätzung der Anzahl der miRNAs im Menschen vorzunehmen. Die große Sammlung von Proben, die über viele Jahre mit miRMaster gesammelt wurde, wurde auch in einen Webserver integriert, der miRNA-Armverschiebungen und -Wechsel auswertet, miRSwitch. Schließlich haben wir eine aktualisierte Version von miRMaster veröffentlicht, die den Anwendungsbereich auf andere Spezies ausweitet und zusätzliche Downstream-Analysefunktionen hinzufügt. Das zweite Ziel dieser Arbeit wurde weiterverfolgt, indem die Verteilung von miRNAs in verschiedenen menschlichen Geweben und Körperflüssigkeiten sowie die Variabilität der miRNA-Profile über die vier Jahreszeiten hinweg untersucht wurde. Darüber hinaus wurden kleine nichtkodierende RNAs in Zootieren untersucht und ein Gewebeatlas der kleinen nichtkodierenden RNAs für Mäuse erstellt. Das dritte Ziel, die Einschätzung des technologischen Fortschritts, wurde angegangen, indem die neue kombinatorische Sonden-Anker-Synthese-basierte Sequenzierungstechnologie, die vom BGI veröffentlicht wurde, bewertet wurde, die Auswirkungen der RNA-Integrität auf die Sequenzierungsdaten analysiert wurden, Protokolle für die Bibliotheksvorbereitung mit geringem Input analysiert wurden und Protokolle für die Bibliotheksvorbereitung auf der Basis von Template-Switch mit solchen auf Ligationsbasis verglichen wurden. Darüber hinaus wurde eine auf Antikörpern basierende Labeling-Sequenzierungschemie, CoolMPS, untersucht. Das vierte Ziel dieser Arbeit, das Verständnis der orchestrierten Regulation durch miRNAs, wurde in einem ersten Schritt durch die Implementierung eines Webservers zur Visualisierung von miRNA-Gen-Interaktionsnetzwerken, miRTargetLink, verfolgt. Anschließend wurde miRPathDB implementiert, eine Datenbank, die von miRNAs und ihren Zielgenen beeinflusste Pfade enthält, sowie miEAA 2.0, ein Webserver, der schnelle miRNA-Anreicherungsanalysen in über 130.000 Kategorien aus 10 verschiedenen Spezies bietet. Darüber hinaus wurde miRSNPdb, eine Datenbank zur Bewertung der Auswirkungen von Einzelnukleotid-Polymorphismen und Varianten in miRNAs oder ihren Zielgenen, erstellt. Schließlich wurde das fünfte Ziel der Arbeit, die Bewertung der Eignung von miRNAs als Biomarker für menschliche Krankheiten, durch die Untersuchung der Expressionsprofile von miRNAs anhand von maschinellem Lernen angegangen. Eine Alzheimer-Kohorte mit über 400 Personen wurde analysiert, ebenso wie eine weitere neurodegenerative Krankheitskohorte mit Parkinson-Patienten an mehreren Zeitpunkten der Krankheit und gesunden Kontrollen. Außerdem wurde eine Lungenkrebskohorte mit 3.000 Personen untersucht, um die Eignung eines Früherkennungstests zu bewerten. Darüber hinaus haben wir die altersbedingten Veränderungen des Expressionsprofils bei einer Kohorte von 1.334 gesunden Personen und über 3.000 kranken Patienten untersucht. Insgesamt stellen die hier beschriebenen Tools, Datenbanken und Forschungsarbeiten wertvolle Fortschritte und Erkenntnisse auf dem Gebiet der miRNA-Forschung dar und wurden bis Juli 2021 von der Forschungsgemeinschaft über 2.000 Mal verwendet und zitiert

    Communications

    Get PDF
    A letter to the editor is presented in response to the article The Georgia Confederate Flag Dispute, by J. Michael Martinez in the summer 2008 issue along with the response of the author

    Proceedings of the 2018 Canadian Society for Mechanical Engineering (CSME) International Congress

    Get PDF
    Published proceedings of the 2018 Canadian Society for Mechanical Engineering (CSME) International Congress, hosted by York University, 27-30 May 2018
    corecore