Search CORE

11 research outputs found

The development of CMMS incorporating condition monitoring tools in the advances of Industry 4

Author: Baglee David
Morris Adrian
shaalan Abdu
Publication venue
Publication date: 09/06/2022
Field of study

Computerized maintenance management software (CMMS) considered effective supporting tools to enhance the organisation and scheduling practices of maintenance tasks on manufacturing assets. Condition monitoring applications in the advances of Industry 4.0 applications enhances machines condition insight by utilising different sensing nodes to improve the optimisation of the scheduled maintenance tasks and support predictive maintenance applications. To overcome the disconnection between condition monitoring technology and CMMS software, the research presents a new generation of CMMS by integrating condition monitoring technologies with maintenance management functionalities under a single cloud-based platform. As an example, energy data from five-axis machine tools are included to show it is predictable and stable to be reliable for failures prediction applications

Sunderland University Institutional Repository

Big Data enabled Intelligent Immune System for energy efficient manufacturing management

Author: Cai Xiantao
Li Weidong
Liang Yuchen
Wang Sheng
Publication venue: 'Elsevier BV'
Publication date: 01/09/2018
Field of study

Crossref

Coventry University Pure Portal

LAD-CBM: new data processing tool for diagnosis and prognosis in condition-based maintenance

Author: Abdernazak B.
Yacout Soumaya
Publication venue
Publication date: 01/01/2009
Field of study

PolyPublie

LAD-CBM: new data processing tool for diagnosis and prognosis in condition-based maintenance

Author: Bennane Abderrazak
Yacout Soumaya
Publication venue: Springer
Publication date: 01/01/2012
Field of study

PolyPublie

Development of maintenance framework for modern manufacturing systems

Author: Baglee David
Dixon Derek
Shaalan Abdu
Publication venue
Publication date: 09/06/2022
Field of study

Modern manufacturing organizations are designing, building and operating large, complex and often ‘one of a kind’ assets, which incorporate the integration of various systems under modern control systems. Due to such complexity, machines failures became more difficult to interpret and rectify and the existing maintenance strategies became obsolete without development and enhancement. As a result, the need for more advanced strategies to ensure effective maintenance applications that ensures high operation efficiency arise. The current research aims to investigate the existing maintenance strategies, the levels of machines complexity and automation within manufacturing companies from different sectors and sizes including, oil and gas, food and beverages, automotive, aerospace, and Original Equipment Manufacturer. Results analysis supports in the development of a modern maintenance framework that overcome the highlighted results and suits modern manufacturing assets using systematic approaches and utilisation of pillars from Total productive maintenance (TPM, Reliability Centred Maintenance (RCM) and Industry 4.0

Sunderland University Institutional Repository

Fault Prognostics Using Logical Analysis of Data and Non-Parametric Reliability Estimation Methods

Author: Ragab Ahmed Ragab Anwar
Publication venue
Publication date: 01/12/2014
Field of study

RÉSUMÉ : Estimer la durée de vie utile restante (RUL) d’un système qui fonctionne suivant différentes conditions de fonctionnement représente un grand défi pour les chercheurs en maintenance conditionnelle (CBM). En effet, il est difficile de comprendre la relation entre les variables qui représentent ces conditions de fonctionnement et la RUL dans beaucoup de cas en pratique à cause du degré élevé de corrélation entre ces variables et leur dépendance dans le temps. Il est également difficile, voire impossible, pour des experts d’acquérir et accumuler un savoir à propos de systèmes complexes, où l'échec de l'ensemble du système est vu comme le résultat de l'interaction et de la concurrence entre plusieurs modes de défaillance. Cette thèse présente des méthodologies pour le pronostic en CBM basé sur l'apprentissage automatique, et une approche de découverte de connaissances appelée Logical Analysis of Data (LAD). Les méthodologies proposées se composent de plusieurs implémentations de la LAD combinées avec des méthodes non paramétriques d'estimation de fiabilité. L'objectif de ces méthodologies est de prédire la RUL du système surveillé tout en tenant compte de l'analyse des modes de défaillance uniques ou multiples. Deux d’entre elles considèrent un mode de défaillance unique et une autre considère de multiples modes de défaillance. Les deux méthodologies pour le pronostic avec mode unique diffèrent dans la manière de manipuler les données. Les méthodologies de pronostique dans cette recherche doctorale ont été testées et validées sur la base d'un ensemble de tests bien connus. Dans ces tests, les méthodologies ont été comparées à des techniques de pronostic connues; le modèle à risques proportionnels de Cox (PHM), les réseaux de neurones artificiels (ANNs) et les machines à vecteurs de support (SVMs). Deux ensembles de données ont été utilisés pour illustrer la performance des trois méthodologies: l'ensemble de données du turboréacteur à double flux (turbofan) qui est disponible au sein de la base de données pour le développement d'algorithmes de pronostic de la NASA, et un autre ensemble de données obtenu d’une véritable application dans l'industrie. Les résultats de ces comparaisons indiquent que chacune des méthodologies proposées permet de prédire avec précision la RUL du système considéré. Cette recherche doctorale conclut que l’approche utilisant la LAD possède d’importants mérites et avantages qui pourraient être bénéfiques au domaine du pronostic en CBM. Elle est capable de gérer les données en CBM qui sont corrélées et variantes dans le temps. Son autre avantage et qu’elle génère un savoir interprétable qui est bénéfique au personnel de maintenance.----------ABSTRACT : Estimating the remaining useful life (RUL) for a system working under different operating conditions represents a big challenge to the researchers in the condition-based maintenance (CBM) domain. The reason is that the relationship between the covariates that represent those operating conditions and the RUL is not fully understood in many practical cases, due to the high degree of correlation between such covariates, and their dependence on time. It is also difficult or even impossible for the experts to acquire and accumulate the knowledge from a complex system, where the failure of the system is regarded as the result of interaction and competition between several failure modes. This thesis presents systematic CBM prognostic methodologies based on a pattern-based machine learning and knowledge discovery approach called Logical Analysis of Data (LAD). The proposed methodologies comprise different implementations of the LAD approach combined with non-parametric reliability estimation methods. The objective of these methodologies is to predict the RUL of the monitored system while considering the analysis of single or multiple failure modes. Three different methodologies are presented; two deal with single failure mode and one deals with multiple failure modes. The two methodologies for single mode prognostics differ in the way of representing the data. The prognostic methodologies in this doctoral research have been tested and validated based on a set of widely known tests. In these tests, the methodologies were compared to well-known prognostic techniques; the proportional hazards model (PHM), artificial neural networks (ANNs) and support vector machines (SVMs). Two datasets were used to illustrate the performance of the three methodologies: the turbofan engine dataset that is available at NASA prognostic data repository, and another dataset collected from a real application in the industry. The results of these comparisons indicate that each of the proposed methodologies provides an accurate prediction for the RUL of the monitored system. This doctoral research concludes that the LAD approach has attractive merits and advantages that add benefits to the field of prognostics. It is capable of dealing with the CBM data that are correlated and time-varying. Another advantage is its generation of an interpretable knowledge that is beneficial to the maintenance personnel

PolyPublie

Developed Algorithms for Maximum Pattern Generation in Logical Analysis of Data

Author: Tagarian Sara
Publication venue
Publication date: 01/12/2016
Field of study

RÉSUMÉ : Les données sont au coeur des industries et des organisations. Beaucoup d’entreprises possèdent de grandes quantités de données mais échouent à en tirer un bénéfice conséquent, bien souvent parce que ces données ne sont pas utilisées de façon productive. Il est indispensable de prendre des décisions importantes au bon moment, en utilisant des outils adaptés permettant d’extraire de l’information pratique et fiable de grandes quantités de données. Avec l’augmentation de la quantité et de la variété des données, le recours aux outils traditionnels facultatifs a été abandonné alors que l’importance de fournir des méthodes efficaces et prometteuses pour l’analyse de données se fait grandissante. La classification de données est l’un des moyens de répondre à ce besoin d’analyse de données. L’analyse Logique de Données (LAD : Logical Analysis of Data) est une nouvelle méthodologie d’analyse de données. Cette méthodologie qui combine l’optimisation, l’analyse combinatoire et la logique booléenne, est applicable pour le problème de classification des données. Son but est de trouver des motifs logiques cachés qui séparent les observations d’une certaine classe de toutes les autres observations. Ces motifs sont les blocs de base de l’Analyse Logique de Données dont l’objectif principal est de choisir un ensemble de motifs capable de classifier correctement des observations. La précision d’un modèle mesure à quel point cet objectif est atteint par le modèle. Dans ce projet de recherche, on s’intéresse à un type particulier de motifs appelé α-motif « α-pattern ». Ce type de motif permet de construire des modèles de classification LAD de très grande précision. En dépit du grand nombre de méthodologies existantes pour générer des α-motifs maximaux, il n’existe pas encore de méta-heuristique adressant ce problème. Le but de ce projet de recherche est donc de développer une méta-heuristique pour résoudre le problème des α-motifs maximaux. Cette méta-heuristique devra être efficace en termes de temps de résolution et aussi en termes de précision des motifs générés. Afin de satisfaire les deux exigences citées plus haut, notre choix s’est porté sur le recuit simulé. Nous avons utilisé le recuit simulé pour générer des α-motifs maximaux avec une approche différente de celle pratiquée dans le modèle BLA. La performance de l’algorithme développé est évaluée dans la suite. Les résultats du test statistique de Friedman montrent que notre algorithme possède les meilleures performances en termes de temps de résolution. De plus, pour ce qui est de la précision, celle fournie par notre algorithme est comparable à celles des autres méthodes. Notre précision possède par ailleurs de forts niveaux de confiance statistiques.----------ABSTRACT : Data is the heart of any industry or organization. Most of the companies are gifted with a large amount of data but they often fail to gain valuable insight from it, which is often because they cannot use their data productively. It is crucial to make essential and on-time decisions by using adapted tools to find applicable and accurate information from large amount of data. By increasing the amount and variety of data, the use of facultative traditional methods, were abolished and the importance of providing efficient and fruitful methods to analyze the data is growing. Data classification is one of the ways to fulfill this need of data analysis. Logical Analysis of Data is a methodology to analyze the data. This methodology, the combination of optimization, combinatorics and Boolean logic, is applicable for classification problems. Its aim is to discover hidden logical patterns that differentiate observations pertaining to one class from all of the other observations. Patterns are the key building blocks in LAD. Choosing a set of patterns that is capable of classifying observations correctly is the essential goal of LAD. Accuracy represents how successfully this goal is met. In this research study, one specific kind of pattern, called maximum α-pattern, is considered. This particular pattern helps building highly accurate LAD classification models. In spite of various presented methodologies to generate maximum α-pattern there is not yet any developed meta-heuristic algorithm. This research study is presented here with the objective of developing a meta-heuristic algorithm generating maximum α-patterns that are effective both in terms of computational time and accuracy. This study proposes a computationally efficient and accurate meta-heuristic algorithm based on the Simulated Annealing approach. The aim of the developed algorithm is to generate maximum α-patterns in a way that differs from the best linear approximation model proposed in the literature. Later, the performance of the new algorithm is evaluated. The results of the statistical Friedman test shows that the algorithm developed here has the best performance in terms of computational time. Moreover, its performance in terms of accuracy is competitive to other methods with, statistically speaking, high levels of confidence

PolyPublie

Analyse logique de données pour estimer le taux de présence des passagers en transport aérien.

Author: Dupuis Christine
Publication venue
Publication date: 01/04/2010
Field of study

RÉSUMÉ Chaque année, dans l’industrie du transport aérien, des pertes de revenus additionnels estimées à des millions de dollars sont causées par des passagers absents. En effet, ces sièges qui ont été vendus mais qui seront inoccupés peuvent potentiellement être revendus à d’autres passagers si on est capable d’en estimer le nombre correctement. Cela génère des profits supplémentaires pour les compagnies aériennes, à condition de ne pas sur-utiliser cette façon de faire, car un passager à qui l’on refuse l’embarquement dû à un manque de place sur l’avion devient coûteux, puisqu’il faut le dédommager. Le projet de maîtrise consiste en l’élaboration d’un modèle permettant de mieux prévoir le nombre de sièges supplémentaires par rapport à la capacité initiale de la cabine que l’on peut se permettre de vendre, phénomène appelé la survente. L’approche retenue est le « Logical Analysis of Data », auquel nous ferons référence par la méthode LAD. Plus spécifiquement, le modèle classifie les passagers en trois groupes: présents, absents et incertains, chaque groupe possédant son propre taux de présence. La somme pondérée de ces trois groupes et de leurs taux respectifs constitue le nombre de personnes présentes prévues par la méthode LAD. Cette méthode a été retenue à cause de son originalité et de ses succès connus à ce jour. Elle se distingue des autres formes de data mining plus conventionnelles par le fait qu’elle fait preuve d’une certaine forme d’intelligence artificielle; à partir des caractéristiques des passagers, elle établit des combinaisons de conditions (appelées patrons) pour lesquels les passagers ciblés ont une plus forte tendance à être présents (ou absents). Les caractéristiques sont par exemple la classe de réservation, le jour de la semaine du départ, l’heure, l’origine de l’itinéraire…----------ABSTRACT In the airline industry, revenue losses are estimated to reach millions of dollars yearly due to passengers that don’t show up for their flights, this is referred to as «no-shows». A frequent practice in the airline industry is to overbook flights to make up for these losses. Some significant revenues can be generated by this practice if the forecasts are accurate. If the no-show forecast is too low, potential revenue loss will remain. On the other hand, if the forecast suggests too many no-shows, some passengers may be denied boarding. This has a direct negative impact on customer satisfaction, and it is difficult to determine the exact cost of customer’s frustration. The objective of this master’s project is to build a model that would improve the accuracy of predictions for show and no-show passengers, and consequently adjust the overbooking levels. The chosen method is known as the «Logical Analysis of Data», also referred to as LAD. Specifically, this method classifies all passengers into three groups: positive (showing up), negative (no-shows) and unclassified. Each of these three groups has its own show rate. The weighted sum of these groups and their show rate results in the total show rate for the evaluated group of passengers. This approach was chosen not only for its originality, but also for its success in various sectors. It differs from other conventional data mining methods by its ability to detect combinatory information about the passengers. The input consists of a number of observations (passengers), each described by a vector of attributes derived from characteristics such as booking class, day of the week, departure time, itinerary origin, … The LAD method detects sets of conditions on attributes for which the group of passengers respecting these conditions have a significantly higher or lower show rate

PolyPublie

Multi-Criteria Inventory Classification and Root Cause Analysis Based on Logical Analysis of Data

Author: Wu Yuchang
Publication venue
Publication date: 01/10/2016
Field of study

RÉSUMÉ : La gestion des stocks de pièces de rechange donne un avantage concurrentiel vital dans de nombreuses industries, en passant par les entreprises à forte intensité capitalistique aux entreprises de service. En raison de la quantité élevée d'unités de gestion des stocks (UGS) distinctes, il est presque impossible de contrôler les stocks sur une base unitaire ou de porter la même attention à toutes les pièces. La gestion des stocks de pièces de rechange implique plusieurs intervenants soit les fabricants d'équipement d'origine (FEO), les distributeurs et les clients finaux, ce qui rend la gestion encore plus complexe. Des pièces de rechange critiques mal classées et les ruptures de stocks de pièces critiques ont des conséquences graves. Par conséquent il est essentiel de classifier les stocks de pièces de rechange dans des classes appropriées et d'employer des stratégies de contrôle conformes aux classes respectives. Une classification ABC et certaines techniques de contrôle des stocks sont souvent appliquées pour faciliter la gestion UGS. La gestion des stocks de pièces de rechange a pour but de fournir des pièces de rechange au moment opportun. La classification des pièces de rechange dans des classes de priorité ou de criticité est le fondement même de la gestion à grande échelle d’un assortiment très varié de pièces. L'objectif de la classification est de classer systématiquement les pièces de rechange en différentes classes et ce en fonction de la similitude des pièces tout en considérant leurs caractéristiques exposées sous forme d'attributs. L'analyse ABC traditionnelle basée sur le principe de Pareto est l'une des techniques les plus couramment utilisées pour la classification. Elle se concentre exclusivement sur la valeur annuelle en dollar et néglige d'autres facteurs importants tels que la fiabilité, les délais et la criticité. Par conséquent l’approche multicritères de classification de l'inventaire (MCIC) est nécessaire afin de répondre à ces exigences. Nous proposons une technique d'apprentissage machine automatique et l'analyse logique des données (LAD) pour la classification des stocks de pièces de rechange. Le but de cette étude est d'étendre la méthode classique de classification ABC en utilisant une approche MCIC. Profitant de la supériorité du LAD dans les modèles de transparence et de fiabilité, nous utilisons deux exemples numériques pour évaluer l'utilisation potentielle du LAD afin de détecter des contradictions dans la classification de l'inventaire et de la capacité sur MCIC. Les deux expériences numériques ont démontré que LAD est non seulement capable de classer les stocks mais aussi de détecter et de corriger les observations contradictoires en combinant l’analyse des causes (RCA). La précision du test a été potentiellement amélioré, non seulement par l’utilisation du LAD, mais aussi par d'autres techniques de classification d'apprentissage machine automatique tels que : les réseaux de neurones (ANN), les machines à vecteurs de support (SVM), des k-plus proches voisins (KNN) et Naïve Bayes (NB). Enfin, nous procédons à une analyse statistique afin de confirmer l'amélioration significative de la précision du test pour les nouveaux jeux de données (corrections par LAD) en comparaison aux données d'origine. Ce qui s’avère vrai pour les cinq techniques de classification. Les résultats de l’analyse statistique montrent qu'il n'y a pas eu de différence significative dans la précision du test quant aux cinq techniques de classification utilisées, en comparant les données d’origine avec les nouveaux jeux de données des deux inventaires.----------ABSTRACT : Spare parts inventory management plays a vital role in maintaining competitive advantages in many industries, from capital intensive companies to service networks. Due to the massive quantity of distinct Stock Keeping Units (SKUs), it is almost impossible to control inventory by individual item or pay the same attention to all items. Spare parts inventory management involves all parties, from Original Equipment Manufacturer (OEM), to distributors and end customers, which makes this management even more challenging. Wrongly classified critical spare parts and the unavailability of those critical items could have severe consequences. Therefore, it is crucial to classify inventory items into classes and employ appropriate control policies conforming to the respective classes. An ABC classification and certain inventory control techniques are often applied to facilitate SKU management. Spare parts inventory management intends to provide the right spare parts at the right time. The classification of spare parts into priority or critical classes is the foundation for managing a large-scale and highly diverse assortment of parts. The purpose of classification is to consistently classify spare parts into different classes based on the similarity of items with respect to their characteristics, which are exhibited as attributes. The traditional ABC analysis, based on Pareto's Principle, is one of the most widely used techniques for classification, which concentrates exclusively on annual dollar usage and overlooks other important factors such as reliability, lead time, and criticality. Therefore, multi-criteria inventory classification (MCIC) methods are required to meet these demands. We propose a pattern-based machine learning technique, the Logical Analysis of Data (LAD), for spare parts inventory classification. The purpose of this study is to expand the classical ABC classification method by using a MCIC approach. Benefiting from the superiority of LAD in pattern transparency and robustness, we use two numerical examples to investigate LAD’s potential usage for detecting inconsistencies in inventory classification and the capability on MCIC. The two numerical experiments have demonstrated that LAD is not only capable of classifying inventory, but also for detecting and correcting inconsistent observations by combining it with the Root Cause Analysis (RCA) procedure. Test accuracy improves potentially not only with the LAD technique, but also with other major machine learning classification techniques, namely artificial neural network (ANN), support vector machines (SVM), k-nearest neighbours (KNN) and Naïve Bayes (NB). Finally, we conduct a statistical analysis to confirm the significant improvement in test accuracy for new datasets (corrections by LAD) compared to original datasets. This is true for all five classification techniques. The results of statistical tests demonstrate that there is no significant difference in test accuracy in five machine learning techniques, either in the original or the new datasets of both inventories

PolyPublie

Estimation quantitative du risque lié aux machines en exploitant des rapports d’enquête d’accident et l’analyse logique de données

Author: Jocelyn Sabrina
Publication venue
Publication date: 01/06/2017
Field of study

RÉSUMÉ : Les préventionnistes en sécurité des machines utilisent différents outils, dont des rapports d’enquêtes d’accidents, pour les aider dans l’identification des risques en milieu de travail. L’information est alors extraite ponctuellement, en lisant un rapport à la fois. Par la suite, les rapports consultés risquent de sombrer dans l’oubli. En matière de gestion du risque, l’identification du risque est succédée par l’estimation du risque. Les préventionnistes en sécurité des machines utilisent généralement des outils qualitatifs pour estimer le risque. Cet aspect qualitatif crée de la subjectivité dans les prises de décision quant aux moyens de réduction du risque. De plus, la nature statique de ces outils contraint son utilisateur à des paramètres du risque prédéterminés. Si d’autres paramètres sont requis pour mieux définir le risque qui a évolué, ces outils seront incapables de les intégrer. Cela peut conduire à des décisions inadaptées en matière de réduction du risque. Pour pallier ces inconvénients, cette thèse vise à proposer une démarche d’identification et d’estimation du risque qui facilite le suivi des risques liés aux machines, ainsi qu’à leur environnement physique et organisationnel en milieu de travail. La démarche utilise le retour d’expérience (REX) dynamique pour exploiter efficacement et durablement les rapports d’enquête d’accident. Le REX dynamique est à la fois un processus de remontée d’information et d’inférence de connaissances. La connaissance essentielle est extraite à partir de l’information contenue dans les rapports, après que l’information ait été formalisée dans une base de données. Cette connaissance peut être actualisée au fur et à mesure de la mise à jour de la base de données par la remontée d’information. La connaissance est inférée sous la forme de règles pertinentes générées par un algorithme de fouille de données. Une règle est une combinaison de conditions décrivant des accidents appartenant à un même ensemble, appelé « classe ». Chaque condition se compose d’un indicateur auquel une valeur ou une plage de valeurs est affectée. Un indicateur est un facteur de risque ou une cause potentielle d’accident. Ainsi, avec le REX dynamique utilisant une base de données pouvant être mise à jour régulièrement, les connaissances issues des rapports seront continuellement mises à profit et évolueront avec le contexte. Un algorithme d’apprentissage automatique nommé « Analyse logique de données (ALD) » (Logical Analysis of Data : LAD) est intégré au REX dynamique pour assurer que la démarche proposée fonctionne même pour un échantillon restreint de données. En effet, cette thèse a démontré que, pour un petit échantillon de 23 accidents liés à des convoyeurs à courroie, l’ALD est capable de générer des règles avec une précision de classification adéquate : entre 72% et 74%. Le choix des convoyeurs à courroie s’appuie sur deux constats. Premièrement, de tous les types de convoyeurs, ceux à courroie ont provoqué le plus d’accidents (16,8%) entre 1990 et 2011, d’après 137 rapports d’accidents de la Commission des normes, de l’équité, de la santé et de la sécurité du travail (CNESST) liés à des convoyeurs. Deuxièmement, ce type de convoyeurs représente la plus grande proportion (8,5%) des accidents graves et mortels, toutes machines confondues, entre 1999 et 2007, d’après une base de données de l’Institut de recherche Robert-Sauvé en santé et en sécurité du travail (IRSST). Les 23 rapports d’accidents traités dans cette thèse, proviennent du Centre de documentation de la CNESST. Une analyse de l’information de chaque rapport a permis de tirer les éléments décrivant le contexte accidentel. Ce traitement d’information a donné naissance à une base de données à partir de laquelle l’ALD a généré deux séries de règles. D’abord, l’une pour une version de la base de données divisant les 23 accidents en une classe d’accidents en maintenance et une classe d’accidents en production. Ensuite, l’autre pour une version de la base de données partageant les 23 accidents en deux classes: « Non mortel » et « Mortel ». Certaines des règles générées ont montré qu’un accident peut survenir en raison de conditions dangereuses (ex., un environnement de travail encombré), mais aussi en présence de conditions d’apparence sécuritaire (ex., l’existence d’un programme de prévention). Dans ce dernier cas, il faut investiguer pour comprendre les dessous d’une condition qui semble sécuritaire. Par exemple, pour 60% des accidents en maintenance survenus en dépit de l’existence d’un programme de prévention, l’omission de sa mise à jour pourrait expliquer l’accident. D’autres règles ont montré que les accidents analysés s’expliquent principalement par des facteurs de risque ou causes rattachées à l’équipement, l’organisation, l’individu, ou le moment. Des paramètres quantitatifs associés aux règles, tels que leurs couvertures et la fréquence de leurs indicateurs, ont permis d’entamer la hiérarchisation des règles et des facteurs de risques (la couverture est le nombre d’accidents que décrit la règle). Une méthode développée pour estimer la probabilité du dommage associé à chaque règle a permis de compléter la hiérarchisation des règles de couvertures identiques. Cette hiérarchie, établie sur une base quantitative, aide les préventionnistes à déterminer de manière objective les facteurs de risque ou causes possibles d’accident à prioriser. La méthode exploite les fonctions de masse des indicateurs composant la règle. L’étude a montré que la probabilité des règles caractérisant les accidents mortels analysés est supérieure à celle des règles décrivant les accidents non mortels étudiés. Constat surprenant puisque, dans la réalité, les accidents non mortels (graves et non graves) sont plus fréquents que ceux mortels. Ce constat s’explique par le fait que les accidents analysés proviennent du Centre de documentation de la CNESST qui publie des rapports d’enquête uniquement d’accidents graves ou mortels. Puisque dans la thèse, les accidents avec la plus grande gravité du dommage (mortels) sont aussi les plus probables, il est suggéré que les préventionnistes des entreprises concernées par les accidents analysés entament le processus de réduction du risque en s’attaquant d’abord à la prévention de dommages mortels. La probabilité du dommage calculée permettra d’avoir un référentiel de comparaison permettant de suivre l’évolution du risque. Par exemple, à la suite de la mise en œuvre d’un moyen de réduction du risque, il sera possible d’en évaluer l’impact sur la probabilité du dommage initialement calculée. La démarche proposée est transposable à des équipements industriels autres que les convoyeurs à courroie. Elle peut être utilisée pour l’estimation de la probabilité d’occurrence d’un événement dangereux de nature diverse. Cette probabilité calculée pourra être intégrée à des outils qualitatifs, dans le but de préciser leurs niveaux de probabilité d’occurrence d’un événement dangereux. Cette intégration rendra le processus d’estimation du risque plus objectif. Le succès de la démarche proposée repose sur la bonne volonté des intervenants à faire remonter l’information concernant les risques liés aux machines. Si aucun intervenant ne révèle d’information relative à un nouvel état d’un moyen de réduction du risque ou à un nouvel accident ou incident, l’information ne sera jamais enregistrée dans la base de données. Alors, les règles décrivant le risque ne seront jamais actualisées. Conséquemment, il en sera autant pour les facteurs de risques et les causes potentielles d’accidents, ainsi que les probabilités associées. Dans pareil contexte, des décisions dépassées risquent d’être prises pour réduire le risque. Une culture de sécurité et une confiance mutuelle dans l’entreprise sont primordiales afin d’encourager la remontée d’information pour brosser un portrait plus juste du risque et améliorer l’efficacité des moyens de réduction du risque.----------ABSTRACT : In machinery safety, safety practitioners use different sources as accident investigation reports to help them identify the risks in the workplace. In that case, they retrieve the knowledge from those reports one at a time, then may forget about them later. Risk identification is followed by risk estimation in risk management. Safety practitioners in machinery safety generally use qualitative tools to estimate the risk. The qualitative aspect entails subjective decision-making regarding risk reduction measures. Moreover, the static nature of those tools forces its users to work with predetermined risk parameters. If new parameters are required to better describe the changing risk, those tools will be unable to consider them, which will lead to outdated decisions in risk reduction. To overcome these issues, this thesis aims at suggesting a risk identification and risk estimation method that facilitates tracking of machinery-related risk in the workplace as well as their physical and organizational environment. That method exploits dynamic experience feedback (ExF) to make the most out of the reports in an efficient and sustainable way. Dynamic ExF is a process consisting of reporting information as well as inferring knowledge at the same time. The essential knowledge is extracted from the information contained in the reports after that information has been formalized in a database. That knowledge can be updated gradually as new information is reported. The knowledge is inferred in the form of relevant patterns generated by a data mining algorithm. A pattern is a combination of conditions describing accidents pertaining to a same set called “class”. Every condition is made of an indicator respecting a specific value or range of values. The indicator is a risk factor or a potential cause of accident. All in all, with a dynamic ExF using a database that can be updated on a regular basis, the reports will not go to waste after being read. Instead, they will continually contribute to the knowledge inference which will progress in the context. A machine learning algorithm called Logical Analysis of Data (LAD) is integrated with the dynamic experience feedback process to ensure that the method is also suited for scarce data. Indeed, LAD proved to be efficient since the classification accuracy of the patterns generated from a 23-belt-conveyor-related accident database was adequate: between 72% and 74%. Two facts explain the choice of belt conveyors for the thesis: among all types of conveyors, they are the ones responsible of the biggest proportion of accidents (16.8%) between 1990 and 2011, according to 137 accident investigation reports from the Commission des normes, de l’équité, de la santé et de la sécurité du travail (CNESST) owing to conveyors; belt conveyors have the biggest ratio (8.5%) of serious and fatal accidents related to all kinds of machines, between 1999 and 2007, according to a database of the Institut de recherche Robert-Sauvé en santé et en sécurité du travail (IRSST). The 23 accident investigation reports dealt with in this thesis come from the CNESST’s Documentation Center. Analyzing the information in every report allowed for the identification of the elements describing the accidental context. Processing that information lead to a database that LAD used to generate two kinds of patterns: one for a version of the database splitting the 23 accidents into two classes: maintenance-related accidents and production-related ones; the other for a version of the 23-accident database comprising “Non fatal” and “Fatal” classes. Some of the patterns generated showed that an accident can happen due to dangerous conditions (e.g. a poor environment in the workplace), but also because of an apparently-safe condition (e.g. an existing prevention program). In that case, one should investigate the unsafe sub-factors underlying to the apparently-safe condition in order to understand the occurrence of the accident. For example, 60% of the maintenance-related accidents happened despite the presence of a prevention program. Not updating that program could be a reason why the accident happened. Other patterns showed that risk factors or causes related to the equipment, the organization, the individual or the moment explain mainly the accidents analyzed. Quantitative parameters related to the patterns, such as their coverage and their indicators frequency, enabled to start ranking the patterns as well as their indicators according to their importance (the coverage is the number of accidents a pattern characterizes). A probability of occurrence of harm estimation method associated with each pattern was developed to complete that hierarchy among the patterns with identical coverage. Such hierarchy with quantitative basis objectively guides the safety practitioner with the risks factors or accident potential causes needing to be taken care of in priority. The probability of occurrence of harm estimation uses the mass functions related to the indicators included in the pattern. It is found that the patterns representing the “Fatal” class have a higher probability compared with the ones describing the “Non fatal” class. Surprising fact because in reality, non fatal accidents (serious and non serious ones) are more frequent than fatal accidents. Since the CNESST publishes accident investigation reports only regarding serious or fatal injuries, such difference is understandable. Nevertheless, considering the sample studied for the thesis, the most severe type of accident (fatal) is also the most likely. Therefore, it is suggested that the safety practitioners from the enterprises concerned by the accidents analyzed perform the risk reduction process preventing fatalities first. The probability of occurrence of harm calculated has the potential to serve as a basis for comparison that enables to track the risk evolution. For instance, after implementing a risk reduction measure, one will be able to evaluate the effect of that measure on the probability of occurrence of harm previously calculated. The method suggested is transposable to industrial equipment other than belt conveyors. The same approach can be adopted to estimate the probability of occurrence of a hazardous event of different nature. In such case, the probability calculated can be integrated to qualitative tools to specify their labels describing the probability of occurrence of a hazardous event. That integration adds objectivity to risk estimation process. The success of that method relies on the good will of the stakeholders to bring feedback on the machinery-related risk portrait. If no stakeholder reveals information about a new state of a risk reduction measure or about a new circumstantial event, that information will never be registered in the database. Accordingly, the patterns defining the risk will never be updated, and so will not be the essential risk factors and accident potential causes, as well as the probabilities related. Consequently, outdated decision-making might be performed. A safety culture as well as a mutual trust in the enterprises is important to encourage feedback in order to improve the risk portrait and the efficiency of the risk reduction measures

PolyPublie