The architecture choice of the neural network used to describe changes in size of induced seismicity

Abstract

W artykule przedstawiono wyniki badań mających na celu ustalenie optymalnej architektury sieci neuronowej wykorzystywanej do prognozy zmian gęstości energii wstrząsów indukowanych prowadzonymi robotami górniczymi. Zbiór wykorzystywany do nauki sieci neuronowej zawierał wartości wskaźników charakteryzujących zmiany energii właściwej odkształcenia sprężystego (szacowane z wykorzystaniem rozwiązania przemieszczeniowego zadania brzegowego przestrzennej teorii sprężystości podanego przez H. Gila), a także informacje o zarejestrowanym poziomie sejsmiczności, charakteryzowanym przez określenie gęstości energii wstrząsów. W trakcie prowadzonych badań przeanalizowano wpływ liczby neuronów w warstwie ukrytej sieci (od 1 do 16) oraz przyjętej charakterystyki neuronu (rozważano następujące funkcje aktywacji: liniową, logistyczną i tangens hiperboliczny) na dokładność opisu zmian sejsmiczności indukowanej przy zastosowaniu odpowiednio wytrenowanej (nauczonej) sieci neuronowej. Sprawdzono także wpływ architektury sieci neuronowej na dokładność prognozy zmian wydatku energetycznego wstrząsów górotworu. Rezultaty obliczeń, wykonanych dla silnie zagrożonego wstrząsami i tąpaniami rejonu robót górniczych prowadzonych w jednej z kopalń węgla kamiennego GZW, potwierdziły możliwość zastosowania sieci neuronowych do szacowania zmian gęstości energii wstrząsów towarzyszących eksploatacji złoża. Stwierdzono także, że wystarczającą dokładność prognozy można uzyskać stosując mało rozbudowaną sieć neuronową, zawierającą w warstwie ukrytej tylko dwa neurony, natomiast jako funkcję aktywacji korzystnie jest przyjąć tangens hiperboliczny.The article presents results of researches which have been done to define optimal architecture of neural network used to forecast changes in size of seismicity induced by mining works in progress. The set that had been used to learn neural network has included value of indicators that characterize changes of elastic strain energy (estimated with edge task translocation of spatial theory of elasticity given by H. Gil) and information about recorded level of seismicity, described by density of seismic events energy. While doing the research the influence of neurons number in the hidden layer of the network (from 1 to 16) was analyzed and neuron's characteristic (following activation functions have been considered: linear, logistic and hyperbolic tangent) for accuracy in describing induced seismicity changes when appropriately trained neural network is applied. Influence of neural network architecture on exactitude of change forecast of energy expenditure of rock mass shocks has also been checked. Calculation results for the region that is extremely at risk of shocks (region of mining works that are in progress in one of GZW coal mines) have confirmed possibility of using neural networks to estimate changes in size of induced seismicity connected with deposit exploitation. It has been also stated that forecast accuracy can be achieved by using not a very expanded neural network consisted of only two neurons in the hidden layer, however as an activation function it is favorably to use hyperbolic tangent

    Similar works