5 research outputs found
ΠΠ΅ΡΠΈΡΠΈΠΊΠ°ΡΠΈΡ ΡΠ°Π·Π»ΠΈΠ²ΠΎΠ² Π½Π΅ΡΡΠΈ Π½Π° Π²ΠΎΠ΄Π½ΡΡ ΠΏΠΎΠ²Π΅ΡΡ Π½ΠΎΡΡΡΡ ΠΏΠΎ Π°ΡΡΠΎΡΠΎΡΠΎΡΠ½ΠΈΠΌΠΊΠ°ΠΌ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² Π³Π»ΡΠ±ΠΎΠΊΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ
The article solves the problem of verifying oil spills on the water surfaces of rivers, seas and oceans using optical aerial photographs, which are obtained from cameras of unmanned aerial vehicles, based on deep learning methods. The specificity of this problem is the presence of areas visually similar to oil spills on water surfaces caused by blooms of specific algae, substances that do not cause environmental damage (for example, palm oil), or glare when shooting (so-called look-alikes). Many studies in this area are based on the analysis of synthetic aperture radars (SAR) images, which do not provide accurate classification and segmentation. Follow-up verification contributes to reducing environmental and property damage, and oil spill size monitoring is used to make further response decisions. A new approach to the verification of optical images as a binary classification problem based on the Siamese network is proposed, when a fragment of the original image is repeatedly compared with representative examples from the class of marine oil slicks. The Siamese network is based on the lightweight VGG16 network. When the threshold value of the output function is exceeded, a decision is made about the presence of an oil spill. To train the networks, we collected and labeled our own dataset from open Internet resources. A significant problem is an imbalance of classes in the dataset, which required the use of augmentation methods based not only on geometric and color manipulations, but also on the application of a Generative Adversarial Network (GAN). Experiments have shown that the classification accuracy of oil spills and look-alikes on the test set reaches values of 0.91 and 0.834, respectively. Further, an additional problem of accurate semantic segmentation of an oil spill is solved using convolutional neural networks (CNN) of the encoder-decoder type. Three deep network architectures U-Net, SegNet, and Poly-YOLOv3 have been explored for segmentation. The Poly-YOLOv3 network demonstrated the best results, reaching an accuracy of 0.97 and an average image processing time of 385 s with the Google Colab web service. A database was also designed to store both original and verified images with problem areas.Π ΡΡΠ°ΡΡΠ΅ ΡΠ΅ΡΠ°Π΅ΡΡΡ Π·Π°Π΄Π°ΡΠ° Π²Π΅ΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΡΠ°Π·Π»ΠΈΠ²ΠΎΠ² Π½Π΅ΡΡΠΈ Π½Π° Π²ΠΎΠ΄Π½ΡΡ
ΠΏΠΎΠ²Π΅ΡΡ
Π½ΠΎΡΡΡΡ
ΡΠ΅ΠΊ, ΠΌΠΎΡΠ΅ΠΉ ΠΈ ΠΎΠΊΠ΅Π°Π½ΠΎΠ² ΠΏΠΎ ΠΎΠΏΡΠΈΡΠ΅ΡΠΊΠΈΠΌ Π°ΡΡΠΎΡΠΎΡΠΎΡΠ½ΠΈΠΌΠΊΠ°ΠΌ Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² Π³Π»ΡΠ±ΠΎΠΊΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ. ΠΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΡΡ Π΄Π°Π½Π½ΠΎΠΉ Π·Π°Π΄Π°ΡΠΈ ΡΠ²Π»ΡΠ΅ΡΡΡ Π½Π°Π»ΠΈΡΠΈΠ΅ Π²ΠΈΠ·ΡΠ°Π»ΡΠ½ΠΎ ΠΏΠΎΡ
ΠΎΠΆΠΈΡ
Π½Π° ΡΠ°Π·Π»ΠΈΠ²Ρ Π½Π΅ΡΡΠΈ ΠΎΠ±Π»Π°ΡΡΠ΅ΠΉ Π½Π° Π²ΠΎΠ΄Π½ΡΡ
ΠΏΠΎΠ²Π΅ΡΡ
Π½ΠΎΡΡΡΡ
, Π²ΡΠ·Π²Π°Π½Π½ΡΡ
ΡΠ²Π΅ΡΠ΅Π½ΠΈΠ΅ΠΌ Π²ΠΎΠ΄ΠΎΡΠΎΡΠ»Π΅ΠΉ, Π²Π΅ΡΠ΅ΡΡΠ², Π½Π΅ ΠΏΡΠΈΠ½ΠΎΡΡΡΠΈΡ
ΡΠΊΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΠΉ ΡΡΠ΅ΡΠ± (Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΠΏΠ°Π»ΡΠΌΠΎΠ²ΠΎΠ΅ ΠΌΠ°ΡΠ»ΠΎ), Π±Π»ΠΈΠΊΠΎΠ² ΠΏΡΠΈ ΡΡΠ΅ΠΌΠΊΠ΅ ΠΈΠ»ΠΈ ΠΏΡΠΈΡΠΎΠ΄Π½ΡΡ
ΡΠ²Π»Π΅Π½ΠΈΠΉ (ΡΠ°ΠΊ Π½Π°Π·ΡΠ²Π°Π΅ΠΌΡΠ΅ Β«Π΄Π²ΠΎΠΉΠ½ΠΈΠΊΠΈΒ»). ΠΠ½ΠΎΠ³ΠΈΠ΅ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΡ Π² Π΄Π°Π½Π½ΠΎΠΉ ΠΎΠ±Π»Π°ΡΡΠΈ ΠΎΡΠ½ΠΎΠ²Π°Π½Ρ Π½Π° Π°Π½Π°Π»ΠΈΠ·Π΅ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠΉ, ΠΏΠΎΠ»ΡΡΠ΅Π½Π½ΡΡ
ΠΎΡ ΡΠ°Π΄Π°ΡΠΎΠ² Ρ ΡΠΈΠ½ΡΠ΅Π·ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ Π°ΠΏΠ΅ΡΡΡΡΠΎΠΉ (Synthetic Aperture Radar (SAR) images), ΠΊΠΎΡΠΎΡΡΠ΅ Π½Π΅ ΠΎΠ±Π΅ΡΠΏΠ΅ΡΠΈΠ²Π°ΡΡ ΡΠΎΡΠ½ΠΎΠΉ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΠΈ ΡΠ΅Π³ΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ. ΠΠΎΡΠ»Π΅Π΄ΡΡΡΠ°Ρ Π²Π΅ΡΠΈΡΠΈΠΊΠ°ΡΠΈΡ ΡΠΏΠΎΡΠΎΠ±ΡΡΠ²ΡΠ΅Ρ ΡΠΎΠΊΡΠ°ΡΠ΅Π½ΠΈΡ ΡΠΊΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΈ ΠΌΠ°ΡΠ΅ΡΠΈΠ°Π»ΡΠ½ΠΎΠ³ΠΎ ΡΡΠ΅ΡΠ±Π°, Π° ΠΌΠΎΠ½ΠΈΡΠΎΡΠΈΠ½Π³ ΡΠ°Π·ΠΌΠ΅ΡΠΎΠ² ΠΏΠ»ΠΎΡΠ°Π΄ΠΈ Π½Π΅ΡΡΡΠ½ΠΎΠ³ΠΎ ΠΏΡΡΠ½Π° ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ Π΄Π»Ρ ΠΏΡΠΈΠ½ΡΡΠΈΡ Π΄Π°Π»ΡΠ½Π΅ΠΉΡΠΈΡ
ΡΠ΅ΡΠ΅Π½ΠΈΠΉ ΠΏΠΎ ΡΡΡΡΠ°Π½Π΅Π½ΠΈΡ ΠΏΠΎΡΠ»Π΅Π΄ΡΡΠ²ΠΈΠΉ. ΠΡΠ΅Π΄Π»Π°Π³Π°Π΅ΡΡΡ Π½ΠΎΠ²ΡΠΉ ΠΏΠΎΠ΄Ρ
ΠΎΠ΄ ΠΊ Π²Π΅ΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΠΎΠΏΡΠΈΡΠ΅ΡΠΊΠΈΡ
ΡΠ½ΠΈΠΌΠΊΠΎΠ² ΠΊΠ°ΠΊ Π·Π°Π΄Π°ΡΠΈ Π±ΠΈΠ½Π°ΡΠ½ΠΎΠΉ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΡΠΈΠ°ΠΌΡΠΊΠΎΠΉ ΡΠ΅ΡΠΈ, ΠΊΠΎΠ³Π΄Π° ΡΡΠ°Π³ΠΌΠ΅Π½Ρ ΠΈΡΡ
ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ ΠΌΠ½ΠΎΠ³ΠΎΠΊΡΠ°ΡΠ½ΠΎ ΡΡΠ°Π²Π½ΠΈΠ²Π°Π΅ΡΡΡ Ρ ΡΠ΅ΠΏΡΠ΅Π·Π΅Π½ΡΠ°ΡΠΈΠ²Π½ΡΠΌΠΈ ΠΏΡΠΈΠΌΠ΅ΡΠ°ΠΌΠΈ ΠΈΠ· ΠΊΠ»Π°ΡΡΠ° Π½Π΅ΡΡΡΠ½ΡΡ
ΠΏΡΡΠ΅Π½ Π½Π° Π²ΠΎΠ΄Π½ΡΡ
ΠΏΠΎΠ²Π΅ΡΡ
Π½ΠΎΡΡΡΡ
. ΠΡΠ½ΠΎΠ²ΠΎΠΉ ΡΠΈΠ°ΠΌΡΠΊΠΎΠΉ ΡΠ΅ΡΠΈ ΡΠ»ΡΠΆΠΈΡ ΠΎΠ±Π»Π΅Π³ΡΠ΅Π½Π½Π°Ρ ΡΠ΅ΡΡ VGG16. ΠΡΠΈ ΠΏΡΠ΅Π²ΡΡΠ΅Π½ΠΈΠΈ ΠΏΠΎΡΠΎΠ³ΠΎΠ²ΠΎΠ³ΠΎ Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π²ΡΡ
ΠΎΠ΄Π½ΠΎΠΉ ΡΡΠ½ΠΊΡΠΈΠΈ ΠΏΡΠΈΠ½ΠΈΠΌΠ°Π΅ΡΡΡ ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ ΠΎ Π½Π°Π»ΠΈΡΠΈΠΈ ΡΠ°Π·Π»ΠΈΠ²Π° Π½Π΅ΡΡΠΈ. ΠΠ»Ρ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ ΡΠ΅ΡΠΈ Π±ΡΠ» ΡΠΎΠ±ΡΠ°Π½ ΠΈ ΡΠ°Π·ΠΌΠ΅ΡΠ΅Π½ ΡΠΎΠ±ΡΡΠ²Π΅Π½Π½ΡΠΉ Π½Π°Π±ΠΎΡ Π΄Π°Π½Π½ΡΡ
ΠΈΠ· ΠΎΡΠΊΡΡΡΡΡ
ΠΈΠ½ΡΠ΅ΡΠ½Π΅Ρ-ΡΠ΅ΡΡΡΡΠΎΠ². Π‘ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠΉ ΠΏΡΠΎΠ±Π»Π΅ΠΌΠΎΠΉ ΡΠ²Π»ΡΠ΅ΡΡΡ Π½Π΅ΡΠ±Π°Π»Π°Π½ΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΡΡΡ Π²ΡΠ±ΠΎΡΠΊΠΈ Π΄Π°Π½Π½ΡΡ
ΠΏΠΎ ΠΊΠ»Π°ΡΡΠ°ΠΌ, ΡΡΠΎ ΠΏΠΎΡΡΠ΅Π±ΠΎΠ²Π°Π»ΠΎ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² Π°ΡΠ³ΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ, ΠΎΡΠ½ΠΎΠ²Π°Π½Π½ΡΡ
Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ Π½Π° Π³Π΅ΠΎΠΌΠ΅ΡΡΠΈΡΠ΅ΡΠΊΠΈΡ
ΠΈ ΡΠ²Π΅ΡΠΎΠ²ΡΡ
ΠΌΠ°Π½ΠΈΠΏΡΠ»ΡΡΠΈΡΡ
, Π½ΠΎ ΠΈ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠ²Π½ΠΎΠΉ ΡΠΎΡΡΡΠ·Π°ΡΠ΅Π»ΡΠ½ΠΎΠΉ ΡΠ΅ΡΠΈ (Generative Adversarial Network, GAN). ΠΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΡ ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΈ, ΡΡΠΎ ΡΠΎΡΠ½ΠΎΡΡΡ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΡΠ°Π·Π»ΠΈΠ²ΠΎΠ² Π½Π΅ΡΡΠΈ ΠΈ Β«Π΄Π²ΠΎΠΉΠ½ΠΈΠΊΠΎΠ²Β» Π½Π° ΡΠ΅ΡΡΠΎΠ²ΠΎΠΉ Π²ΡΠ±ΠΎΡΠΊΠ΅ Π΄ΠΎΡΡΠΈΠ³Π°Π΅Ρ Π·Π½Π°ΡΠ΅Π½ΠΈΠΉ 0,91 ΠΈ 0,834 ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²Π΅Π½Π½ΠΎ. ΠΠ°Π»Π΅Π΅ ΡΠ΅ΡΠ°Π΅ΡΡΡ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½Π°Ρ Π·Π°Π΄Π°ΡΠ° ΡΠ΅ΠΌΠ°Π½ΡΠΈΡΠ΅ΡΠΊΠΎΠΉ ΡΠ΅Π³ΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ Π½Π΅ΡΡΡΠ½ΠΎΠ³ΠΎ ΠΏΡΡΠ½Π° Ρ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ΠΌ ΡΠ²Π΅ΡΡΠΎΡΠ½ΡΡ
Π½Π΅ΠΉΡΠΎΠ½Π½ΡΡ
ΡΠ΅ΡΠ΅ΠΉ (Π‘ΠΠ‘) ΡΠΈΠΏΠ° ΠΊΠΎΠ΄ΠΈΡΠΎΠ²ΡΠΈΠΊ-Π΄Π΅ΠΊΠΎΠ΄ΠΈΡΠΎΠ²ΡΠΈΠΊ. ΠΠ»Ρ ΡΠ΅Π³ΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π»ΠΈΡΡ ΡΡΠΈ Π°ΡΡ
ΠΈΡΠ΅ΠΊΡΡΡΡ Π³Π»ΡΠ±ΠΎΠΊΠΈΡ
ΡΠ΅ΡΠ΅ΠΉ, Π° ΠΈΠΌΠ΅Π½Π½ΠΎ U-Net, SegNet ΠΈ Poly-YOLOv3. ΠΡΡΡΠΈΠ΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ ΠΏΠΎΠΊΠ°Π·Π°Π»Π° ΡΠ΅ΡΡ Poly-YOLOv3, Π΄ΠΎΡΡΠΈΠ³Π½ΡΠ² ΡΠΎΡΠ½ΠΎΡΡΠΈ 0,97 ΠΏΡΠΈ ΡΡΠ΅Π΄Π½Π΅ΠΌ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ ΡΠ½ΠΈΠΌΠΊΠ° 385 Ρ Π²Π΅Π±-ΡΠ΅ΡΠ²ΠΈΡΠΎΠΌ Google Colab. Π’Π°ΠΊΠΆΠ΅ Π±ΡΠ»Π° ΡΠΏΡΠΎΠ΅ΠΊΡΠΈΡΠΎΠ²Π°Π½Π° Π±Π°Π·Π° Π΄Π°Π½Π½ΡΡ
Π΄Π»Ρ Ρ
ΡΠ°Π½Π΅Π½ΠΈΡ ΠΈΡΡ
ΠΎΠ΄Π½ΡΡ
ΠΈ Π²Π΅ΡΠΈΡΠΈΡΠΈΡΠΎΠ²Π°Π½Π½ΡΡ
ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠΉ Ρ ΠΏΡΠΎΠ±Π»Π΅ΠΌΠ½ΡΠΌΠΈ ΠΎΠ±Π»Π°ΡΡΡΠΌΠΈ
ΠΠ΅ΡΠΈΡΠΈΠΊΠ°ΡΠΈΡ ΡΠ°Π·Π»ΠΈΠ²ΠΎΠ² Π½Π΅ΡΡΠΈ Π½Π° Π²ΠΎΠ΄Π½ΡΡ ΠΏΠΎΠ²Π΅ΡΡ Π½ΠΎΡΡΡΡ ΠΏΠΎ Π°ΡΡΠΎΡΠΎΡΠΎΡΠ½ΠΈΠΌΠΊΠ°ΠΌ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² Π³Π»ΡΠ±ΠΎΠΊΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ
Π ΡΡΠ°ΡΡΠ΅ ΡΠ΅ΡΠ°Π΅ΡΡΡ Π·Π°Π΄Π°ΡΠ° Π²Π΅ΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΡΠ°Π·Π»ΠΈΠ²ΠΎΠ² Π½Π΅ΡΡΠΈ Π½Π° Π²ΠΎΠ΄Π½ΡΡ
ΠΏΠΎΠ²Π΅ΡΡ
Π½ΠΎΡΡΡΡ
ΡΠ΅ΠΊ, ΠΌΠΎΡΠ΅ΠΉ ΠΈ ΠΎΠΊΠ΅Π°Π½ΠΎΠ² ΠΏΠΎ ΠΎΠΏΡΠΈΡΠ΅ΡΠΊΠΈΠΌ Π°ΡΡΠΎΡΠΎΡΠΎΡΠ½ΠΈΠΌΠΊΠ°ΠΌ Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² Π³Π»ΡΠ±ΠΎΠΊΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ. ΠΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΡΡ Π΄Π°Π½Π½ΠΎΠΉ Π·Π°Π΄Π°ΡΠΈ ΡΠ²Π»ΡΠ΅ΡΡΡ Π½Π°Π»ΠΈΡΠΈΠ΅ Π²ΠΈΠ·ΡΠ°Π»ΡΠ½ΠΎ ΠΏΠΎΡ
ΠΎΠΆΠΈΡ
Π½Π° ΡΠ°Π·Π»ΠΈΠ²Ρ Π½Π΅ΡΡΠΈ ΠΎΠ±Π»Π°ΡΡΠ΅ΠΉ Π½Π° Π²ΠΎΠ΄Π½ΡΡ
ΠΏΠΎΠ²Π΅ΡΡ
Π½ΠΎΡΡΡΡ
, Π²ΡΠ·Π²Π°Π½Π½ΡΡ
ΡΠ²Π΅ΡΠ΅Π½ΠΈΠ΅ΠΌ Π²ΠΎΠ΄ΠΎΡΠΎΡΠ»Π΅ΠΉ, Π²Π΅ΡΠ΅ΡΡΠ², Π½Π΅ ΠΏΡΠΈΠ½ΠΎΡΡΡΠΈΡ
ΡΠΊΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΠΉ ΡΡΠ΅ΡΠ± (Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΠΏΠ°Π»ΡΠΌΠΎΠ²ΠΎΠ΅ ΠΌΠ°ΡΠ»ΠΎ), Π±Π»ΠΈΠΊΠΎΠ² ΠΏΡΠΈ ΡΡΠ΅ΠΌΠΊΠ΅ ΠΈΠ»ΠΈ ΠΏΡΠΈΡΠΎΠ΄Π½ΡΡ
ΡΠ²Π»Π΅Π½ΠΈΠΉ (ΡΠ°ΠΊ Π½Π°Π·ΡΠ²Π°Π΅ΠΌΡΠ΅ Β«Π΄Π²ΠΎΠΉΠ½ΠΈΠΊΠΈΒ»). ΠΠ½ΠΎΠ³ΠΈΠ΅ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΡ Π² Π΄Π°Π½Π½ΠΎΠΉ ΠΎΠ±Π»Π°ΡΡΠΈ ΠΎΡΠ½ΠΎΠ²Π°Π½Ρ Π½Π° Π°Π½Π°Π»ΠΈΠ·Π΅ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠΉ, ΠΏΠΎΠ»ΡΡΠ΅Π½Π½ΡΡ
ΠΎΡ ΡΠ°Π΄Π°ΡΠΎΠ² Ρ ΡΠΈΠ½ΡΠ΅Π·ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ Π°ΠΏΠ΅ΡΡΡΡΠΎΠΉ (Synthetic Aperture Radar (SAR) images), ΠΊΠΎΡΠΎΡΡΠ΅ Π½Π΅ ΠΎΠ±Π΅ΡΠΏΠ΅ΡΠΈΠ²Π°ΡΡ ΡΠΎΡΠ½ΠΎΠΉ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΠΈ ΡΠ΅Π³ΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ. ΠΠΎΡΠ»Π΅Π΄ΡΡΡΠ°Ρ Π²Π΅ΡΠΈΡΠΈΠΊΠ°ΡΠΈΡ ΡΠΏΠΎΡΠΎΠ±ΡΡΠ²ΡΠ΅Ρ ΡΠΎΠΊΡΠ°ΡΠ΅Π½ΠΈΡ ΡΠΊΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΈ ΠΌΠ°ΡΠ΅ΡΠΈΠ°Π»ΡΠ½ΠΎΠ³ΠΎ ΡΡΠ΅ΡΠ±Π°, Π° ΠΌΠΎΠ½ΠΈΡΠΎΡΠΈΠ½Π³ ΡΠ°Π·ΠΌΠ΅ΡΠΎΠ² ΠΏΠ»ΠΎΡΠ°Π΄ΠΈ Π½Π΅ΡΡΡΠ½ΠΎΠ³ΠΎ ΠΏΡΡΠ½Π° ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ Π΄Π»Ρ ΠΏΡΠΈΠ½ΡΡΠΈΡ Π΄Π°Π»ΡΠ½Π΅ΠΉΡΠΈΡ
ΡΠ΅ΡΠ΅Π½ΠΈΠΉ ΠΏΠΎ ΡΡΡΡΠ°Π½Π΅Π½ΠΈΡ ΠΏΠΎΡΠ»Π΅Π΄ΡΡΠ²ΠΈΠΉ. ΠΡΠ΅Π΄Π»Π°Π³Π°Π΅ΡΡΡ Π½ΠΎΠ²ΡΠΉ ΠΏΠΎΠ΄Ρ
ΠΎΠ΄ ΠΊ Π²Π΅ΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΠΎΠΏΡΠΈΡΠ΅ΡΠΊΠΈΡ
ΡΠ½ΠΈΠΌΠΊΠΎΠ² ΠΊΠ°ΠΊ Π·Π°Π΄Π°ΡΠΈ Π±ΠΈΠ½Π°ΡΠ½ΠΎΠΉ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΡΠΈΠ°ΠΌΡΠΊΠΎΠΉ ΡΠ΅ΡΠΈ, ΠΊΠΎΠ³Π΄Π° ΡΡΠ°Π³ΠΌΠ΅Π½Ρ ΠΈΡΡ
ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ ΠΌΠ½ΠΎΠ³ΠΎΠΊΡΠ°ΡΠ½ΠΎ ΡΡΠ°Π²Π½ΠΈΠ²Π°Π΅ΡΡΡ Ρ ΡΠ΅ΠΏΡΠ΅Π·Π΅Π½ΡΠ°ΡΠΈΠ²Π½ΡΠΌΠΈ ΠΏΡΠΈΠΌΠ΅ΡΠ°ΠΌΠΈ ΠΈΠ· ΠΊΠ»Π°ΡΡΠ° Π½Π΅ΡΡΡΠ½ΡΡ
ΠΏΡΡΠ΅Π½ Π½Π° Π²ΠΎΠ΄Π½ΡΡ
ΠΏΠΎΠ²Π΅ΡΡ
Π½ΠΎΡΡΡΡ
. ΠΡΠ½ΠΎΠ²ΠΎΠΉ ΡΠΈΠ°ΠΌΡΠΊΠΎΠΉ ΡΠ΅ΡΠΈ ΡΠ»ΡΠΆΠΈΡ ΠΎΠ±Π»Π΅Π³ΡΠ΅Π½Π½Π°Ρ ΡΠ΅ΡΡ VGG16. ΠΡΠΈ ΠΏΡΠ΅Π²ΡΡΠ΅Π½ΠΈΠΈ ΠΏΠΎΡΠΎΠ³ΠΎΠ²ΠΎΠ³ΠΎ Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π²ΡΡ
ΠΎΠ΄Π½ΠΎΠΉ ΡΡΠ½ΠΊΡΠΈΠΈ ΠΏΡΠΈΠ½ΠΈΠΌΠ°Π΅ΡΡΡ ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ ΠΎ Π½Π°Π»ΠΈΡΠΈΠΈ ΡΠ°Π·Π»ΠΈΠ²Π° Π½Π΅ΡΡΠΈ. ΠΠ»Ρ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ ΡΠ΅ΡΠΈ Π±ΡΠ» ΡΠΎΠ±ΡΠ°Π½ ΠΈ ΡΠ°Π·ΠΌΠ΅ΡΠ΅Π½ ΡΠΎΠ±ΡΡΠ²Π΅Π½Π½ΡΠΉ Π½Π°Π±ΠΎΡ Π΄Π°Π½Π½ΡΡ
ΠΈΠ· ΠΎΡΠΊΡΡΡΡΡ
ΠΈΠ½ΡΠ΅ΡΠ½Π΅Ρ-ΡΠ΅ΡΡΡΡΠΎΠ². Π‘ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠΉ ΠΏΡΠΎΠ±Π»Π΅ΠΌΠΎΠΉ ΡΠ²Π»ΡΠ΅ΡΡΡ Π½Π΅ΡΠ±Π°Π»Π°Π½ΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΡΡΡ Π²ΡΠ±ΠΎΡΠΊΠΈ Π΄Π°Π½Π½ΡΡ
ΠΏΠΎ ΠΊΠ»Π°ΡΡΠ°ΠΌ, ΡΡΠΎ ΠΏΠΎΡΡΠ΅Π±ΠΎΠ²Π°Π»ΠΎ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² Π°ΡΠ³ΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ, ΠΎΡΠ½ΠΎΠ²Π°Π½Π½ΡΡ
Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ Π½Π° Π³Π΅ΠΎΠΌΠ΅ΡΡΠΈΡΠ΅ΡΠΊΠΈΡ
ΠΈ ΡΠ²Π΅ΡΠΎΠ²ΡΡ
ΠΌΠ°Π½ΠΈΠΏΡΠ»ΡΡΠΈΡΡ
, Π½ΠΎ ΠΈ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠ²Π½ΠΎΠΉ ΡΠΎΡΡΡΠ·Π°ΡΠ΅Π»ΡΠ½ΠΎΠΉ ΡΠ΅ΡΠΈ (Generative Adversarial Network, GAN). ΠΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΡ ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΈ, ΡΡΠΎ ΡΠΎΡΠ½ΠΎΡΡΡ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΡΠ°Π·Π»ΠΈΠ²ΠΎΠ² Π½Π΅ΡΡΠΈ ΠΈ Β«Π΄Π²ΠΎΠΉΠ½ΠΈΠΊΠΎΠ²Β» Π½Π° ΡΠ΅ΡΡΠΎΠ²ΠΎΠΉ Π²ΡΠ±ΠΎΡΠΊΠ΅ Π΄ΠΎΡΡΠΈΠ³Π°Π΅Ρ Π·Π½Π°ΡΠ΅Π½ΠΈΠΉ 0,91 ΠΈ 0,834 ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²Π΅Π½Π½ΠΎ. ΠΠ°Π»Π΅Π΅ ΡΠ΅ΡΠ°Π΅ΡΡΡ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½Π°Ρ Π·Π°Π΄Π°ΡΠ° ΡΠ΅ΠΌΠ°Π½ΡΠΈΡΠ΅ΡΠΊΠΎΠΉ ΡΠ΅Π³ΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ Π½Π΅ΡΡΡΠ½ΠΎΠ³ΠΎ ΠΏΡΡΠ½Π° Ρ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ΠΌ ΡΠ²Π΅ΡΡΠΎΡΠ½ΡΡ
Π½Π΅ΠΉΡΠΎΠ½Π½ΡΡ
ΡΠ΅ΡΠ΅ΠΉ (Π‘ΠΠ‘) ΡΠΈΠΏΠ° ΠΊΠΎΠ΄ΠΈΡΠΎΠ²ΡΠΈΠΊ-Π΄Π΅ΠΊΠΎΠ΄ΠΈΡΠΎΠ²ΡΠΈΠΊ. ΠΠ»Ρ ΡΠ΅Π³ΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π»ΠΈΡΡ ΡΡΠΈ Π°ΡΡ
ΠΈΡΠ΅ΠΊΡΡΡΡ Π³Π»ΡΠ±ΠΎΠΊΠΈΡ
ΡΠ΅ΡΠ΅ΠΉ, Π° ΠΈΠΌΠ΅Π½Π½ΠΎ U-Net, SegNet ΠΈ Poly-YOLOv3. ΠΡΡΡΠΈΠ΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ ΠΏΠΎΠΊΠ°Π·Π°Π»Π° ΡΠ΅ΡΡ Poly-YOLOv3, Π΄ΠΎΡΡΠΈΠ³Π½ΡΠ² ΡΠΎΡΠ½ΠΎΡΡΠΈ 0,97 ΠΏΡΠΈ ΡΡΠ΅Π΄Π½Π΅ΠΌ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ ΡΠ½ΠΈΠΌΠΊΠ° 385 Ρ Π²Π΅Π±-ΡΠ΅ΡΠ²ΠΈΡΠΎΠΌ Google Colab. Π’Π°ΠΊΠΆΠ΅ Π±ΡΠ»Π° ΡΠΏΡΠΎΠ΅ΠΊΡΠΈΡΠΎΠ²Π°Π½Π° Π±Π°Π·Π° Π΄Π°Π½Π½ΡΡ
Π΄Π»Ρ Ρ
ΡΠ°Π½Π΅Π½ΠΈΡ ΠΈΡΡ
ΠΎΠ΄Π½ΡΡ
ΠΈ Π²Π΅ΡΠΈΡΠΈΡΠΈΡΠΎΠ²Π°Π½Π½ΡΡ
ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠΉ Ρ ΠΏΡΠΎΠ±Π»Π΅ΠΌΠ½ΡΠΌΠΈ ΠΎΠ±Π»Π°ΡΡΡΠΌΠΈ
Automatic Mexico Gulf Oil Spill Detection from Radarsat-2 SAR Satellite Data Using Genetic Algorithm
Entropy Based Fuzzy Support Vector Machine (EFSVM) untuk Klasifikasi Microarray Imbalanced Data
DNA microarray merupakan data yang mengandung ekspresi gen dengan ukuran sampel kecil, namun memiliki jumlah feature yang sangat besar. Selain itu masalah kelas imbalanced merupakan masalah umum dalam data microarray. Oleh karena itu diperlukan metode klasifikasi yang mampu mengatasi pemasalahan high dimensional dan juga permasalahan imbalanced. SVM merupakan salah satu metode klasifikasi yang mampu menangani sampel besar atau kecil, non-linear, high dimensional, over learning dan masalah lokal minimum. Metode SVM juga telah banyak diterapkan untuk klasifikasi data DNA microarray dan didapatkan hasil bahwa SVM memberikan kinerja terbaik di antara metode machine learning lainnya. Namun pengaruh dari imbalanced data pada SVM akan menjadi kekurangan dikarenakan SVM memperlakukan semua sampel dengan kepentingan yang sama sehingga mengakibatkan bias terhadap kelas minoritas. Salah satu metode yang mampu mengatasi imbalanced data adalah EFSVM. EFSVM mampu menghasilkan nilai AUC yang tertinggi apabila dibandingkan dengan SVM dan FSVM. Mengingat data DNA microarray merupakan high dimensional data dengan jumlah feature yang sangat besar, maka perlu dilakukan feature selection terlebih dahulu. Pada penelitian dilakukan klasifikasi terhadap data DNA microarray dengan kasus data yang imbalanced menggunakan EFSVM dengan terlebih dahulu dilakukan seleksi fitur menggunakan FCBF. Hasil performansi klasifikasi menunjukkan bahwa feature selection mampu meningkatkan performansi klasifikasi. Adanya penambahan entropy based fuzzy membership terbukti mampu menghasilkan performansi paling tinggi dibandingkan dengan SVM dan FSVM, namun untuk data yang telah dilakukan feature selection, antara FSVM dan EFSVM diperoleh hasil yang hampir sama.
============================================================================DNA microarrays are data containing gene expression with small sample sizes and high number of features. Furthermore, imbalanced classes is a common problem in microarray data. This occurs when a dataset is dominated by a major class which have significantly more instances than the other minority classes in the data. Therefore, it is needed a classification method that can solve the problem of high dimensional and imbalanced data. SVM is one of the classification methods that is capable of handling large or small samples, nonlinear, high dimensional, over learning and local minimum issues. SVM has been widely applied to DNA microarray data classification and it has been shown that SVM provides the best performance among other machine learning methods. However, imbalanced data will be a problem because SVM treats all samples in the same importance thus the results is bias for minority class. To overcome the imbalanced data, EFSVM is proposed. This method apply a fuzzy membership to each input point and reformulate the SVM such that different input points provide different constributions to the classifier. The samples with higher class certainty, that measured by entropy, are assigned to larger fuzzy membership. The importance of the minority classes have large fuzzy membership and EFSVM can pay more attention to the samples with larger fuzzy membership. Given DNA microarray data is high dimensional data with a very large number of features, it is necessary to do feature selection first using FCBF. Based on the overall results, EFSVM has the highest AUC value compared to SVM and FSVM