2 research outputs found

    Κατανομή πόρων και εκτίμηση της οπτικής ποιότητας σε ασύρματη μετάδοση βίντεο

    No full text
    Providing the desired Quality of Service (QoS) as well as the maximum Quality of Experience(QoE) or improving the efficiency of H.264/AVC video transmissions over wirelessnetworks presents several challenges due to the characteristics of wireless networks,such as limited bandwidth, time-varying channel conditions, heterogeneous users, etc.In such networks, data are transmitted via the wireless radiomedium, which is a sharedmedium over which many users compete for resources. Due to the existence of manyusers, it is important to allocate resources in a fair manner among them. Resourceallocation is applied under various network infrastructures such as cellular networks,relay channels, ultrawideband networks etc.In the present thesis, we restrict our attention to the problem of resource allocationover wireless Visual Sensor Networks (VSNs), which consist of spatially distributedvideo cameras that are capable of compressing and transmitting the video sequencesthey acquire. Our goal is to ameliorate the video quality that reaches the end-userthrough efficient resource management. Specifically, we consider a Direct-SequenceCode Division Multiple Access (DS-CDMA) VSN, which employs a cross-layer design,where each node has its individual requirements in compression bitrate and energyconsumption, depending on the characteristics of the monitored scenes.The constraint that holds for each node of the network is that it has an availablebitrate that can be shared between source and channel coding and an available powerthat can be used for video sensing, processing, and transmission. Hence, the source coding rates, channel coding rates and power levels are the parameters that shouldbe optimally determined for each node, in an effort to tradeoff the video quality ofthe received videos and system’s efficacy. The source and channel coding rates cantake discrete values, while for the power levels we assume both the cases of takingcontinuous and discrete values.In order to optimally and jointly allocate system resources to all nodes, we consider four optimization criteria. Two of them aim at video distortion minimization, while therest seek for a distribution rule that offers fair utility allocations. The first one, calledthe Minimized Average Distortion (MAD), minimizes the overall average video distortionof the network, neglecting fairness among the nodes. The second criterion, called theMinimized Maximum Distortion (MMD), minimizes the maximum distortion among allnodes of the network, promoting a rather unbiased treatment of the nodes. Since thesimultaneous maximization of the video qualities of all nodes is not possible, we alsoapply cooperative game theory. Specifically, we use the Nash Bargaining Solution (NBS)in order to pinpoint one of the infinite Pareto-optimal solutions, based on the stipulationthat the solution should satisfy four fairness axioms. An additional solution extractedfrom the area of game theory that we utilize to the same problem of resource allocationis the Kalai-Smorodinsky Bargaining Solution (KSBS), which has also to comply withfour fairness axioms, and is applied to non-convex utility spaces. For comparisonpurposes, we also employ a criterion that Maximizes the Total system Utility (MTU)achieved by all nodes of the network.Special attention is also given to the solution methodology followed by all exploredoptimization criteria. For the case where the power levels assume continuous values,we propose the use of the Particle Swarm Optimization (PSO) algorithm, which is a computationalintelligence algorithm that draws inspiration from social dynamics. Also, weintroduce a hybrid algorithm, denoted as Hybrid Particle Swarm Optimization ActiveSet (HPSOAS), which combines PSO with Active Set (AS) and aims at exploiting thebenefits of the two aforementioned methods, thereby increasing efficiency. For comparisonreasons, the performance of the Interior Point (IP) and Trust Region Reflective(TRR) methods is also evaluated to the same optimization problem, when all of the optimizationcriteria are used, except for the KSBS. The KSBS is found directly from thegraphical representations of the utility sets, by following a geometric approach. In aneffort to evaluate the results offered by each optimization criterion, we invoke four differentfairness metrics: the first one considers both fairness and performance issues,and the second one measures the ‘‘equality’’ of a resource allocation (equal utilitiesfor the nodes). The third metric computes the total system utility, while the last onecomputes the total power consumption of the nodes.Another piece of the current study is focused on the joint problem of Group Of Pictures(GOP) length determination during the encoding process along with the allocationof the nodes’ transmission parameters, where the objective function is indicated by theMAD, NBS and MTU optimization criteria. In this case, we have to tackle a purelydiscrete optimization problem as it results from the discrete source and channel codingrates and the discrete power levels for each node of the network. In this vein, we usethe SARSA algorithm from the area of reinforcement learning.Since in video transmissions over lossy networks quality degradation is inevitable,a common practice is to ensure higher reliability of the crucial pieces of informationthrough the application of Unequal Error Protection (UEP). Such a scenario is also considered in our research, where based on the Cumulative Mean Squared Error (CMSE)we are able to prioritize the slices of the video sequences. In order to estimate theCMSE, we propose the use of the Least Absolute Shrinkage and Selection Operator(LASSO) regression method. A number of quality-relevant features are extracted fromthe H.264/AVC video sequences and are given as input to LASSO. Based on the estimatedCMSE values, we group the video slices into four priority classes, we assign adifferent channel coding rate to each of them, and simulate a video transmission scenarioover a noisy environment so as to investigate the performance of our proposedapproach.In the last part of this thesis, we deal with the problem of perceptual video qualityassessment. Particularly, we propose Reduced-Reference (RR) and No-Reference(NR) models so as estimate the quality of H.264/AVC video sequences, in terms of theMean Opinion Score (MOS). A variety of perceptually-motivated features are examinedto account for the impact of coding artifacts, packet losses, and video content characteristics.These features are employed for estimating video quality using the LASSOregression technique, which utilizes a subset of the input features, by selecting onlythose that have relatively higher impact on the process of video quality estimation.For comparison purposes, the Ordinary Least Squares (OLS) and the Ridge regressionmethod combined with sequential Forward Feature Selection (FFS) are also applied. In addition, performance measures as recommended by Video Quality Experts Group(VQEG) are used in order to gauge the effectiveness of our proposed models.In order to estimate subjective video quality, we usually deal with a large numberof features and a small sample set. Applying regression on complex datasets may leadto imprecise solutions due to possibly irrelevant or noisy features as well as the effectof overfitting. For this purpose, our research is extended to include a robust NR modelthat has a good generalization capability to unseen data, for videos that are impairedby both compression artifacts and packet losses. This model is able to improve theper-sequence MOS estimation accuracy, by following a frame-level MOS estimationapproach, where the MOS estimate of a sequence is obtained by averaging the perframeMOS estimates, instead of performing regression directly at the sequence level.Since it is impractical to obtain the per-frame MOS ground truth through subjectiveexperiments, we propose an objective metric able to do this task, which provides areliable indicator for the quality of each frame of a video, offering an intuition about itsindividual contribution to the overall video quality score.Η παροχή της επιθυμητής ποιότητας των υπηρεσιών και της καλύτερης δυνατής ποιότηταςτης εμπειρίας του χρήστη ή ακόμη η ϐελτίωση της αποδοτικότητας των μεταδόσεων σεασύρματα δίκτυα, ϐιντεοακολουθιών που έχουν κωδικοποιηθεί με το πρότυπο H.264/AVC,παρουσιάζουν αρκετές προκλήσεις εξαιτίας των χαρακτηριστικών αυτών των δικτύων, όπωςγια παράδειγμα το περιορισμένο εύρος Ϲώνης, οι χρονικά μεταβαλλόμενες συνθήκες τουκαναλιού, οι ετερογενείς χρήστες κτλ. Σε τέτοια δίκτυα, τα δεδομένα μεταφέρονται μέσωενός ασύρματου, κοινόχρηστου μέσου, στο οποίο έχουν πρόσβαση πολλοί χρήστες. Οιχρήστες αυτοί προσπαθούν να επωφεληθούν όσο το δυνατόν περισσότερο από τους διαθέσι-μους πόρους του δικτύου και επομένως είναι απαραίτητο να κατανείμουμε δίκαια τουςπόρους ανάμεσά τους. Η κατανομή πόρων είναι ένα πρόβλημα που συναντάται σε διάφορεςυποδομές δικτύων όπως κυψελωτά δίκτυα, κανάλια με ενδιάμεσους, ϐοηθητικούς κόμβους,δίκτυα υπερευρείας Ϲώνης κ.α.Στην παρούσα διατριβή, εστιάζουμε στο πρόβλημα της κατανομής πόρων σε ασύρματαδίκτυα οπτικών αισθητήρων, τα οποία απαρτίζονται από κάμερες που ϐρίσκονται τοπο-ϑετημένες σε διάφορα σημεία και οι οποίες συμπιέζουν και μεταδίδουν τα ϐίντεο πουκαταγράφουν. Ο στόχος μας είναι να ϐελτιώσουμε την ποιότητα του ϐίντεο που ϐλέπειο χρήστης, μέσω αποδοτικής διαχείρισης των πόρων του συστήματος. Συγκεκριμένα,ϑεωρούμε ένα δίκτυο οπτικών αισθητήρων πολλαπλής πρόσβασης με διαίρεση κωδίκων καιχρήση άμεσης ακολουθίας, το οποίο χρησιμοποιεί ένα διαστρωματικό σχεδιασμό, όπου ο κάθε κόμβος του δικτύου έχει τις δικές του απαιτήσεις σε ϱυθμό bit για τη συμπίεση καισε ενέργεια (ισχύ), ανάλογα με τα χαρακτηριστικά των σκηνών που καταγράφει.Ο ϱυθμός bit σε κάθε κόμβο του δικτύου ϑα πρέπει να μοιραστεί για την κωδικοποίησητης πηγής και του καναλιού, ενώ η διαθέσιμη ισχύς ϑα χρησιμοποιηθεί για την κατα-γραφή, επεξεργασία και μετάδοση των ϐιντεοακολουθιών. Επομένως, ο ϱυθμός κωδικοποί-ησης της πηγής, ο ϱυθμός κωδικοποίησης του καναλιού και η ισχύς αποτελούν τιςπαραμέτρους οι οποίες ϑα πρέπει να εκτιμηθούν ϐέλτιστα για κάθε κόμβο του δικτύου, έτσιώστε να πετύχουμε το καλύτερο δυνατό ισοζύγιο μεταξύ της ποιότητας των λαμβανόμενων ϐιντεοακολουθιών και της απόδοσης του συστήματος. Οι ϱυθμοί κωδικοποίησης πηγήςκαι καναλιού παίρνουν διακριτές τιμές, ενώ για τις ισχύς ϑεωρούμε δύο περιπτώσεις, ότιδηλαδή μπορούνε να πάρουνε και συνεχείς και διακριτές τιμές.Προκειμένου να κατανείμουμε ϐέλτιστα και από κοινού τους πόρους του συστήματοςσε όλους τους κόμβους, ϑεωρούμε τέσσερα κριτήρια ϐελτιστοποίησης. Τα δύο από αυτάαποσκοπούν στην ελαχιστοποίηση της παραμόρφωσης του ϐίντεο, ενώ τα υπόλοιπα δύοαναζητούν έναν κανόνα που προσφέρει δίκαιες κατανομές πόρων για κάθε κόμβο. Πιο συγ-κεκριμένα, το πρώτο κριτήριο ελαχιστοποιεί τη μέση συνολική παραμόρφωση του δικτύου(MAD), αγνοώντας ϑέματα δικαιοσύνης ανάμεσα στους κόμβους. Το δεύτερο κριτήριοελαχιστοποιεί τη μέγιστη παραμόρφωση ανάμεσα σε όλους τους κόμβους του δικτύου(MMD) και μεταχειρίζεται αμερόληπτα τους κόμβους. Επιπλέον, καθώς η ταυτόχρονημεγιστοποίηση της ποιότητας των ϐίντεο όλων των κόμβων δεν είναι δυνατή, εφαρμόζουμεσυνεργατική ϑεωρία διαπραγμάτευσης, χρησιμοποιώντας τη λύση διαπραγμάτευσης τουNash (NBS) προκειμένου να επιλέξουμε μία από τις άπειρες ϐέλτιστες κατά Pareto λύσεις,με την προϋπόθεση ότι ϑα πρέπει να ικανοποιούνται τέσσερα αξιώματα δικαιοσύνης.Ακόμη, στο ίδιο πρόβλημα χρησιμοποιούμε άλλη μία λύση από τη ϑεωρία παιγνίων, τηλύση διαπραγμάτευσης των Kalai-Smorodinsky (KSBS), η οποία ϑα πρέπει επίσης ναικανοποιεί τέσσερα αξιώματα δικαιοσύνης, και η οποία στην περίπτωσή μας εφαρμόζεταισε μη-κυρτούς χώρους ωφέλειας. Για λόγους σύγκρισης, χρησιμοποιούμε ακόμη ένα κριτήριο που μεγιστοποιεί τη συνολική ωφέλεια του συστήματος (MTU) που επιτυγχάνεταιαπό όλους τους κόμβους του δικτύου.Ιδιαίτερη προσοχή δίνουμε επίσης στη μεθοδολογία που ακολουθείται για την εξεύρεσηλύσης, χρησιμοποιώντας κάθε ένα από τα προαναφερθέντα κριτήρια. Στην περίπτωση πουοι ισχύς παίρνουν συνεχείς τιμές, προτείνουμε τη χρήση του αλγορίθμου ϐελτιστοποίησηςσμήνους σωματιδίων (PSO), ο οποίος είναι ένας αλγόριθμος υπολογιστικής νοημοσύνηςεμπνευσμένος από τη ϕύση. Επίσης, εισάγουμε έναν υβριδικό αλγόριθμο, τον υβριδικόαλγόριθμο ϐελτιστοποίησης σμήνους σωματιδίων ενεργού συνόλου (HPSOAS), ο οποίοςσυνδυάζει τον αλγόριθμο PSO με τον αλγόριθμο ενεργού συνόλου (AS). Ο αλγόριθμοςHPSOAS εκμεταλλεύεται τα πλεονεκτήματα και των δύο προαναφερθέντων αλγορίθμωνκι επομένως πετυχαίνει καλύτερη απόδοση. Για λόγους σύγκρισης, αξιολογούμε τηναπόδοση των μεθόδων interior point (IP) και trust region reflective (TRR) στο ίδιο πρόβλημαϐελτιστοποίησης, χρησιμοποιώντας καθένα από τα κριτήρια ϐελτιστοποίησης, εκτός απότο KSBS, το οποίο υπολογίζεται απευθείας από τις γραφικές αναπαραστάσεις των συνόλωνωφέλειας, ακολουθώντας μία γεωμετρική προσέγγιση. Σε μια προσπάθεια να αξιολογήσουμετα αποτελέσματα που προκύπτουν χρησιμοποιώντας κάθε κριτήριο ϐελτιστοποίησης, χρησι-μοποιούμε τέσσερις διαφορετικές μετρικές δικαιοσύνης. Η πρώτη από αυτές συνυπολογίζειϑέματα δικαιοσύνης και απόδοσης, ενώ η δεύτερη μετράει την ‘ισότητα’ της κατανομής τωνπόρων (ίσες ωφέλειες για τους κόμβους). Η τρίτη μετρική υπολογίζει τη συνολική ωφέλεια του συστήματος και η τέταρτη τη συνολική κατανάλωση ενέργειας από τους κόμβους.΄Ενα άλλο κομμάτι της τρέχουσας μελέτης εστιάζει στο πρόβλημα του καθορισμού τουϐέλτιστου μήκους της ομάδας των εικόνων (GOP) σε συνδυασμό με το πρόβλημα της κατανομής των πόρων στους κόμβους του δικτύου. Στην περίπτωση αυτή, η συνάρτησηϐελτιστοποίησης υποδεικνύεται από τα κριτήρια MAD, NBS και MTU, όπου έχουμε ναεπιλύσουμε ένα διακριτό πρόβλημα που προκύπτει από τις διακριτές τιμές των ϱυθμώνκωδικοποίησης πηγής και καναλιού καθώς επίσης και τις διακριτές τιμές των ισχύων.Για την επίλυση αυτού του προβλήματος χρησιμοποιούμε τον αλγόριθμο SARSA από τηνπεριοχή της ενισχυτικής μάθησης.Καθώς κατά τις μεταδόσεις ϐίντεο σε απωλεστικά δίκτυα η υποβάθμιση της ποιότηταςείναι αναπόφευκτη, μία κοινή πρακτική είναι να εξασφαλίζουμε υψηλότερη αξιοπιστίαστα σημαντικά κομμάτια πληροφορίας εφαρμόζοντας άνιση προστασία από λάθη (UEP).Στην παρούσα διατριβή ϑεωρούμε ένα τέτοιο σενάριο, όπου με ϐάση το αθροιστικό μέσοτετραγωνικό σφάλμα (CMSE) δίνουμε προτεραιότητα στα επιμέρους κομμάτια των ϐιν-τεοακολουθιών. Προκειμένου να εκτιμήσουμε το CMSE, προτείνουμε τη χρήση της leastabsolute shrinkage and selection operator (LASSO) μεθόδου παλινδρόμησης. Πιο συγ-κεκριμένα, εξάγουμε ορισμένα χαρακτηριστικά από τις ϐιντεοακολουθίες που έχουν κωδικο-ποιηθεί με το πρότυπο H.264/AVC και τα οποία σχετίζονται με την ποιότητα του ϐίντεο.Στη συνέχεια, τα χαρακτηριστικά αυτά τροφοδοτούν το LASSO προκειμένου να εκτιμήσουμετο CMSE, όπως αυτό προκύπτει από κάθε πιθανή απώλεια ενός τμήματος της ϐιντεοακολου-ϑίας. Με ϐάση τις εκτιμώμενες τιμές για το CMSE, ομαδοποιούμε τα επιμέρους κομμάτιατου ϐίντεο σε τέσσερις ομάδες προτεραιότητας και αναλόγως, αναθέτουμε διαφορετικούςϱυθμούς κωδικοποίησης του καναλιού σε κάθε μία από αυτές. Τέλος, προσομοιώνουμε ένα σενάριο μετάδοσης ϐιντεοακολουθιών σε ένα ενθόρυβο περιβάλλον προκειμένου ναμελετήσουμε την αποτελεσματικότητα της προτεινόμενης προσέγγισης.Στο τελευταίο τμήμα της διατριβής ασχολούμαστε με το πρόβλημα της εκτίμησης τηςποιότητας του ϐίντεο όπως την αντιλαμβάνεται ο χρήστης. Συγκεκριμένα, προτείνουμεμοντέλα που έχουν μειωμένη ή και καθόλου πρόσβαση στην αρχική ϐιντεοακολουθίαπροκειμένου να εκτιμήσουμε την ποιότητα των ϐιντεοακολουθιών που ϕτάνουν στο χρήστη,μέσω τουmean opinion score (MOS).Μελετάμε μία μεγάλη ποικιλία χαρακτηριστικών πουσχετίζονται με την ποιότητα του ϐίντεο όπως την αντιλαμβάνεται ο χρήστης και τα οποίααντικατοπτρίζουν τις παραμορφώσεις λόγω της συμπίεσης και των απωλειών πακέτωνκαθώς επίσης και τις ιδιαιτερότητες του ϐίντεο. Κατόπιν, τα χαρακτηριστικά αυτά χρησι-μοποιούνται από το LASSO για να εκτιμήσουμε την ποιότητα του ϐίντεο. Το LASSO έχειτην ικανότητα να χρησιμοποιεί ένα υποσύνολο από τα αρχικά χαρακτηριστικά, και συγ-κεκριμένα εκείνα τα οποία έχουν συγκριτικά μεγαλύτερο αντίκτυπο στη διαδικασία τηςεκτίμησης της ποιότητας των ϐιντεοακολουθιών. Για λόγους σύγκρισης, εφαρμόζουμε τιςμεθόδους παλινδρόμησης των ελαχίστων τετραγώνων (OLS) και τη Ridge σε συνδυασμό μεμία τεχνική ακολουθιακής εμπρόσθιας επιλογής χαρακτηριστικών (FFS). Ακόμη, για ναμετρήσουμε την αποδοτικότητα των μοντέλων που προτείνουμε χρησιμοποιούμε κάποιεςμετρικές απόδοσης, όπως προτάθηκαν από το video quality experts group (VQEG).Συχνά, σε προβλήματα εκτίμησης της υποκειμενικής ποιότητας του ϐίντεο ερχόμαστε αντιμέτωποι με ένα μεγάλο αριθμό χαρακτηριστικών και με ένα μικρό μέγεθος παρατηρήσε-ων. Εάν εφαρμόσουμε παλινδρόμηση σε σύνθετα σύνολα δεδομένων ενδέχεται να οδηγηθούμε σε μη ακριβείς λύσεις εξαιτίας της ύπαρξης κάποιων άσχετων χαρακτηριστικών ήχαρακτηριστικών που αποτελούν ουσιαστικά ϑόρυβο για το πρόβλημά μας ή ακόμη εξ-αιτίας του προβλήματος της υπερπροσαρμογής. Γι΄ αυτό το λόγο επεκτείνουμε την έρε-υνα μας και εισάγουμε ένα εύρωστο μοντέλο χωρίς αναφορά, το οποίο παρουσιάζει καλήγενικευτική ικανότητα σε άγνωστα δεδομένα, για ϐιντεοακολουθίες που πλήττονται απόπαραμορφώσεις εξαιτίας της συμπίεσης και των απωλειών πακέτων. Το μοντέλο πουπροτείνουμε ϐελτιώνει την ακρίβεια εκτίμησης του MOS ολόκληρης της ακολουθίας, κάνο-ντας εκτιμήσεις για το MOS κάθε καρέ. Αξίζει να σημειωθεί ότι το MOS ολόκληρης τηςακολουθίας προκύπτει ως ο μέσος όρος των εκτιμήσεων των MOS όλων των καρέ, κι όχιεφαρμόζοντας παλινδρόμηση απευθείας σε επίπεδο ακολουθίας. Καθώς δεν είναι πρακ-τικό να λάβουμε το πραγματικό MOS όλων των καρέ κάνοντας πειράματα με χρήστες, αντ΄αυτού προτείνουμε μία αντικειμενική μετρική η οποία παρέχει μια αξιόπιστη ένδειξη γιατην ποιότητα κάθε καρέ του ϐίντεο δίνοντας συγχρόνως μια εικόνα για τη συνεισφορά τουστο συνολικό σκορ της ποιότητας του ϐίντεο
    corecore