Search CORE

46 research outputs found

Solving the scalarization issues of Advantage-based Reinforcement Learning algorithms

Author: Cimino M. G. C. A.
Galatolo F. A.
Vaglini G.
Publication venue: 'Elsevier BV'
Publication date: 01/01/2021
Field of study

In this research, some of the issues that arise from the scalarization of the multi-objective optimization problem in the Advantage Actor–Critic (A2C) reinforcement learning algorithm are investigated. The paper shows how a naive scalarization can lead to gradients overlapping. Furthermore, the possibility that the entropy regularization term can be a source of uncontrolled noise is discussed. With respect to the above issues, a technique to avoid gradient overlapping is proposed, while keeping the same loss formulation. Moreover, a method to avoid the uncontrolled noise, by sampling the actions from distributions with a desired minimum entropy, is investigated. Pilot experiments have been carried out to show how the proposed method speeds up the training. The proposed approach can be applied to any Advantage-based Reinforcement Learning algorithm

Archivio della Ricerca - Università di Pisa

Formal Derivation of Mesh Neural Networks with Their Forward-Only Gradient Propagation

Author: Cimino M. G. C. A.
Galatolo F. A.
Vaglini G.
Publication venue: 'Springer Science and Business Media LLC'
Publication date: 01/01/2021
Field of study

This paper proposes the Mesh Neural Network (MNN), a novel architecture which allows neurons to be connected in any topology, to efficiently route information. In MNNs, information is propagated between neurons throughout a state transition function. State and error gradients are then directly computed from state updates without backward computation. The MNN architecture and the error propagation schema is formalized and derived in tensor algebra. The proposed computational model can fully supply a gradient descent process, and is potentially suitable for very large scale sparse NNs, due to its expressivity and training efficiency, with respect to NNs based on back-propagation and computational graphs

Archivio della Ricerca - Università di Pisa

Integrative organelle-based functional proteomics: in silico prediction of impaired functional annotations in SACS KO cell model

Author: Doccini S.
Galatolo D.
Gemignani F.
Lalowski M. M.
Morani F.
Pezzini F.
Santorelli F. M.
Simonati A.
Soliymani R.
Publication venue: 'MDPI AG'
Publication date: 01/01/2022
Field of study

Autosomal recessive spastic ataxia of Charlevoix-Saguenay (ARSACS) is an inherited neurodegenerative disease characterized by early-onset spasticity in the lower limbs, axonal-demyelinating sensorimotor peripheral neuropathy, and cerebellar ataxia. Our understanding of ARSACS (genetic basis, protein function, and disease mechanisms) remains partial. The integrative use of organelle-based quantitative proteomics and whole-genome analysis proposed in the present study allowed identifying the affected disease-specific pathways, upstream regulators, and biological functions related to ARSACS, which exemplify a rationale for the development of improved early diagnostic strategies and alternative treatment options in this rare condition that currently lacks a cure. Our integrated results strengthen the evidence for disease-specific defects related to bioenergetics and protein quality control systems and reinforce the role of dysregulated cytoskeletal organization in the pathogenesis of ARSACS

Catalogo dei prodotti della ricerca

Khinchin theorem for integral points on quadratic varieties

Author: A. Eskin
A. Gorodnik
Alexander Gorodnik
C. Druţu
D. Dolgopyat
D. Kleinbock
D. Sullivan
F. Maucourant
G. Harman
N. Chernov
Nimish A. Shah
R.E. Howe
S. Galatolo
S. Hersonsky
V. Sprindžuk
W. Duke
Publication venue: 'Springer Science and Business Media LLC'
Publication date: 01/04/2008
Field of study

We prove an analogue the Khinchin theorem for the Diophantine approximation by integer vectors lying on a quadratic variety. The proof is based on the study of a dynamical system on a homogeneous space of the orthogonal group. We show that in this system, generic trajectories visit a family of shrinking subsets infinitely often.Comment: 19 page

arXiv.org e-Print Archive

CiteSeerX

Crossref

Explore Bristol Research

Infinite ergodic theory and Non-extensive entropies

Author: A Fathi
A Kocsard
B Fayad
B Fayad
C Bonanno
C Tresser
C Tsallis
C Tsallis
D Anosov
E Mayoral
E. R. Pujals
F Baldovin
F Baldovin
F Hofbauer
F Ledrappier
F Ledrappier
G Boole
H Bruin
J Aaronson
J Aaronson
J Aaronson
J Aaronson
J Al-Khal
J Milnor
Luis M. Gaggero-Sager
M Campanino
M Henon
M Henon
M Lenci
N Korabel
O. Sotolongo-Costa
P Walters
R Adler
R Devaney
S Galatolo
U Krengel
UMS Costa
WH Gottschalk
Y Pomeau
Publication venue: 'Springer Science and Business Media LLC'
Publication date: 29/05/2010
Field of study

We bring into account a series of result in the infinite ergodic theory that we believe that they are relevant to the theory of non-extensive entropie

arXiv.org e-Print Archive

Crossref

Rigorous Approximation of Diffusion Coefficients for Expanding Maps

Author: A Boyarsky
A Lasota
C Bose
C Liverani
C Liverani
C Liverani
C Liverani
D Dolgopyat
F Hofbauer
G Froyland
G Froyland
G Keller
G Keller
G Pianigiani
I Melbourne
Isaia Nisoli
L-S Young
M Dellnitz
M Holland
N Santitissadeekorn
O Jenkinson
OE Lanford III
R Murray
R Murray
S Galatolo
S Galatolo
S Gouëzel
SM Ulam
Stefano Galatolo
V Baladi
W Bahsoun
W Bahsoun
W Bahsoun
W Tucker
Wael Bahsoun
Xiaolong Niu
Y Pomeau
Publication venue: 'Springer Science and Business Media LLC'
Publication date
Field of study

Crossref

Vortex dynamics in evolutive flows: A weakly chaotic phenomenon

Author: A. A. Brudno
A. N. Kolmogorov
C. Bonanno
F. Argenti
G. Aquino
G. Buresti
G. M. Zaslavsky
Giulia Menconi
Guido Buresti
Jacopo Bellazzini
L. Bonci
L. Fronzoni
M. Buiatti
M. F. Shlesinger
M. F. Shlesinger
M. Ignaccolo
M. Shlesinger
M. T. Rosenstein
Massimiliano Ignaccolo
N. Scafetta
P. Allegrini
P. Bak
P. Gaspard
P. Grigolini
P. Grigolini
P. Manneville
Paolo Grigolini
S. Galatolo
S. Galatolo
S. Mega
S. Montangero
T. Geisel
T. H. Solomon
Ya. G. Sinai
Publication venue: 'American Physical Society (APS)'
Publication date
Field of study

Crossref

Sviluppo di una sonda multi-pressione e di algoritmi di elaborazione per la ricostruzione dei parametri di volo

Author: CALIA A.
GALATOLO R
POGGI V.
SCHETTINI F.
Publication venue
Publication date: 01/01/2007
Field of study

La determinazione dei parametri di volo, quali velocità, pressione statica, angoli di incidenza e derapata a partire da misure locali di pressione e di angoli, riveste un ruolo di vitale importanza per la riuscita della missione di un velivolo. L’accuratezza nella ricostruzione di tali parametri è infatti fondamentale per il corretto funzionamento delle leggi controllo e quindi per la sicurezza del volo. Sulla base dell’esperienze maturate dal Dipartimento di Ingegneria Aerospaziale (DIA) per l’integrazione dei dati aria nel Flight Control System Fly-by-Wire (FCS-FBW) del velivolo Aermacchi M346, sono state intraprese delle attività volte allo sviluppo di una nuova sonda per la misura delle pressioni locali. L’idea di base si ispira ai sistemi di tipo Flush Air Data Sensor System (FADSs) che consistono in un insieme di prese di pressione realizzate generalmente sulla parte prodiera della fusoliera, le cui misure sono elaborate da opportuni algoritmi che permettono di ricostruire i parametri di volo. Il numero elevato di prese di pressione che caratterizzano un sistema FADSs consente il suo funzionamento anche in caso di perdita di una o più misure a causa di avarie. Questo aspetto rende le FADSs particolarmente adatte ai sistemi di controllo del volo FCS-FBW caratterizzati da architetture a molteplice ridondanza. Prendendo a riferimento tali sistemi dati aria, è stata studiata una sonda di forma emisferica su un supporto cilindrico

Archivio della Ricerca - Università di Pisa

Ricostruzione dei coefficienti di pressione Cpfront e Cpslot2 in condizioni stazionarie dalle curve di calibrazione in galleria del vento transonica (estensione degli inviluppi)

Author: CALIA A.
CERVIA F.
DENTI E.
GALATOLO R
SCHETTINI F.
Publication venue
Publication date: 01/01/2004
Field of study

Nel presente Report viene fatta una valutazione, in termini di Coefficienti di pressione, dei legami tra le pressioni locali misurate dalle sonde multi-funzione per la rilevazione dei Dati Aria, che verranno installate sul velivolo M346, e le grandezze asintotiche che caratterizzano il flusso a monte del velivolo stesso, (angolo di incidenza, di derapata e numero di Mach). A tale scopo, si utilizzano sia i dati provenienti dalla campagna di prove effettuata in galleria del vento transonica presso NLR su un modello in scala del velivolo e riportati nel MEMO ITV/ARAT/103/02 /1/, sia i dati relativi al funzionamento delle sonde isolate. Successivamente viene sviluppata una procedura per l’ampliamento del database aerodinamico per tener conto di angoli di incidenza e derapata non presenti nelle acquisizioni di prova. Infine sui Coefficienti di pressione determinati per punti, viene effettuata un’approssimazione polinomiale con la tecnica dei minimi quadrati. Tali funzioni, consentono di stimare (procedura di elaborazione dei Dati aria) le grandezze asintotiche che caratterizzano il flusso a monte del velivolo in funzione delle grandezze misurate

Archivio della Ricerca - Università di Pisa

Using stigmergy as a computational memory in the design of recurrent neural networks

Author: Cimino M. G. C. A.
Galatolo F. A.
Vaglini G.
Publication venue: 'Scitepress'
Publication date: 01/01/2019
Field of study

In this paper, a novel architecture of Recurrent Neural Network (RNN) is designed and experimented. The proposed RNN adopts a computational memory based on the concept of stigmergy. The basic principle of a Stigmergic Memory (SM) is that the activity of deposit/removal of a quantity in the SM stimulates the next activities of deposit/removal. Accordingly, subsequent SM activities tend to reinforce/weaken each other, generating a coherent coordination between the SM activities and the input temporal stimulus. We show that, in a problem of supervised classification, the SM encodes the temporal input in an emergent representational model, by coordinating the deposit, removal and classification activities. This study lays down a basic framework for the derivation of a SM-RNN. A formal ontology of SM is discussed, and the SM-RNN architecture is detailed. To appreciate the computational power of an SM-RNN, comparative NNs have been selected and trained to solve the MNIST handwritten digits recognition benchmark in its two variants: spatial (sequences of bitmap rows) and temporal (sequences of pen strokes)

arXiv.org e-Print Archive

Archivio della Ricerca - Università di Pisa