96 research outputs found
A Solver + Gradient Descent Training Algorithm for Deep Neural Networks
We present a novel hybrid algorithm for training Deep Neural Networks that
combines the state-of-the-art Gradient Descent (GD) method with a Mixed Integer
Linear Programming (MILP) solver, outperforming GD and variants in terms of
accuracy, as well as resource and data efficiency for both regression and
classification tasks. Our GD+Solver hybrid algorithm, called GDSolver, works as
follows: given a DNN as input, GDSolver invokes GD to partially train
until it gets stuck in a local minima, at which point GDSolver invokes an MILP
solver to exhaustively search a region of the loss landscape around the weight
assignments of 's final layer parameters with the goal of tunnelling through
and escaping the local minima. The process is repeated until desired accuracy
is achieved. In our experiments, we find that GDSolver not only scales well to
additional data and very large model sizes, but also outperforms all other
competing methods in terms of rates of convergence and data efficiency. For
regression tasks, GDSolver produced models that, on average, had 31.5% lower
MSE in 48% less time, and for classification tasks on MNIST and CIFAR10,
GDSolver was able to achieve the highest accuracy over all competing methods,
using only 50% of the training data that GD baselines required
Formal Verification of Industrial Software and Neural Networks
Software ist ein wichtiger Bestandteil unsere heutige Gesellschaft. Da Software vermehrt
in sicherheitskritischen Bereichen angewandt wird, müssen wir uns auf eine korrekte und
sichere Ausführung verlassen können. Besonders eingebettete Software, zum Beispiel in
medizinischen Geräten, Autos oder Flugzeugen, muss gründlich und formal geprüft werden.
Die Software solcher eingebetteten Systeme kann man in zwei Komponenten aufgeteilt.
In klassische (deterministische) Steuerungssoftware und maschinelle Lernverfahren
zum Beispiel für die Bilderkennung oder Kollisionsvermeidung angewandt werden.
Das Ziel dieser Dissertation ist es den Stand der Technik bei der Verifikation von
zwei Hauptkomponenten moderner eingebetteter Systeme zu verbessern: in C/C++
geschriebene Software und neuronalen Netze. Für beide Komponenten wird das Verifikationsproblem
formal definiert und neue Verifikationsansätze werden vorgestellt
- …