3 research outputs found

    Asymptotic enumeration, cluster statistics, and limit laws for combinatorial structures

    Get PDF
    For a given combinatorial class C we study two types of combinatorial structures: the class G = Mset(C) satisfying the multiset construction, that is, every object in G is uniquely specified by a set of distinct C-objects each paired with a multiplicity from N indicating the number of occurrences of that object in the multiset (e.g. unlabelled forests are multisets of unlabelled trees). And, secondly, the class S = Set(C) containing sets of labelled C-objects, such that no label appears twice in the set and any two C-objects are treated as distinct if their set of labels is (e.g. labelled forests are sets of labelled trees). In both settings, clusters (=components) are the C-objects a (multi-)set is composed of. The focus of this work is to investigate several research questions related to these combinatorial constructions, such as asymptotic enumeration as well as limit laws for the statistics of the number of clusters and the smallest/largest cluster of random (multi-)sets. We consider the two broad cases that the counting sequence of C is either subexponential or expansive. The enumerative results of this work are concerned with the following specific setting. We want to asymptotically determine the number of (multi-)sets of total size n ∈ N and with N ∈ N clusters as n and N both grow large. Apart from being mathematically challenging, this is interesting from another perspective. Knowing the answer to this counting problem is equivalent to knowing the distribution of the number of clusters of a (multi-)set of size n drawn uniformly at random from all (multi-)sets of that size. We complete this task for multisets in the subexponential setting, and for both sets and multisets in the expansive setting for the entire range of N. In the resulting formulas we see that these settings are inherently different: whereas the number of multisets in the subexponential case is basically given by the number of C-objects of a certain size uniformly in N, the expansive case exposes a phase transition depending on N/n where the asymptotic order flips. In the subexponential case we are additionally able to say much more about the structure of multisets of size n and with N clusters. It is possible to completely describe the multiset drawn uniformly at random from all such multisets in terms of an explicit distribution. Namely, after removing the largest cluster and all clusters of smallest possible size, the remainder converges in distribution to a limit given by the well-known Boltzmann model. We baptise this phenomenon extreme condensation as virtually all components in that multiset are of smallest possible size, a bounded number of clusters is bounded and there is one huge cluster receiving almost the entire possible size. In the expansive setting such a neat description is not possible and we will only be able to make (very) educated guesses about the structure. The last batch of results is concerned with the cluster statistics from random (multi-)sets drawn uniformly at random from all (multi-)sets of size n in the expansive case, and in some instances in a slightly more general version called oscillating expansive. For that purpose, we show that a wide class related to the respective generating series is H-admissible, a property allowing us to compare different coefficients of a power series asymptotically. With this at hand, we determine all moments of the number of clusters. Further, assisted by our counting results about multisets of a particular size and number of clusters, we establish a local limit theorem for the number of clusters. Finally, we determine the scaling under which the size of the largest cluster in a uniform (multi-)set converges in distribution to the extreme value distribution and show that the size of the smallest cluster converges in distribution without scaling. Our methods are based on reformulating the problem at hand into a probability involving iid random variables via the PĂłlya-Boltzmann model. This gives access to probability theory’s large toolbox in the subexponential setting, where we make efficient use of existing results regarding subexponential distributions. In the counting problem of the expansive case we are initially confronted with the complex problem of determining a twodimensional Cauchy integral. By well-known results such as Chernoff bounds and estimates for Poisson variables, the aforementioned probability can then be simplified to a one-dimensional integral which is tackled via the saddle-point method. Lastly, for the problems related to cluster statistics we develop a simple and unified approach using the framework of H-admissibility and the elementary inclusion/exclusion principle.FĂŒr eine kombinatorische Klasse C untersuchen wir zwei kombinatorische Konstruktionen: die Klasse G = Mset(C) der Multimengen, d.h. jedes Objekt in G ist eindeutig durch die darin enthaltenen C-Objekte und deren Vielfachheit spezifiziert (z.B. sind unmarkierte WĂ€lder Multimengen von unmarkierten BĂ€umen). Und, zweitens, die Klasse S = Set(C), die Mengen von markierten C-Objekten enthĂ€lt, so dass keine Markierung zweimal in der Menge vorkommt und zwei beliebige C-Objekte verschieden sind, wenn ihre Markierungen verschieden sind (z.B. sind markierte WĂ€lder Mengen von markierten BĂ€umen). In beiden FĂ€llen nennen wir die C-Objekte, aus denen eine (Multi-)Menge zusammengesetzt ist, Komponenten. Der Schwerpunkt dieser Arbeit liegt auf der Untersuchung verschiedener Forschungsfragen im Zusammenhang mit diesen kombinatorischen Konstruktionen, wie z.B. die asymptotische AufzĂ€hlung sowie GrenzwertsĂ€tze fĂŒr die Anzahl von Komponenten und der kleinsten/grĂ¶ĂŸten Komponente in zufĂ€lligen (Multi-)Mengen. Wir betrachten die beiden allgemeinen FĂ€lle, dass die ZĂ€hlfolge von C entweder subexponentiell oder expansiv ist. In den ZĂ€hl-Ergebnissen dieser Arbeit wollen wir asymptotisch die Anzahl der (Multi-)Mengen der GesamtgrĂ¶ĂŸe n ∈ N und mit N ∈ N Komponenten bestimmen, wenn n und N beide groß werden. Abgesehen davon, dass dies eine mathematische Herausforderung ist, liefert uns die Antwort auf dieses ZĂ€hlproblem die Verteilung der Anzahl der Komponenten einer (Multi-)Menge der GrĂ¶ĂŸe n, die gleichverteilt aus allen (Multi-)Mengen dieser GrĂ¶ĂŸe gezogen wird. Wir lösen diese Aufgabe fĂŒr Multimengen im subexponentiellen Fall, und sowohl fĂŒr Mengen als auch fĂŒr Multimengen im expansiven Fall fĂŒr alle N . In den Ergebnissen sehen wir, dass diese FĂ€lle grundlegend unterschiedlich sind: WĂ€hrend die Anzahl der Multimengen im subexponentiellen Fall im Wesentlichen durch die Anzahl der C-Objekte einer bestimmten GrĂ¶ĂŸe gleichmĂ€ĂŸig in N gegeben ist, zeigt sich im expansiven Fall ein von N/n abhĂ€ngiger PhasenĂŒbergang, bei dem sich die asymptotische Ordnung stark verĂ€ndert. Im subexponentiellen Fall untersuchen wir zusĂ€tzlich die Struktur von Multimengen der GrĂ¶ĂŸe n und mit N Komponenten. Es ist möglich, die Multimenge, die gleichverteilt aus allen solchen Multimengen gezogen wird, vollstĂ€ndig durch eine explizite Verteilung zu beschreiben. Nach dem Entfernen der grĂ¶ĂŸten Komponente und aller Komponenten der kleinstmöglichen GrĂ¶ĂŸe konvergiert die verbleibende Multimenge in Verteilung gegen einen Grenzwert, der durch das bekannte Boltzmann-Modell gegeben ist. Wir nennen dieses PhĂ€nomen extreme Kondensation, da praktisch alle Komponenten in dieser Multimenge die kleinstmögliche GrĂ¶ĂŸe haben, eine beschrĂ€nkte Anzahl von Komponenten beschrĂ€nkt ist und es eine große Komponente gibt, die fast die gesamte mögliche Masse erhĂ€lt. Im expansiven Fall ist eine solche genaue Beschreibung nicht möglich, und wir werden nur Vermutungen ĂŒber die Struktur anstellen können. Die abschließenden Ergebnisse befassen sich mit der Komponenten-Struktur von zufĂ€lligen (Multi-)Mengen, die gleichverteilt aus allen (Multi-)Mengen der GrĂ¶ĂŸe n gezogen werden, im expansiven Fall und in einigen Ausnahmen in einer etwas allgemeineren Version namens oszillierend expansiv. Wir zeigen, dass eine breite Klasse an Erzeugendenfunktionen H-zulĂ€ssig ist, was eine Eigenschaft ist, die es erlaubt, verschiedene Koeffizienten einer Potenzreihe asymptotisch zu vergleichen. Auf dieser Grundlage bestimmen wir die Skalierung, unter der die GrĂ¶ĂŸe der grĂ¶ĂŸten Komponente gegen die Extremwertverteilung konvergiert und zeigen, dass die GrĂ¶ĂŸe der kleinsten Komponente in Verteilung ohne Skalierung konvergiert. Schließlich bestimmen wir alle Momente der Anzahl der Komponenten und stellen mithilfe unserer ZĂ€hlergebnisse einen lokalen Grenzwertsatz fĂŒr die Anzahl der Komponenten auf. Unsere Methoden beruhen auf der Umformulierung des jeweiligen Problems in eine Wahrscheinlichkeit ĂŒber unabhĂ€ngige gleichverteilte Zufallsvariablen ĂŒber das PĂłlya-Boltzmann-Modell. Dies ermöglicht den Zugriff auf die vielseitigen Werkzeuge der Wahrscheinlichkeitstheorie im subexponentiellen Fall, in dem wir die bestehenden Ergebnisse zu subexponentiellen Verteilungen effizient nutzen. Bei dem ZĂ€hlproblem im expansiven Fall sind wir zunĂ€chst mit der komplexen Aufgabe der Bestimmung eines zweidimensionalen Cauchy-Integrals konfrontiert. Durch bekannte Ergebnisse wie Chernoff-Grenzen und AbschĂ€tzungen fĂŒr Poisson-Variablen lĂ€sst sich die oben genannte Wahrscheinlichkeit dann auf ein eindimensionales Integral vereinfachen, das mit der Sattelpunktmethode gelöst wird. Abschließend entwickeln wir fĂŒr die Probleme im Zusammenhang mit der Komponenten-Struktur einen einfachen und einheitlichen Ansatz unter Verwendung der H-ZulĂ€ssigkeit und des elementaren Inklusions-/Exklusionsprinzips
    corecore