11 research outputs found

    Simulating the component counts of combinatorial structures.

    Get PDF
    This article describes and compares methods for simulating the component counts of random logarithmic combinatorial structures such as permutations and mappings. We exploit the Feller coupling for simulating permutations to provide a very fast method for simulating logarithmic assemblies more generally. For logarithmic multisets and selections, this approach is replaced by an acceptance/rejection method based on a particular conditioning relationship that represents the distribution of the combinatorial structure as that of independent random variables conditioned on a weighted sum. We show how to improve its acceptance rate. We illustrate the method by estimating the probability that a random mapping has no repeated component sizes, and establish the asymptotic distribution of the difference between the number of components and the number of distinct component sizes for a very general class of logarithmic structures.ADB acknowledges support from ARC grants DP150101459 and DP150103588

    Unified derivation of the limit shape for multiplicative ensembles of random integer partitions with equiweighted parts

    Get PDF
    We derive the limit shape of Young diagrams, associated with growing integer partitions, with respect to multiplicative probability measures underpinned by the generating functions of the form F(z)=∏ℓ=1∞F0(zℓ)\mathcal{F}(z)=\prod_{\ell=1}^\infty \mathcal{F}_0(z^\ell) (which entails equal weighting among possible parts ℓ∈N\ell\in\mathbb{N}). Under mild technical assumptions on the function H0(u)=ln⁥(F0(u))H_0(u)=\ln(\mathcal{F}_0(u)), we show that the limit shape ω∗(x)\omega^*(x) exists and is given by the equation y=γ−1H0(e−γx)y=\gamma^{-1}H_0(\mathrm{e}^{-\gamma x}), where Îł2=∫01u−1H0(u) du\gamma^2=\int_0^1 u^{-1}H_0(u)\,\mathrm{d}u. The wide class of partition measures covered by this result includes (but is not limited to) representatives of the three meta-types of decomposable combinatorial structures --- assemblies, multisets and selections. Our method is based on the usual randomization and conditioning; to this end, a suitable local limit theorem is proved. The proofs are greatly facilitated by working with the cumulants of sums of the part counts rather than with their moments.Comment: Minor editorial corrections. Published in "Random Structures and Algorithms" (18 Apr 2014, Early View, online), http://onlinelibrary.wiley.com/doi/10.1002/rsa.20540/abstrac

    Asymptotic enumeration, cluster statistics, and limit laws for combinatorial structures

    Get PDF
    For a given combinatorial class C we study two types of combinatorial structures: the class G = Mset(C) satisfying the multiset construction, that is, every object in G is uniquely specified by a set of distinct C-objects each paired with a multiplicity from N indicating the number of occurrences of that object in the multiset (e.g. unlabelled forests are multisets of unlabelled trees). And, secondly, the class S = Set(C) containing sets of labelled C-objects, such that no label appears twice in the set and any two C-objects are treated as distinct if their set of labels is (e.g. labelled forests are sets of labelled trees). In both settings, clusters (=components) are the C-objects a (multi-)set is composed of. The focus of this work is to investigate several research questions related to these combinatorial constructions, such as asymptotic enumeration as well as limit laws for the statistics of the number of clusters and the smallest/largest cluster of random (multi-)sets. We consider the two broad cases that the counting sequence of C is either subexponential or expansive. The enumerative results of this work are concerned with the following specific setting. We want to asymptotically determine the number of (multi-)sets of total size n ∈ N and with N ∈ N clusters as n and N both grow large. Apart from being mathematically challenging, this is interesting from another perspective. Knowing the answer to this counting problem is equivalent to knowing the distribution of the number of clusters of a (multi-)set of size n drawn uniformly at random from all (multi-)sets of that size. We complete this task for multisets in the subexponential setting, and for both sets and multisets in the expansive setting for the entire range of N. In the resulting formulas we see that these settings are inherently different: whereas the number of multisets in the subexponential case is basically given by the number of C-objects of a certain size uniformly in N, the expansive case exposes a phase transition depending on N/n where the asymptotic order flips. In the subexponential case we are additionally able to say much more about the structure of multisets of size n and with N clusters. It is possible to completely describe the multiset drawn uniformly at random from all such multisets in terms of an explicit distribution. Namely, after removing the largest cluster and all clusters of smallest possible size, the remainder converges in distribution to a limit given by the well-known Boltzmann model. We baptise this phenomenon extreme condensation as virtually all components in that multiset are of smallest possible size, a bounded number of clusters is bounded and there is one huge cluster receiving almost the entire possible size. In the expansive setting such a neat description is not possible and we will only be able to make (very) educated guesses about the structure. The last batch of results is concerned with the cluster statistics from random (multi-)sets drawn uniformly at random from all (multi-)sets of size n in the expansive case, and in some instances in a slightly more general version called oscillating expansive. For that purpose, we show that a wide class related to the respective generating series is H-admissible, a property allowing us to compare different coefficients of a power series asymptotically. With this at hand, we determine all moments of the number of clusters. Further, assisted by our counting results about multisets of a particular size and number of clusters, we establish a local limit theorem for the number of clusters. Finally, we determine the scaling under which the size of the largest cluster in a uniform (multi-)set converges in distribution to the extreme value distribution and show that the size of the smallest cluster converges in distribution without scaling. Our methods are based on reformulating the problem at hand into a probability involving iid random variables via the PĂłlya-Boltzmann model. This gives access to probability theory’s large toolbox in the subexponential setting, where we make efficient use of existing results regarding subexponential distributions. In the counting problem of the expansive case we are initially confronted with the complex problem of determining a twodimensional Cauchy integral. By well-known results such as Chernoff bounds and estimates for Poisson variables, the aforementioned probability can then be simplified to a one-dimensional integral which is tackled via the saddle-point method. Lastly, for the problems related to cluster statistics we develop a simple and unified approach using the framework of H-admissibility and the elementary inclusion/exclusion principle.FĂŒr eine kombinatorische Klasse C untersuchen wir zwei kombinatorische Konstruktionen: die Klasse G = Mset(C) der Multimengen, d.h. jedes Objekt in G ist eindeutig durch die darin enthaltenen C-Objekte und deren Vielfachheit spezifiziert (z.B. sind unmarkierte WĂ€lder Multimengen von unmarkierten BĂ€umen). Und, zweitens, die Klasse S = Set(C), die Mengen von markierten C-Objekten enthĂ€lt, so dass keine Markierung zweimal in der Menge vorkommt und zwei beliebige C-Objekte verschieden sind, wenn ihre Markierungen verschieden sind (z.B. sind markierte WĂ€lder Mengen von markierten BĂ€umen). In beiden FĂ€llen nennen wir die C-Objekte, aus denen eine (Multi-)Menge zusammengesetzt ist, Komponenten. Der Schwerpunkt dieser Arbeit liegt auf der Untersuchung verschiedener Forschungsfragen im Zusammenhang mit diesen kombinatorischen Konstruktionen, wie z.B. die asymptotische AufzĂ€hlung sowie GrenzwertsĂ€tze fĂŒr die Anzahl von Komponenten und der kleinsten/grĂ¶ĂŸten Komponente in zufĂ€lligen (Multi-)Mengen. Wir betrachten die beiden allgemeinen FĂ€lle, dass die ZĂ€hlfolge von C entweder subexponentiell oder expansiv ist. In den ZĂ€hl-Ergebnissen dieser Arbeit wollen wir asymptotisch die Anzahl der (Multi-)Mengen der GesamtgrĂ¶ĂŸe n ∈ N und mit N ∈ N Komponenten bestimmen, wenn n und N beide groß werden. Abgesehen davon, dass dies eine mathematische Herausforderung ist, liefert uns die Antwort auf dieses ZĂ€hlproblem die Verteilung der Anzahl der Komponenten einer (Multi-)Menge der GrĂ¶ĂŸe n, die gleichverteilt aus allen (Multi-)Mengen dieser GrĂ¶ĂŸe gezogen wird. Wir lösen diese Aufgabe fĂŒr Multimengen im subexponentiellen Fall, und sowohl fĂŒr Mengen als auch fĂŒr Multimengen im expansiven Fall fĂŒr alle N . In den Ergebnissen sehen wir, dass diese FĂ€lle grundlegend unterschiedlich sind: WĂ€hrend die Anzahl der Multimengen im subexponentiellen Fall im Wesentlichen durch die Anzahl der C-Objekte einer bestimmten GrĂ¶ĂŸe gleichmĂ€ĂŸig in N gegeben ist, zeigt sich im expansiven Fall ein von N/n abhĂ€ngiger PhasenĂŒbergang, bei dem sich die asymptotische Ordnung stark verĂ€ndert. Im subexponentiellen Fall untersuchen wir zusĂ€tzlich die Struktur von Multimengen der GrĂ¶ĂŸe n und mit N Komponenten. Es ist möglich, die Multimenge, die gleichverteilt aus allen solchen Multimengen gezogen wird, vollstĂ€ndig durch eine explizite Verteilung zu beschreiben. Nach dem Entfernen der grĂ¶ĂŸten Komponente und aller Komponenten der kleinstmöglichen GrĂ¶ĂŸe konvergiert die verbleibende Multimenge in Verteilung gegen einen Grenzwert, der durch das bekannte Boltzmann-Modell gegeben ist. Wir nennen dieses PhĂ€nomen extreme Kondensation, da praktisch alle Komponenten in dieser Multimenge die kleinstmögliche GrĂ¶ĂŸe haben, eine beschrĂ€nkte Anzahl von Komponenten beschrĂ€nkt ist und es eine große Komponente gibt, die fast die gesamte mögliche Masse erhĂ€lt. Im expansiven Fall ist eine solche genaue Beschreibung nicht möglich, und wir werden nur Vermutungen ĂŒber die Struktur anstellen können. Die abschließenden Ergebnisse befassen sich mit der Komponenten-Struktur von zufĂ€lligen (Multi-)Mengen, die gleichverteilt aus allen (Multi-)Mengen der GrĂ¶ĂŸe n gezogen werden, im expansiven Fall und in einigen Ausnahmen in einer etwas allgemeineren Version namens oszillierend expansiv. Wir zeigen, dass eine breite Klasse an Erzeugendenfunktionen H-zulĂ€ssig ist, was eine Eigenschaft ist, die es erlaubt, verschiedene Koeffizienten einer Potenzreihe asymptotisch zu vergleichen. Auf dieser Grundlage bestimmen wir die Skalierung, unter der die GrĂ¶ĂŸe der grĂ¶ĂŸten Komponente gegen die Extremwertverteilung konvergiert und zeigen, dass die GrĂ¶ĂŸe der kleinsten Komponente in Verteilung ohne Skalierung konvergiert. Schließlich bestimmen wir alle Momente der Anzahl der Komponenten und stellen mithilfe unserer ZĂ€hlergebnisse einen lokalen Grenzwertsatz fĂŒr die Anzahl der Komponenten auf. Unsere Methoden beruhen auf der Umformulierung des jeweiligen Problems in eine Wahrscheinlichkeit ĂŒber unabhĂ€ngige gleichverteilte Zufallsvariablen ĂŒber das PĂłlya-Boltzmann-Modell. Dies ermöglicht den Zugriff auf die vielseitigen Werkzeuge der Wahrscheinlichkeitstheorie im subexponentiellen Fall, in dem wir die bestehenden Ergebnisse zu subexponentiellen Verteilungen effizient nutzen. Bei dem ZĂ€hlproblem im expansiven Fall sind wir zunĂ€chst mit der komplexen Aufgabe der Bestimmung eines zweidimensionalen Cauchy-Integrals konfrontiert. Durch bekannte Ergebnisse wie Chernoff-Grenzen und AbschĂ€tzungen fĂŒr Poisson-Variablen lĂ€sst sich die oben genannte Wahrscheinlichkeit dann auf ein eindimensionales Integral vereinfachen, das mit der Sattelpunktmethode gelöst wird. Abschließend entwickeln wir fĂŒr die Probleme im Zusammenhang mit der Komponenten-Struktur einen einfachen und einheitlichen Ansatz unter Verwendung der H-ZulĂ€ssigkeit und des elementaren Inklusions-/Exklusionsprinzips
    corecore