12 research outputs found

    Nonparametric estimation of k-modal taste heterogeneity for group level agent-based mixed logit

    Full text link
    Estimating agent-specific taste heterogeneity with a large information and communication technology (ICT) dataset requires both model flexibility and computational efficiency. We propose a group-level agent-based mixed (GLAM) logit approach that is estimated with inverse optimization (IO) and group-level market share. The model is theoretically consistent with the RUM model framework, while the estimation method is a nonparametric approach that fits to market-level datasets, which overcomes the limitations of existing approaches. A case study of New York statewide travel mode choice is conducted with a synthetic population dataset provided by Replica Inc., which contains mode choices of 19.53 million residents on two typical weekdays, one in Fall 2019 and another in Fall 2021. Individual mode choices are grouped into market-level market shares per census block-group OD pair and four population segments, resulting in 120,740 group-level agents. We calibrate the GLAM logit model with the 2019 dataset and compare to several benchmark models: mixed logit (MXL), conditional mixed logit (CMXL), and individual parameter logit (IPL). The results show that empirical taste distribution estimated by GLAM logit can be either unimodal or multimodal, which is infeasible for MXL/CMXL and hard to fulfill in IPL. The GLAM logit model outperforms benchmark models on the 2021 dataset, improving the overall accuracy from 82.35% to 89.04% and improving the pseudo R-square from 0.4165 to 0.5788. Moreover, the value-of-time (VOT) and mode preferences retrieved from GLAM logit aligns with our empirical knowledge (e.g., VOT of NotLowIncome population in NYC is $28.05/hour; public transit and walking is preferred in NYC). The agent-specific taste parameters are essential for the policymaking of statewide transportation projects

    Decision Forest: A Nonparametric Approach to Modeling Irrational Choice

    Get PDF
    Customer behavior is often assumed to follow weak rationality, which implies that adding a product to an assortment will not increase the choice probability of another product in that assortment. However, an increasing amount of research has revealed that customers are not necessarily rational when making decisions. In this paper, we propose a new nonparametric choice model that relaxes this assumption and can model a wider range of customer behavior, such as decoy effects between products. In this model, each customer type is associated with a binary decision tree, which represents a decision process for making a purchase based on checking for the existence of specific products in the assortment. Together with a probability distribution over customer types, we show that the resulting model -- a decision forest -- is able to represent any customer choice model, including models that are inconsistent with weak rationality. We theoretically characterize the depth of the forest needed to fit a data set of historical assortments and prove that with high probability, a forest whose depth scales logarithmically in the number of assortments is sufficient to fit most data sets. We also propose two practical algorithms -- one based on column generation and one based on random sampling -- for estimating such models from data. Using synthetic data and real transaction data exhibiting non-rational behavior, we show that the model outperforms both rational and non-rational benchmark models in out-of-sample predictive ability.Comment: The paper is forthcoming in Management Science (accepted on July 25, 2021

    Demand Estimation under Uncertain Consideration Sets

    Get PDF
    To estimate customer demand, choice models rely both on what the individuals do and do not purchase. A customer may not purchase a product because it was not offered but also because it was not considered. To account for this behavior, existing literature has proposed the so-called consider-then-choose (CTC) models, which posit that customers sample a consideration set and then choose the most preferred product from the intersection of the offer set and the consideration set. CTC models have been studied quite extensively in the marketing literature. More recently, they have gained popularity within the operations management (OM) literature to make assortment and pricing decisions. Despite their richness, CTC models are difficult to estimate in practice because firms typically do not observe customers' consideration sets. Therefore, the common assumption in OM has been that customers consider everything on offer, so the consideration set is the same as the offer set. This raises the following question: When firms only collect transaction data, do CTC models provide any predictive advantage over classic choice models? More precisely, under what conditions do CTC models outperform (if ever) classic choice models in terms of prediction accuracy? In this work, we study a general class of CTC models. We propose techniques to estimate these models efficiently from sales transaction data. We then compare their performance against the classic approach. We find that CTC models outperform standard choice models when there is noise in the offer set information and the noise is asymmetric across the training and test offer sets but otherwise lead to no particular predictive advantage over the classic approach. We also demonstrate the benefits of using CTC models in real-world retail settings. In particular, we show that CTC models calibrated on retail transaction data are better at long-term and warehouse level sales forecasts. We also evaluate their performance in the context of an online platform setting: a peer-to-peer car sharing company. In this context, offer sets are even difficult to define. We observe a remarkable performance of CTC models over standard choice models therein.Este documento es la versiĂłn aceptada del artĂ­culo publicado en Operations Research (ISSN 0030-364X) en Septiembre de 202

    La rentabilidad para la fijaciĂłn de precios en fabricaciĂłn de cocinas industriales de la empresa Citegas EIRL Arequipa, 2020

    Get PDF
    La presente investigación titulada La rentabilidad para la fijación de precios en fabricación de cocinas industriales de la empresa Citegas EIRL Arequipa, 2020. Tiene como objetivo general. Determinar la relación que existe entre la rentabilidad para la fijación de precios en fabricación de cocina industriales de la empresa Citegas, Arequipa, 2020. Su metodología, es de nivel descriptivo correlacionar, de tipo no experimental y de enfoque cuantitativo. El instrumento, se utilizó la técnica de la encuesta y se aplicó el cuestionario. Muestra, 20 colaboradores. Su resultado, Por consiguiente para la obtener la validación de las hipótesis a través del coeficiente de rho de Spearman, se obtuvo lo siguiente: el coeficiente de correlación de Spearman de la hipótesis general fue de 0.684, demostrando que tiene una correlación positiva considerable por lo que el nivel de significancia fue de 0.001 < 0.05, por lo tanto, se acepta la hipótesis alterna y se rechaza la hipótesis nula. Conclusiones, se determinó después de obtener los resultados, la rentabilidad en un análisis completo de la empresa tiene una relación positiva considerable para la fijación de precios, con un método de fijación de precios se tendrá mejores resultados en la obtención de rentabilidad para la empresa

    Optimisation et simulation pour la gestion de disponibilite sous comportement d’achat

    Get PDF
    RÉSUMÉ: Nous nous intéressons dans ce doctorat à l’optimisation de la disponibilité de l’offre au cours d’une période de réservation pendant laquelle des ressources périssables sont vendues. Cette problématique appartient au domaine de la gestion de revenu plus communément désigné par le terme anglais de revenue management. Afin d’illustrer notre propos, considérons le siège d’un train effectuant un trajet entre deux villes à une certaine date et heure. Ce siège est une ressource périssable, car il ne peut pas être proposé une fois le train parti. Cette ressource doit donc être vendue avant son terme durant une période de réservation. Des clients arrivent pendant cette période pour éventuellement réserver cette ressource en achetant un des produits offerts. Les produits sont définis à l’avance par leur tarif et leurs conditions. Ces dernières portent sur l’annulation, l’échange, l’accès au wifi ou une offre de repas par exemple. Chaque client choisira éventuellement d’acheter l’un de ces produits en fonction d’un comportement d’achat qui lui est propre. Ce doctorat se résume à déterminer quels produits offrir à chaque arrivée de client afin de maximiser le revenu généré par l’ensemble des ventes réalisées au cours de la période de réservation. Pour se faire, les ressources et produits sont fixés ainsi que la demande qui est connue au moyen d’une prévision. L’optimisation des ressources et produits ainsi que la prévision de la demande ne font pas l’objet de ce doctorat et sont d’ailleurs presque toujours traitées séparément dans le domaine de gestion de revenu. Le dilemme suivant est soulevé. D’un côté en acceptant une requête, nous assurons un revenu, mais nous diminuons la capacité disponible pour des requêtes futures éventuellement de meilleur revenu. Il peut donc y avoir de la dilution. D’un autre côté, en refusant une requête, nous réservons de la capacité pour d’éventuelles requêtes futures à meilleur revenu tout en perdant la requête présente à revenu sûr. Il peut donc y avoir du gaspillage. Deux grandes évolutions ont successivement changé la modélisation de ce problème et ont amélioré la robustesse des solutions tout en le complexifiant. La première a pris en compte les ressources dans leur ensemble plutôt qu’individuellement. La deuxième a intégré le comportement d’achat de clients là où auparavant la demande était considérée de façon indépendante par produit. Aujourd’hui, une formulation exacte intégrant ces deux aspects existe, mais est trop rapidement insoluble. Des approximations ont donc été proposées. L’objectif est de retourner rapidement une politique de disponibilité générant le meilleur revenu espéré une fois simuler. Dans un premier temps, nous présentons une approximation pour un comportement d’achat non paramétrique. Ce type de demande est abondamment utilisé en pratique et modélise mieux les substitutions de produits que beaucoup de modèles paramétriques. Il jouit aussi de plus en plus de recherches sur son estimation, mais de peu de travaux en gestion de la disponibilité. Nous introduisons alors un des trois concepts importants de ce doctorat qui est l’utilisation de temps de fermeture par produit comme politique de disponibilité. Cette dernière s’adapte pleinement à la logique d’achat non paramétrique contrairement aux modèles existants. Nous arrivons à un modèle à nombres entiers dont les variables binaires rendent compte d’une hiérarchie de produit qui a un réel sens pratique. Cela nous permet de proposer de bonnes solutions initiales très facilement. La politique par temps de fermeture empêche naturellement la réouverture à la vente de produits au cours de la période de réservation. Il faut savoir que cet aspect est souvent désiré en pratique et nécessite la complexification des approches existantes contrairement à la nôtre. Dans le cas de non-réouverture, nous prouvons que notre approximation est une borne supérieure pour la formulation exacte et qu’elle est asymptotiquement optimale. Nous pouvons utiliser la politique retournée par notre approximation comme solution initiale de n’importe quelle approximation à réouverture. Des résultats numériques sur des instances de petites à grandes tailles montrent que notre approximation, par rapport aux approches existantes, retourne beaucoup plus rapidement une politique de disponibilité générant un revenu espéré légèrement supérieur. Ils mettent aussi en évidence l’accélération des approximations existantes lorsque notre approche est utilisée comme solution de départ. Dans un second temps, poussés par les résultats précédents, nous cherchons à généraliser l’approche précédente à tout comportement d’achat. Nous représentons d’abord toute demande sous la forme de chemins d’achats formant ainsi un arbre de demande. Cet arbre de demande est le second concept important de ce doctorat. Nous utilisons le fait que chaque chemin d’achat est non paramétrique pour construire une nouvelle approximation acceptant n’importe quel comportement d’achat. Notre nouvelle approximation hérite de la politique de disponibilité par temps de fermeture et donc de la non réouverture. Nous utilisons alors la même linéarisation et nous étendons les résultats théoriques précédents. Les modèles paramétriques retournent un arbre de demande immense qui rend notre approximation insoluble. Pour pallier cela, nous présentons une méthode de résolution itérative basée sur une construction progressive de l’arbre de demande par un ajout successif de chemins d’achats. Nous proposons plusieurs heuristiques pour déterminer quel chemin d’achat ajouter. Chaque ajout raffine la modélisation du comportement d’achat. Nous menons ensuite des expériences numériques sur des instances à comportement d’achat paramétrique de petite à grande taille. Les résultats montrent des résultats similaires à ceux pour le non paramétrique et la méthode itérative de résolution converge vers une bonne solution beaucoup plus rapidement que les autres approches. Dans un dernier temps, nous nous penchons sur la simulation pour la gestion de disponibilité. Nous proposons un nouvel estimateur à arrivées fluides pour le calcul du revenu espéré. Cette modélisation par arrivées fluides est le troisième concept important de ce doctorat. Notre modèle agrège alors les différentes arrivées par segment, et ce pour toute la période de réservation. Il ne subit donc pas l’aléatoire d’un ordre d’arrivées. Il nécessite alors une seule évaluation et est invariant alors que l’estimateur traditionnel à arrivées discrètes ne peut réduire la variance et donc augmenter la précision qu’en augmentant le nombre d’évaluations. En contrepartie, nous montrons que notre estimateur présente un biais, contrairement à l’estimateur traditionnel, pouvant être arbitrairement grand même si cela reste minime en pratique. Nous expérimentons alors des méthodes d’optimisation basées sur la simulation afin de résoudre le problème de contrôle de la disponibilité. Nous concluons rapidement que la bonne convergence de ces méthodes dépend largement du point de départ fourni par un modèle en programmation mathématique. Cette conclusion a été un moteur pour le développement des approximations précédentes. D’ailleurs, nous montrons que notre estimateur est équivalent à la plupart des approximations pour le contrôle de la disponibilité. En conséquence, nous évoquons quelques possibilités de notre estimateur pour appuyer l’optimisation. Les résultats numériques sur des instances de grandes tailles témoignent de la nette supériorité de notre estimateur en termes de temps de calcul. Nous constatons aussi peu de biais pour toutes les instances étudiées.----------ABSTRACT: This thesis focuses on the availability policy problem when selling perishable resources during a reservation period. This problem belongs to the revenue management topic. For example, a seat in a train between two cities at 9am on may 3rd 2018 is a perishable resource because it cannot be sold after the train departure. We must sell this resource through a reservation period before it expires and during which customers arrive to eventually buy a product. Many products can exist and are defined in advance by their terms and rates. For example, tickets for this seat can offer cancellation or exchange. A Meal or a wi-fi access can even be proposed at another cost. Each customer will then choose a product or not according to its own choice behaviour. This thesis aims to determinate which products to offer at each client arrival in order to maximize the income generated by the sales during the reservation period. Products and resources are fixed and demand is known. The products and resources optimization as well as the forecasting are not tackled in this thesis. Besides, they are almost always treated separately in revenue management. The following dilemma is raised. Accepting a request, provides an income, but removes one capacity for a future and potential higher request. This is called spillage. Whereas denying a request, protects a potential higher income but loses an immediate and safe income. This is named spoilage. Two major developments successively changed the model of this problem and improved the robustness of solutions while increasing the complexity. The first was to consider resources together rather than individually. The second is the integration of the customer choice behaviour rather than an independent demand by product. Today an exact formulation integrates both aspects but is too rapidly intractable. Approximations have therefore been proposed. The challenge is to quickly return an availability policy generating the best expected revenue when simulated. In a first part, we present an approximation for a non-parametric choice behaviour. This type of demand is widely used in practice and better accounts for products substitutions than many parametric models. It also benefits from recent research on its estimation and is rarely investigated for the availability policy problem. This approximation benefits from one of the three major concepts of this thesis which is an availability policy by closing times per product. This policy fully adapts to the non-parametric buying logic contrarily to existing models. The model is mixed integer with variables that account for a product hierarchy having a practical meaning. This allows us to easily offer good initial solutions in order to accelerate the resolution of our approximation. The closing time policy naturally prevents the reopening of products during the booking period. This aspect is often desired in practice. To force no reopening, existing approximations must be adapted and are thus more complex to solve. In the case of no reopening, we prove that our approximation is an upper bound for the exact formulation and that it is asymptotically optimal. We can use the policy returned by our approximation as an initial solution of any reopening approximation. Numerical results on small to large instances show that our approximation, compared to existing approaches, returns much faster an availability policy generating slightly higher expected revenue. They also highlight the acceleration of existing approximations when our approach is used as a starting solution. In a second part, driven by the previous results, we seek to generalize the previous approach to any choice behavior. We first represent any demand in the form of buying paths forming a demand tree. This demand tree is the second important concept of this thesis. Each buying path is non-parametric so that we extend previous results by introducing new approximation accepting any choice behavior. It inherits the closing time availability policy and by consequence the no reopening. We then use the same linearization and extend the previous theoretical results. Parametric choice models return huge and intractable demand tree. To overcome this, we present an iterative resolution method based on a progressive construction of the demand tree by a successive addition of buying paths. We propose several heuristics to determine which buying path to add. We then conduct numerical experiments on small to large instances with parametric choice behaviour. The results are similar to those for nonparametric and the iterative method of resolution converges much faster to a good solution than existing approximations. In the last part, we focus on simulation for the availability policy problem. We propose a new fluid arrivals estimator to determinate the expected revenue. This fluid arrivals aspect is the third major concept of this thesis. It aggregates the different arrivals by segment for the entire booking period. It thus does not suffer from the randomness of ordered arrivals. Consequently, it requires only one evaluation and is invariant whereas the traditional discrete arrivals estimator can only reduce the variance by increasing the number of evaluations. However, we show that our estimator has a bias, unlike the traditional estimator, which can be arbitrarily large even if remains minimal in practice. We then experiment optimization-based simulation methods to solve the availability policy problem. We quickly conclude that the good convergence of these methods highly depends on the starting point provided by a mathematical programming model. This conclusion has been a motivation for the development of the previous approximations. Moreover, we show that our estimator is equivalent to most of these approximations. As a result, we discuss some applications for our estimator to support optimization. The numerical results on large-scale instances highlight the superiority of our estimator in terms of computation time. We also found only a little bias for all instances studied

    Essays in college admissions and college major choice

    Get PDF
    corecore