45 research outputs found
Truncating Temporal Differences: On the Efficient Implementation of TD(lambda) for Reinforcement Learning
Temporal difference (TD) methods constitute a class of methods for learning
predictions in multi-step prediction problems, parameterized by a recency
factor lambda. Currently the most important application of these methods is to
temporal credit assignment in reinforcement learning. Well known reinforcement
learning algorithms, such as AHC or Q-learning, may be viewed as instances of
TD learning. This paper examines the issues of the efficient and general
implementation of TD(lambda) for arbitrary lambda, for use with reinforcement
learning algorithms optimizing the discounted sum of rewards. The traditional
approach, based on eligibility traces, is argued to suffer from both
inefficiency and lack of generality. The TTD (Truncated Temporal Differences)
procedure is proposed as an alternative, that indeed only approximates
TD(lambda), but requires very little computation per action and can be used
with arbitrary function representation methods. The idea from which it is
derived is fairly simple and not new, but probably unexplored so far.
Encouraging experimental results are presented, suggesting that using lambda
> 0 with the TTD procedure allows one to obtain a significant learning
speedup at essentially the same cost as usual TD(0) learning.Comment: See http://www.jair.org/ for any accompanying file
Governing drug reimbursement policy in Poland: The role of the state, civil society, and the private sector
This article investigates the distribution of power in Poland’s drug reimbursement policy in the early 2000s. We examine competing theoretical expectations suggested by neopluralism, historical institutionalism, corporate domination, and clique theory of the post-communist state, using data from a purposive sample of 109 semi-structured interviews and documentary sources. We have four concrete findings. First, we uncovered rapid growth in budgetary spending on expensive drugs for narrow groups of patients. Second, to achieve these favorable policy outcomes drug companies employed two prevalent methods of lobbying: informal persuasion of key members of local cliques and endorsements expressed by patient organizations acting as seemingly independent “third parties.” Third, medical experts were co-opted by multinational drug companies because they relied on these firms for scientific and financial resources that were crucial for their professional success. Finally, there was one-way social mobility from the state to the pharmaceutical sector, not the “revolving door” pattern familiar from advanced capitalist countries, with deleterious consequences for state capacity. Overall, the data best supported a combination of corporate domination and clique theory: drug reimbursement in Poland was dominated by Western multinationals in collaboration with domestically based cliques.Piotr Ozieranski is indebted to the Department of Sociology, University of Cambridge and St Edmund’s College for research grants
The self-acting chamfering tool with cassette tensioned by spring element
Jednym z problemów, które generują znaczne koszty oraz zwiększają czasochłonność procesów technologicznych, są czynności związane z fazowaniem krawędzi obrobionych wcześniej przedmiotów. Problem ten jest szczególnie istotny w przypadku obróbki seryjnej i masowej. Dostępne na rynku rozwiązania konstrukcyjne narzędzi do fazowania z ostrzami sprężystymi nie dają możliwości regulowania wielkości wykonywanych fazek. W pracy zamieszczono nową konstrukcję fazownika, w którym płytka skrawająca jest zamocowana w kasetce napinanej sprężyną. W celu możliwości regulowania wielkości fazki w kasetce została zaprojektowana płoza ślizgowa. Omówiono również zalety i wady prezentowanej konstrukcji wraz z możliwościami dalszych usprawnień.The chamfering of the edges of previously machined parts is one of the problems that generates significant costs and increases the time consuming process. This problem is particularly important in lot and mass processing. The chamfering tools with resilient blades available on the market do not offer the ability to adjust the size of the chamfer. In this paper a new chamfering tool design, in which the cutting insert is fixed in a spring-loaded cassette is presented. In order to adjust the size of the chamfer, a sliding skid has been designed in the cassette. The advantages and disadvantages of the presented construction along with the possibilities of further improvements are also discussed
The self-acting chamfering tool with blade tensioned by helical spring
Współczesna technologia dąży do maksymalnej efektywności wytwarzania z zachowaniem odpowiedniej dokładności wytwarzanych elementów. Załamywanie krawędzi realizowane standardowymi metodami może być czasochłonne. Fazowanie narzędziami samoczynnymi, dostępnymi na rynku, nie gwarantuje odpowiedniej dokładności wymiarów i właściwości fazek, szczególnie w produkcji seryjnej. W pracy przedstawiono ideę fazowania narzędziem posiadającym ostrze z płozą ślizgową, napinane sprężyną śrubową. Pokazano proces konstrukcji tego narzędzia. Zaprezentowano jego końcową wersję oraz wybrane wyniki fazowania tym narzędziem. Pokazano główne zalety takiego fazownika wraz z jego wadami, a także zasugerowano możliwe dalsze usprawnienia konstrukcji narzędzia, które mogą wady te wyeliminować.Modern technology strives to maximum productivity while maintaining the correct accuracy of manufactured components. Chamfering of the edges by standard methods increases the production time. Chamfering with self-acting tools available on the market does not guarantee the proper dimensions and properties of the chamfer, especially in mass production. This paper presents the idea of chamfering by the tool with a sliding blade and tensioned with helical spring. The construction processes of this tool have been shown. Its final version and selected chamfering results are presented. The main advantages of such a chamfer with its disadvantages are shown, and further possible improvements to the design of the tool, which can eliminate disadvantages, are suggested
The self-acting chamfering tool with blade tensioned by leaf spring
Problemem, który może generować znaczne koszty oraz zwiększać czasochłonność procesów technologicznych, są czynności związane z fazowaniem i gratowaniem krawędzi obrobionych wcześniej przedmiotów. Problem ten jest szczególnie istotny w przypadku obróbki masowej, kiedy ważne jest utrzymanie wysokiej efektywności wytwarzania. Dotychczas stosowane narzędzia do fazowania krawędzi, których konstrukcja opiera się na sprężyście umocowanych ostrzach, mają tę wadę, że wielkość i regularność wykonywanej fazy są uzależnione od zakłóceń losowych, np. zmiennych właściwości materiału półfabrykatu. Problem ten nasila się w przypadku kształtowania przedmiotów z materiałów plastycznych lub kompozytowych w obecności nieregularnych wypływek i zadziorów. W pracy omówiono proces konstrukcji i finalną wersję narzędzia do fazowania, wykonanego w wariancie z ostrzem ze zintegrowaną płozą ślizgową i napinanego sprężyną piórową. Omówiono wybrane wyniki fazowania tym narzędziem.One of the problems that generate significant costs and increase the time consuming process of the process is the chamfering and deburring the edges of previously machined objects. In the case of mass processing it is particularly important to maintain high efficiency of production. The size and regularity of the made phase subjected to random disturbances such as the variable properties of the material of the semi-finished product are indicated as disadvantages of existing tools for chamfering the edges which design is based on the elastically mounted blades. This problem arises when objects made from plastic or composite materials are machined in the presence of irregular spikes and burrs. This article discusses the construction process and presents the final version of the chamfering tool with a blade with integrated sliding skid tensioned by leaf spring. The selected chamfering results obtained with this tool are discussed