120 research outputs found

    Axiomatic design applied to CRUD matrix in information systems

    Get PDF
    In Information Systems (IS), the search for a good design is still a relevant issue. In IS, two sub-systems coexist, applications and data. To articulate these sub-systems, some authors opt for the CRUD matrix. Similarly, Axiomatic Design (AD) theory studies how functional requirements are related to design parameters using a design matrix. In this paper, the application sub-system corresponds to the functional requirements, the data sub-system to the design parameters, and the CRUD matrix to the design matrix. The goal of the CRUD matrix is to maintain the independence of its items to minimize the information content of the design. Similarly, AD uses the design matrix to define a good design. This work aims to develop a theory to create object-oriented elements based on the CRUD matrix aligned with the business strategy.info:eu-repo/semantics/publishedVersio

    Brokerage discovery in social networks

    Get PDF
    Conferência realizada em Angra do Heroísmo, Açores, de 9-12 de Setembro de 2013In social networks two types of measures can be identified, the structural measures and community structure based on diameter and centrality. The community structure usually deals with network partition into communities. The key idea of this work is to explore the concept of strong and weak ties by finding brokers within communities. The strict partition problem is relaxed into a bi-objective set covering problem with k-cliques which allows over-covered and uncovered nodes. The information extracted from social networking goes beyond cohesive groups, allowing the finding of brokers that interact between groups

    A scalable algorithm for the market basket analysis

    Get PDF
    The market basket is defined as an itemset bought together by a customer on a single visit to a store. The market basket analysis is a powerful tool for the implementation of cross-selling strategies. Especially in retailing it is essential to discover large baskets, since it deals with thousands of items. Although some algorithms can find large itemsets, they can be inefficient in terms of computational time. The aim of this paper is to present an algorithm to discover large itemset patterns for the market basket analysis. In this approach, the condensed data is used and is obtained by transforming the market basket problem into a maximum-weighted clique problem. Firstly, the input dataset is transformed into a graph-based structure and then the maximum-weighted clique problem is solved using a meta-heuristic approach in order to find the most frequent itemsets. The computational results show large itemset patterns with good scalability properties

    Big data e data science

    Get PDF
    Neste artigo foram apresentados os conceitos básicos de Big Data e a nova área a que deu origem, a Data Science. Em Data Science foi discutida e exemplificada a noção de redução da dimensionalidade dos dados

    Readability of scientific papers : data analysis of RCC

    Get PDF
    A legibilidade de uma revista de divulgação científica é um problema central das comissões editoriais, dos revisores e em especial dos leitores. O vocabulário de cada artigo relaciona-se em larga medida com as palavras-chave próprias de cada área científica, contudo a legibilidade também depende de outros factores. Neste artigo apresentam-se métricas de legibilidade que são função do comprimento das palavras e do comprimento das frases. Propõe-se que as métricas de legibilidade sejam balizadas por um limite superior e por um limite inferior. Finalmente, encontra-se uma relação entre as duas métricas, com base nos dados extraídos dos artigos publicados na RCC.The readability of a scientific review is a very important issue for the editorial committees, for the reviewers and especially for the readers. The vocabulary of each article is largely related to the keywords of the specific scientific area; however, the readability depends also on other factors. In this article we present two readability metrics that are based on the length of the words and on the length of the sentences. We propose that the readability metrics must be bounded by a superior limit and an inferior limit. Finally, the correlation between the two metrics is presented, given the data extracted from the articles published in the RCC.peerreviewe

    Uma nova taxonomia em data science

    Get PDF
    Neste artigo apresentamos uma taxonomia de algoritmos baseada em micro e macro-padrões. Os referidos algoritmos que têm origem em escolas diferentes e complexidades temporais distintas

    A network algorithm to discover sequential patterns

    Get PDF
    This paper addresses the discovery of sequential patterns in very large databases. Most of the existing algorithms use lattice structures in the space search that are very demanding computationally. The output of these algorithms generates a large number of rules. The aim of this work is to create a swift algorithm for the discovery of sequential patterns with a low time complexity. In this work, we also want to define tools that allow us to simplify the work of the final user, by offering a new visualization of the sequences, while bypassing the analysis of thousands of association rules

    Seleção de atributos utilizando a Análise Lógica de Dados Inconsistentes (LAID)

    Get PDF
    O tratamento de conjuntos de dados de grande dimensão é uma questão que é recorrente nos dias de hoje e cuja tarefa não é simples, dadas as limitações computacionais, ainda, existentes. Uma das abordagens possíveis passa por realizar uma seleção de atributos que permita diminuir, consideravelmente, a dimensão dos dados sem aumentar a inconsistência dos mesmos. “Rough Sets” é uma abordagem que difere doutras técnicas de seleção de atributos pela sua capacidade de lidar com dados inconsistentes. Outra abordagem para redução de dados é conhecida como Análise Lógica de Dados (LAD). A Análise Lógica de Dados Inconsistentes (LAID) junta as vantagens destas duas abordagens.N/

    Determinação de padrões de desistência em ginásios

    Get PDF
    O problema da retenção e das causas que levam à desistência da frequência do ginásio é uma questão que os ginásios e academias de fitness tentam há muito entender e consequentemente evitar. Tendo em atenção que a indústria do Fitness tem apostado na instalação massificada de sistemas avançados de Customer Relationship Management (CRM) existem atualmente bases de dados com dados históricos de grande valia. Este projeto tem por objetivo aplicar técnicas de classificação a estas bases de dados de forma a encontrar um método adequado para determinar padrões que permitam prever quais os utentes que irão abandonar ou cancelar a sua inscrição num período próximo, atendendo ao padrão do perfil de comportamento dos utentes que desistiram nos últimos meses, e criar uma ferramenta que forneça informação que permita aos gestores desses ginásios tomar medidas que permitam prolongar a duração da frequência dos utentes.The retention problem and consequent causes that lead gym and fitness clubs users to cancel their membership is an issue to understand and consequently avoid. Bearing in mind that the fitness industry has focused on mass installation of Customer Relationship Management systems (CRM) there are currently databases with valuable historical data that allow us to study users’ behavior. This project aims to apply classification techniques to those databases in order to find a suitable algorithm that will identify patterns allowing us to predict which users will abandon or cancel their membership in a short term, given the profile and behavior patterns of users that have quit in the last months, and create a tool that provides information that allows gym managers to take measures to extend users’ membership

    Estudo dos próximos locais a visitar na Rede Foursquare

    Get PDF
    A comunicação nas redes sociais surgiu da necessidade que o ser humano tem em partilhar assuntos, ideias, preferências comuns criando assim laços assentes em afinidades. A constante presença dos utilizadores nas redes sociais expressando as suas opiniões sobre produtos, marcas, pessoas, gostos, ou costumes tem vindo a desencadear um grande interesse por parte de empresas e pessoas em analisar essas informações. Numa sociedade que diariamente é capaz de produzir dados em massa, é cada vez mais necessária a criação de ferramentas para a sua análise e interpretação de forma a disponibilizar todo um conjunto de informações úteis para a tomada de decisões. Neste contexto, este trabalho descreve o processo de aplicação de técnicas de Data Mining em dados extraídos da rede social Foursquare de forma a obter informações relevantes que auxiliem na identificação de padrões de comportamentos. Através da descoberta de padrões sequenciais, este estudo irá permitir a visualização dos dados organizados numa poli-árvore com o objetivo de estudar os próximos locais a visitar na rede Foursquare.Communication in social networks has arisen from the need that human beings have to share subjects, ideas or common preferences and in this way to create bonds. The constant presence of the users of social networks expressing their opinions about products, brands, people, tastes or habits has developed a great interest by companies and researchers to analyze this information. In a society that is capable of producing mass information on a daily basis it is necessary to create tools for the analysis and interpretation of such data that will provide information useful to decision-making process. In this context, this work describes the process of applying data and graph mining techniques to data extracted from the social network Foursquare, in order to obtain relevant information for identifying behavior patterns. Through the discovery of sequential patterns, this study will allow us to visualize the data arranged in a poly-tree with the purpose of forecasting the next locations to be visited on the Foursquare network