4 research outputs found

    A New Big Data and Logistic Regression-Based Approach for Small and Medium-Sized Enterprises

    Get PDF
    Businesses are being asked to assess an expanding volume of actual semi-structured and unstructured statistics to address the obstacles of internationalization and deal more effectively with the uncertainties of international integration. Big Data (BD) analytics can therefore play a strategic role in promoting the international expansion of Small and Medium-Sized Enterprises (SMEs). The exact connection between BD Analytics and globalization has, however, only been sporadically examined in the existing literature. In this study, a quantitative analysis using a Logistic Regression (LR) concept revealed that the interaction effects between BD Analytics architecture and BD Analytics functionality are both helpful and significant but the connection between the management of BD Analytics architecture and the Degree of Internationalization (DI) is not required for internationalization development. This shows that increasing internationalization in SMEs requires more than BD Analytics governance alone. Instead, this study emphasizes the importance of building particular BD Analytics abilities and the availability of a beneficial interaction between management of BD Analytics architecture and BD Analytics abilities that could take advantage of the new information gained via BD Analytics in SME global expansion

    Data Mining Applications in SMEs: An Italian Perspective

    Get PDF
    Background: From the last decade, data mining techniques, employed in particular in customer relationship management, have assumed a key role in the profitability and operations of companies. To support small and medium companies (SMEs), several innovative and continuously improving tools have been developed that allow SMEs to utilize the internal and external data sources to increase their competitiveness. Objectives: In this paper, an analysis of the impact of digitalization, and in particular data mining techniques, in the context of SMEs development is presented. Methods/Approach: A review of various sources has been conducted, with the focus on open source tools, since in the context of the Italian economy they are used by SMEs the most. Results: First, the analysis presents a brief review of the data mining techniques available and shows how they are practically employed in small companies. Second, an economical review of investments in data mining projects in Italy is presented. Conclusions: The review indicates that data mining techniques can boost a company in the market. However, the awareness of data mining as a company asset is still not strong in Italian SMEs and most investments in Italy are still carried out by large companie

    Data mining applied to the Varicocele condition

    Get PDF
    O sistema de saúde guarda cada vez mais informação dos seus utentes o que dificulta ou até impossibilita a descoberta de novos conhecimentos só com as técnicas usualmente utilizadas, i.e., as tradicionais técnicas estatísticas. De facto, os investigadores clínicos têm sentido uma crescente necessidade em extrair novos conhecimentos para continuadamente contribuir para o melhoramento dos serviços de saúde prestados. Essa necessidade tem vindo a ser colmatada com a aplicação de um processo, chamado “data mining”, que auxilia, através da aplicação de diversas técnicas (i.e., classificação, clustering, associação, etc.), a descoberta de padrões de dados vistos como interessantes, mas ocultados com as tradicionais técnicas estatísticas. A área da infertilidade masculina já começou a aplicar o data mining, por exemplo, através da aplicação da técnica de classificação para prever o sucesso de uma técnica de Procriação Medicamente Assistida. Contudo, o varicocelo - um síndrome anatómico de varizes escrotais caracterizado pela dilatação das veias que drenam o sangue da região dos testículos que em certos casos dá origem à infertilidade - não foi ainda explorado com uma técnica de data mining. A sua prevalência atinge 40% dos homens tratados por infertilidade, sendo que a infertilidade masculina abrange 50% das causas da infertilidade de um casal. A correção do varicocelo pode ser alcançada com um tratamento radiológico chamado embolização, que tem por objetivo desvitalizar as veias dilatadas através da introdução de substâncias terapêuticas na circulação sanguínea. Neste contexto, este trabalho teve os seguintes principais objetivos: i) averiguar o sucesso da correção do varicocelo com a técnica da embolização através da identificação de algum melhoramento na média dos valores dos parâmetros seminais ou das categorias seminais com recurso a técnicas estatísticas inferenciais (i.e. ANOVA e Chi-quadrado); ii) predizer o sucesso da embolização com técnicas de classificação através da aplicação do decision tree do RapidMiner e do algoritmo W-J48; iii) identificar padrões que caracterizam os pacientes embolizados com a técnica de clustering através do algoritmo K-Means e eleger as relações de atributos que ocorrem mais frequentemente através da técnica de associação com o algoritmo FP-Growth. Este processo de análise de dados seguiu a metodologia Cross-Industry Standard Process for Data mining (CRISP-DM) aplicando-a à análise de uma amostra de 293 homens inférteis descritos com 64 atributos que foram submetidos à embolização no Centro Hospitalar e Universitário de Coimbra (CHUC) entre Janeiro de 2007 e Abril de 2016. Os resultados obtidos indicam que a embolização melhora significativamente a média das concentrações de espermatozoides até 12 meses e de suas morfologias até 6 meses depois da embolização (ANOVA p<0.05) o que permite fundamentar o interesse em prever o sucesso desta técnica terapêutica. Sua previsão computarizada com a árvore de decisão do RapidMiner permitiu prever com uma Accuracy e F-measure de 70.59% e uma AUC de 0.750 que a probabilidade condicional de engravidar tendo um homem com uma severidade baixa ou média do varicocelo e uma parceira entre os 24 e 33 anos inclusive é de 70.83%. Também se viu que a frequência relativa, de pacientes com uma concentração de espermatozoides normal 3 meses depois da embolização e uma motilidade progressiva normal destes antes do tratamento, é mais alta em grupos de pacientes que raramente trabalham em ambientes tóxicos. Estes resultados permitem contribuir para as investigações em curso no domínio da infertilidade, assim como nidentificação de medidas que permitem um maior auxílio na descoberta do conhecimento. Nomeadamente, vimos que a aplicação conjunta dos algoritmos de data mining com as técnicas estatísticas inferenciais, assim como a aplicação de diversas técnicas de data mining (i.e., classificação, clustering e associação), potencia a descoberta do conhecimento em dados clínicos
    corecore