7 research outputs found

    Efficient Algorithms for CUR and Interpolative Matrix Decompositions

    Full text link
    The manuscript describes efficient algorithms for the computation of the CUR and ID decompositions. The methods used are based on simple modifications to the classical truncated pivoted QR decomposition, which means that highly optimized library codes can be utilized for implementation. For certain applications, further acceleration can be attained by incorporating techniques based on randomized projections. Numerical experiments demonstrate advantageous performance compared to existing techniques for computing CUR factorizations

    Low-Dimensional Models for Compressed Sensing and Prediction of Large-Scale Traffic Data

    Get PDF
    Advanced sensing and surveillance technologies often collect traffic information with high temporal and spatial resolutions. The volume of the collected data severely limits the scalability of online traffic operations. To overcome this issue, we propose a low-dimensional network representation where only a subset of road segments is explicitly monitored. Traffic information for the subset of roads is then used to estimate and predict conditions of the entire network. Numerical results show that such approach provides 10 times faster prediction at a loss of performance of 3% and 1% for 5- and 30-min prediction horizons, respectively.Singapore. National Research Foundation (Singapore-MIT Alliance for Research and Technology Center. Future Urban Mobility Program

    PERANCANGAN SISTEM OPTIMASI ALGORITMA COMMON SPATIAL PATTERN MENGGUNAKAN PERHITUNGAN ENERGY SELECTION PADA SINYAL ELECTROENCEPHALOGRAM (EEG)

    Get PDF
    Elektroencephalogram (EEG) adalah alat yang digunakan untuk merekam aktivitas kelistrikan otak manusia. Sinyal yang dihasilkan oleh EEG dalam orde kecil (orde micro) sehingga diperlukan algoritma yang tepat untuk menentukan aktivitas sinyal pada otak yang aktif. Dari penelitian – penelitian sebelumnya berbagai metode yang digunakan untuk mengetahui aktivitas tersebut yang terangkum dalam metode spatial filtering. Diantara sekian banyak spatial filter, seperti laplacian, Principal Componen Analysis (PCA), Independent Componen Analysis (ICA), Common Average Refrence (CAR), Linear Descriminan Analysis (LDA) terdapat sebuah algoritma yang paling baik dalam mendiskriminasi suatu fungsi pada sinyal otak yaitu Algoritma Common Spatial Pattern (CSP). Namun CSP memiliki kekurangan yaitu CSP menganggap semua sinyal EEG pada channel memiliki korelasi dan keterkaitan satu sama lain sehingga CSP sulit untuk membedakan antara sinyal EEG yang sesuai dengan sinyal noise. Untuk mengatasi kelemahan ini berbagai metode telah dilakukan seperti RCSP, ACSP, KCSP, dll. Pada Tugas Akhir ini akan dilakukan perbaikan performa algoritma CSP menggunakan perhitungan Energy Selection pada channel, untuk memisahkan sinyal otak yang aktif dengan noise. Sehingga sinyal otak yang direkan oleh EEG bisa melihat jumlah channel aktif sinyal motor imagery. Hasil pengujian sistem penelitian ini bahwa dengan adanya channel selection sinyal motor imagery dapat melihat jumlah channel motor imagery secara pasti tanpa terpangaruh oleh sinyal noise

    Energy extraction method for EEG channel selection

    Get PDF
    Channel selection is an improvement technique to optimize EEG-based BCI performance. In previous studies, many channel selection methods—mostly based on spatial information of signals—have been introduced. One of these channel selection techniques is the energy calculation method. In this paper, we introduce an energy optimization calculation method, called the energy extraction method. Energy extraction is an extension of the energy calculation method, and is divided into two steps. The first step is energy calculation and the second is energy selection. In the energy calculation step, l2-norm is used to calculate channel energy, while in the energy selection method we propose three techniques: “high value” (HV), “close to mean” (CM), and “automatic”. All proposed framework schemes for energy extraction are applied in two types of datasets. Two classes of datasets i.e. motor movement (hand and foot movement) and motor imagery (imagination of left and right hand movement) were used. The system used a Common Spatial Pattern (CSP) method to extract EEG signal features and k-NN as a classification method to classify the signal features with k = 3. Based on the test results, all schemes for the proposed energy extraction method yielded improved BCI performance of up to 58%. In summary, the energy extraction approach using the CM energy selection method was found to be the best channel selection technique

    CUR Decomposition for Compression and Compressed Sensing of Large-Scale Traffic Data

    No full text
    Abstract — Intelligent Transportation Systems (ITS) often operate on large road networks, and typically collect traffic data with high temporal resolution. Consequently, ITS need to handle massive volumes of data, and methods to represent that data in more compact representations are sorely needed. Subspace methods such as Principal Component Analysis (PCA) can create accurate low-dimensional models. However, such models are not readily interpretable, as the principal components usually involve a large number of links in the traffic network. In contrast, the CUR matrix decomposition leads to low-dimensional models where the components correspond to individual links in the network; the resulting models can be easily interpreted, and can also be used for compressed sensing of the traffic network. In this paper, the CUR matrix decomposition is applied for two purposes: (1) compression of traffic data; (2) compressed sensing of traffic data. In the former, only data from a “random ” subset of links and time instances is stored. In the latter, data for the entire traffic network is inferred from measurements at a “random” subset of links. Numerical results for a large traffic network in Singapore demonstrate the feasibility of the proposed approach. I

    Modelo estadístico pedagógico para la toma de decisiones administrativas y académicas con impacto en el mejoramiento continuo del rendimiento de los estudiantes universitarios, basado en los métodos de selección CUR

    Get PDF
    [ES]El objetivo de este trabajo es encontrar un modelo estadístico pedagógico de predicción del rendimiento académico de los estudiantes para la toma de decisiones administrativas y académicas con impacto en el mejoramiento continuo del estudiante, a partir de la información publicada en la literatura especializada, en los últimos 50 años y de la consulta directa a estudiantes universitarios. Para ello se consideran 36 escalas con sus 180 dimensiones latentes o factores construidas con más de 1000 ítems de respuesta y 18 preguntas adicionales, incluyendo un módulo de variables sociodemográficas constituidas por 15 variables. De todo ese registro de datos se obtienen más de 200 variables y dimensiones que normalmente se utilizan para explicar el rendimiento académico de los estudiantes universitarios a nivel mundial. Se valoran, analizan y someten a un crítico y extenso ejercicio de validación de evidencia estadística, con el fin de encontrar unas cuantas variables “las más importantes”, que permitan construir un modelo estadístico pedagógico que acerque a una relativa y adecuada predicción del rendimiento académico que un estudiante tendrá en el futuro. Pero no con el objetivo de abrir o cerrar puertas según el resultado de esta evaluación, sino más bien de ampliar el abanico de alternativas y opciones para facilitar el aprendizaje. Por lo tanto, el objetivo de esta investigación es estudiar la relación entre cinco indicadores de rendimiento académico y un total de 200 variables, con el propósito de explicar el rendimiento académico de los estudiantes universitarios y conformar un modelo estadístico que apoye la gestión académica y administrativa. Todo ello, para que se logre una mejora continua del proceso de aprendizaje para estudiantes universitarios. Determinar la relevancia estadística valorada mediante el tamaño del efecto de esas variables al explicar el desempeño de los estudiantes desde un punto de vista estadístico. Paralelamente se brinda una mejora a la técnica multivariante Descomposición de la matriz CUR y finalmente diseñar un modelo estadístico de clasificación de estudiantes que estime el percentil del rendimiento académico, junto con otros indicadores del estado pedagógico actual del estudiante. Esta investigación se ha desarrollado con acciones concretas descritas en cinco etapas: la primera denominada “Búsqueda de las variables más relevantes para explicar el rendimiento académico”, que enmarca una revisión sistemática de la literatura que dio sustento en su parte inicial al diseño del cuestionario, considera también un análisis bibliométrico y un metaanálisis. Seguidamente se estableció el “Diseño y construcción estadística de cinco indicadores de rendimiento académico” como variables a utilizar para la construcción de los cluster de estudiantes según su nivel de rendimiento académico bajo, medio y alto. La tercera etapa corresponde a una “Caracterización psicográfica y académica de los estudiantes de la Universidad Estatal a Distancia, Costa Rica con las variables relevantes” para continuar posteriormente con la etapa 4 en la que se realiza la “Construcción del modelo estadístico pedagógico” mediante la determinación de las ecuaciones discriminantes de Fischer y criterios de clasificación, finalmente la etapa 5 corresponde a la “Creación del modelo estadístico en una aplicación móvil para estudiantes” disponible de manera inmediata para los estudiantes universitarios. El análisis exhaustivo, tanto de las herramientas estadísticas utilizadas, como de los artículos que tratan el rendimiento académico, nos ha permitido llegar a las siguientes conclusiones: No hay unanimidad en la forma de evaluar el rendimiento académico, lo cual complica los estudios comparativos. Se han identificado más de 270 variables que los investigadores han explorado, para explicar el rendimiento académico, en los últimos 50 años. Los hallazgos de los diferentes investigadores no son concordantes en cuanto a cuáles de estas variables están significativamente asociadas con el rendimiento académico y cuáles no; probablemente porque las herramientas estadísticas utilizadas no capturan ni las interrelaciones ni las interacciones entre las variables predictoras. La búsqueda de variables latentes para reducir la alta dimensionalidad del problema tampoco es un tema resuelto en la literatura estadística especializada. Hay una gran controversia a la hora de seleccionar la técnica más adecuada. Nuestra contribución a nivel teórico se centra en la Descomposición CUR, técnica de muy reciente aparición, aplicable al análisis de matrices de altas dimensiones, la cual centra su atención en la búsqueda de las variables relevantes. Se propone un algoritmo que consiste en la selección de las mejores columnas y filas según la distribución de probabilidad de los puntajes leverage, sobre las k componentes utilizadas para su cálculo. Se ajusta la distribución empírica de los puntajes leverage a una distribución teórica existente para cada uno de los k componentes, con los que se puede calcular los puntajes leverage (k<N), escogiendo aquellas columnas y filas en las que se acumule esa probabilidad. Se ha creado el software denominado Dinamic CUR que dinamiza la búsqueda de las mejores columnas y filas; aquéllas que minimizan la diferencia entre la matriz original y la matriz aproximada CUR. La propuesta teórica y el software desarrollado nos ha permitido identificar las cuarenta variables más relevantes con el rendimiento académico según la descomposición CUR, estas son: la autoeficacia percibida, la autorregulación del aprendizaje, la actitud que tienen los estudiantes hacia los estudios, la motivación académica, la constancia, el estilo de aprendizaje, la administración del tiempo, la opinión sobre el sistema de evaluación de los aprendizajes, el uso de los recursos didácticos que ofrece la universidad, son algunas de las más relevantes. El promedio de horas que le dedican a los estudios por semana, la realización de actividad física y la escolaridad de los padres son variables significativas, pero no las más relevantes, al contrario de lo que se ha creído hasta ahora. El clima de clase y el número de estudiantes en las tutorías son dos aspectos externos no inherentes al estudiante, pero también con alta influencia en el rendimiento académico. En un proceso de análisis y depuración de variables para encontrar las variables de mayor fortaleza estadística para predecir el rendimiento académico, se sometieron al análisis discriminante las variables identificadas del metaanálisis, de la descomposición CUR y del análisis de variancia univariado, mejorando de un total de 200 variables a 84 variables importantes y terminando con un modelo de 28 variables altamente significativas. Con estas 28 variables y dimensiones ha sido posible construir y desarrollar un modelo de predicción del percentil esperado del rendimiento académico, así como una estimación puntual y por intervalo del 95% de los cinco indicadores de rendimiento académico definidos en esta investigación. Este modelo ha sido implementado en una APP, denominada “Academic Achievement Score Projection, AASP”, manejable desde los móviles, que permitirá a los estudiantes predecir su rendimiento académico y las variables con mayor impacto. Controlando esas variables podrán modificar su rendimiento. Esta APP está disponible en Play Store y Iphone con el nombre “Academic Score”
    corecore