Falta palabras claveLos datos de expresión génica, y su particular naturaleza e importancia,
motivan no sólo el desarrollo de nuevas técnicas sino la formulación de
nuevos problemas como el problema del biclustering. El biclustering es una
técnica de aprendizaje no supervisado que agrupa tanto genes como
condiciones. Este doble agrupamiento lo diferencia del clustering
tradicional sobre este tipo de datos ya que éste sólo agrupa o bien genes o
condiciones.
La presente tesis presenta un nuevo algoritmo de biclustering que permite
el estudio de distintos criterios de búsqueda. Dicho algoritmo utiliza
esquema de búsqueda dispersa, o scatter search, que independiza el
mecanismo de búsqueda del criterio empleado.
Se han estudiado tres criterios de búsqueda diferentes que motivan las tres
principales aportaciones de la tesis. En primer lugar se estudia la
correlación lineal entre los genes, que se integra como parte de la función
objetivo empleada por el algoritmo de biclustering. La correlación lineal
permite encontrar biclusters con patrones de desplazamiento y escalado, lo
que mejora propuestas anteriores. En segundo lugar, y motivado por el
significado biológico de los patrones de activación-inhibición entre genes,
se modifica la correlación lineal de manera que se contemplen estos
patrones. Por último, se ha tenido en cuenta la información disponible
sobre genes en repositorios públicos, como la ontología de genes GO, y se
incorpora dicha información como parte del criterio de búsqueda. Se añade
un término extra que refleja, por cada bicluster que se evalúe, la calidad de
ese grupo de genes según su información almacenada en GO. Se estudian
dos posibilidades para dicho término de integración de información
biológica, se comparan entre sí y se comprueba que los resultados son
mejores cuando se usa información biológica en el algoritmo de
biclustering.
Las tres aportaciones descritas, junto con una serie de pasos intermedios,
han dado lugar a resultados publicados tanto en revistas como en
conferencias nacionales e internacionales