29 research outputs found

    Corpus and constructions:Hispanic perspectives

    Get PDF

    Corpus y construcciones: perspectivas hispánicas

    Get PDF
    Los trabajos que integran este volumen constituyen una muestra significativa de las aportaciones actuales de la lingüística de corpus en el ámbito hispánico. La primera parte está dedicada al análisis de fenómenos gramaticales con datos de corpus. La segunda se centra en el diseño y elaboración de corpus textuales de diverso tipo, con especial atención a las posibilidades de recuperación y explotación de los datos que contienen. En ambos bloques se pone de manifiesto la variedad de recursos y métodos de análisis propiciados por el desarrollo de corpus tanto del español como de otras lenguas (gallego, portugués, alemán). Varios capítulos muestran la necesidad de un enfoque plurilingüe, bien para dar cuenta de fenómenos de variación y cambio en situaciones de contacto, bien para desarrollar recursos lingüísticos para la enseñanza de lenguas extranjeras o para la traducción. La autoría plural de la obra configura un panorama diverso y estimulante de las posibilidades que ofrece la lingüística de corpus para profundizar en el conocimiento de las lenguas.Axencia Galega de Innovación, ref. nº ED431B 2017/3

    Aproximación a la lingüística computacional

    Get PDF
    520 p.Esta tesis surge con el objetivo de intentar dar respuesta, desde la perspectiva de la Lingüística, a una serie de preguntas básicas planteadas a raíz de una primera toma de contacto con el campo de la Lingüística Computacional. En primer lugar, buscando delimitar el objeto, finalidad, líneas de investigación e historia de la disciplina. En segundo lugar, analizando las implicaciones del tratamiento computacional del lenguaje a través de sus principales áreas de trabajo, así como algunas de las aplicaciones de la LC. Por último, incidiendo en uno de los aspectos que más interés han suscitado, el de la recopilación de grandes muestras textuales de uso de la lengua, o corpus. Todos estos puntos se han articulado en sendos materiales en línea que sirven desde hace algunos años como apoyo de la docencia de las asignaturas correspondientes de la licenciatura en Lingüística y que son de consulta libre para todos aquellos que quieran utilizarlo

    Diccionario de organización del conocimiento :clasificación, indización, terminología

    Get PDF
    Prólogo a la quinta y sexta edición / Catalina Naumis Pena -- Árbol de dominio -- Agradecimientos Guía práctica para el uso del diccionario – A-Z -- Fuentes bibliográficas -- Índice de equivalencias inglés-español -- Índice de equivalencias portugués-españo

    Métodos de selección léxica aplicados a la enseñanza. El vocabulario fundamental del español

    Get PDF
    [ES]El objetivo principal de este trabajo es hallar un método de selección y unión del léxico frecuente y el disponible para la elaboración del vocabulario fundamental. Para ello estudiamos ambas líneas de trabajo, los listados de frecuencia léxica derivados de la lingüística del corpus y los estudios sobre disponibilidad léxica, con la intención de entender cuáles son sus resultados y las unidades léxicas a las que llegamos en cada caso. Consideramos que la aplicación principal de este vocabulario fundamental es la enseñanza-aprendizaje de español como lengua extranjera, con lo que en los dos primeros capítulos estudiamos cuestiones relacionadas con ella y con las características del vocabulario, la competencia léxica, los métodos y enfoques didácticos, etc. Como el marco en el que se encuadra la elaboración de un vocabulario fundamental es la selección léxica, estudiamos los principales modelos que existen y cómo se suele llevar a cabo en la práctica. Por nuestra parte, nos centramos en los métodos objetivos de selección léxica, ya que en todo momento buscamos criterios científicos además de eficaces. Lo conseguimos gracias a procedimientos estadísticos y matemáticos. Para determinar el número de palabras que son recomendables para cada nivel del Marco común europeo de referencia para las lenguas, recurrimos a estudios sobre los porcentajes de cobertura léxica de las voces frecuentes, los resultados sobre la comprensión textual en estudiantes de inglés como lengua extranjera y la hipótesis sobre la existencia de un umbral léxico necesario para que se dé la comprensión oral y escrita de modo óptimo. Con ello establecemos un intervalo de unidades que se deben enseñar en cada nivel de lengua. Finalmente, determinamos el número de palabras que debe tener el vocabulario fundamental (orientado a un nivel B1 del Marco) y los parámetros para seleccionar los términos más usuales y los más disponibles, que obtenemos de tres obras fijadas previamente: un listado con las 5.000 palabras más frecuentes y dos listados de disponibilidad léxica de diferentes características. El resultado es el vocabulario fundamental del español, cuyo esbozo acompañamos de una definición del concepto y una historia de sus orígenes y anteriores propuestas

    Hacia una cuantificación del fenómeno dialéctico : redes neuronales y debate político

    Get PDF
    Programa de doctorado en Lingüística y Comunicación del Fenómeno Dialéctico : Redes Neuronales y Debate PolíticoEste trabajo es un acercamiento a la cuantificación del fenómeno retórico desde las redes neuronales artificiales. Tras acomodar al estudio la bibliografía existente, y desde el prisma de las Ciencias Políticas, se definen variables empíricas que permiten determinar la idoneidad retórica de un determinado discurso. Tras ello, se valoran con los indicadores definidos todos los debates políticos que se han desarrollado en España desde la regeneración democrática y entre los candidatos a la Presidencia del Gobierno. Con los datos de que se cuenta, se entrena una red neuronal artificial por cada plano o bloque en que se divide el análisis del discurso. En función de los resultados obtenidos, se puede afirmar que es posible determinar desde variables lingüísticas quién se ha impuesto en una contienda retórica, sin la intervención directa de un observador que mediatice el estudio. Eso sí, se debe aclarar que la herramienta se centra en dilucidar quién ha intervenido mejor, desde el punto de vista formal, quién ha empleado mejor los recursos lingüísticos, y no en la confrontación argumental. En todo momento se valoran los distintos planos que la Filología tradicional ha empleado en sus acercamientos teóricos. Y desde estos, desde las variables que suponen la principal novedad de este trabajo de investigación, se abren interesantes aplicaciones tales como la clasificación tipológica (en textos orales o escritos) que podría emplearse en los diversos buscadores de Internet, sin la intervención humana, o la mejora del aprendizaje retórico en futuros políticos o estudiantes. En cuanto a las aplicaciones efectivamente realizadas, se entrenan dos conjuntos de redes diferentes. La primera de ellas con discursos políticos; la segunda, que contaba con un caudal de muestras muy superior, con fragmentos retóricos de ligas de debates universitarias. El comportamiento de ambas redes ha sido sensiblemente diferente, entre otros motivos porque las muestras estudiantiles eran más heterogéneas y requerían de un mayor número de neuronas en las capas ocultas.Universidad Pablo de Olavide. Departamento de Filología y Traducció

    Reconocimiento y clasificación automatizada de entidades nombradas en documentos medievales (s. XIV): Libro Becerro de las Behetrías

    Get PDF
    Mención Internacional en el título de doctorLos seres humanos utilizamos el lenguaje como medio de comunicación, lo que ha favorecido el desarrollo y organización de la sociedad en las diferentes épocas de la historia. Reflejo de ello son los innumerables testimonios textuales que tuvieron su auge en la época medieval, momento de transición de una sociedad de transmisión básicamente oral a otra en la que imperaba lo escrito. El desarrollo de técnicas computacionales ha pasado a formar parte del escenario de investigación en las Humanidades. En el ámbito de estudio de los testimonios textuales de la época medieval, las técnicas de procesamiento del lenguaje natural (PLN) han transformado significativamente los métodos, abriendo la posibilidad de generar nuevas preguntas de investigación. El procesamiento del lenguaje natural (PLN) ofrece diferentes aplicaciones como la traducción automática, recuperación y extracción de información, reconocimiento del habla, minería de textos entre otras. Dentro de la extracción de información (Information Extraction- IE) se define la subtarea de reconocimiento y clasificación de entidades nombradas EN (Named Entities- NE) cuyo objetivo es principalmente la identificación de nombres propios de personas, lugares y organizaciones. Los sistemas para el reconocimiento y clasificación de EN (NERC- Named Entity Recognition and Classification) utilizan habitualmente técnicas basadas en gramáticas lingüísticas, métodos estadísticos y gazetteers o listados de términos. En esta tesis se propone un método para la explotación de corpus de documentación medieval mediante sistemas de PLN, con el objetivo de la identificación y clasificación automatizada de las EN y relaciones para su posterior puesta a disposición, en abierto, a través de una plataforma web. Para ello, se ha llevado a cabo un estudio de caso utilizando la aplicación Freeling para español estándar y la variante diacrónica del español de los siglos XII al XVI en un corpus formado por los documentos que componen el Libro Becerro de la Behetrías de Castilla, del siglo XIV. Mediante el análisis de los problemas surgidos en la anotación automática se elabora una propuesta de adaptación para el etiquetado de las EN que no contienen triggers denominadas simples y se diseña una aplicación para la identificación de las entidades anidadas o complejas y sus relaciones. Para la evaluación de los resultados obtenidos fue necesaria la elaboración de un corpus anotado de forma manual que constituyese un gold standard, que con los niveles obtenidos de precisión, cobertura y medida F (F-measure), permitieron elaborar de forma semiautomática los gazetters de personas, lugares y organizaciones. Para su almacenamiento se diseñó una base de datos relacional en MySQL que permitiese su publicación en una plataforma web en PHP. Esta plataforma ofrece una interfaz de consulta para los usuarios en general e investigadores de diferentes disciplinas, que cuenta además con la opción de descarga de los programas desarrollados y gazetteers elaborados. Esto la convierte a su vez en una fuente de información para la reutilización e integración de los mismos en otros proyectos dentro de las Humanidades Digitales. Los resultados obtenidos en este estudio de caso ponen de manifiesto que la aplicación de este método abre las posibilidades de investigación, con otros sistemas de PLN, en corpus de documentación medieval para el reconocimiento y extracción de ENs.Computer science developments are currently an integral part of Digital Humanities scholarship. In the field of medieval text analysis, Natural Language Processing research (NLP) is significantly transforming the methods of study, opening up the possibilities to ask new research questions. Natural Language Processing (NLP) techniques facilitate, among others, automatic translation, information extraction and retrieval, speech recognition, and text mining. This thesis proposes a method for applying NLP methods to a medieval document corpus using information extraction (IE) tasks, including named entity (NE) recognition, which aims to identify mainly proper names of persons, places and organizations and their classification. Named Entity Recognition and Classification methods (NERC) often use techniques based on linguistic grammars, statistic methods and gazetteers or term lists. The method proposed in this thesis facilitates the automatic identification and classification of named entities and their relationships, presenting a case study in which the application “Freeling” for standard Spanish, and the diachronic variant for Spanish language from the XII to XVI centuries have been used. The corpus consists of the documents from the “Libro Becerro de la Behetrías de Castilla”, from the XIV century. Via the analysis of the issues emerging from the automatic annotation of this corpus, this investigation proposes an adaptation for labeling the simple named entities, and presents an application developed for the identification of the nested and complex entities and their relationships. The results obtained in this work have been evaluated using a manually annotated corpus (gold standard), analyzing precision, coverage and variance (F values). The evaluated results facilitated the semi-automatic creation of gazetters for persons, places, and organizations. In addition to the method resulting from this investigation, the software and gazetters developed during this work are offered in a web service for free download and can be consulted by specialized or non-specialized researchers from different disciplines via a user-friendly interface. Together, the method, the data, and this implementation aim to open up the possibilities for further medieval documents research and experimentationPrograma Oficial de Doctorado en Documentación: Archivos y Bibliotecas en el Entorno DigitalPresidente: María Isabel C. Jular Pérez-Alfaro.- Secretario: Diego Navarro Bonilla.- Vocal: Francisco Carlos Palett

    Análisis filológico de las actas del cabildo de Mendoza (siglo XVI y XVII)

    Get PDF
    La investigación cuyos resultados constituyen el presente trabajo está organizada en torno a la lengua española que se empleaba en Mendoza a partir de 1561 y durante los decenios inmediatamente posteriores a su fundación. Se intenta describirla en momentos en que sufrió importantes modificaciones en su camino hacia el estado actual, buscando hallar alguna incidencia por parte del contexto geográfico y temporal y de las condiciones de vida de la comunidad de habla que la trajo a este medio árido y distante. Con este fin el abordaje se ha realizado sobre documentos escritos, las actas del cabildo mendocino, las cuales recogieron la cotidianeidad local a la par del lenguaje que fue constituyendo paulatinamente la identidad del colectivo urbano que podría denominarse “ser mendocino". El período elegido -que se desarrolló desde 1561 hasta el fin del XVII- fue tiempo de nutridos intercambios con Chile, de sostenimiento de la ciudad en un espacio caracterizado por la dificultad en el acceso a los recursos vitales mínimos, de generación de condiciones cualitativas de importancia (en cuanto al traslado hacia el oeste, de comercialización, de producción de bienes) que hicieran posible su continuidad y que, con el paso del tiempo, se constituyó en la clave en la explicación de las particularidades del habla local: “¿Hablamos así porque nos fundaron los chilenos?". Este trabajo se posiciona en la revisión crítica de esta explicación local con el propósito general de analizar la lengua del período perifundacional mendocino en la búsqueda de justificaciones válidas para algunos interrogantes vinculados con el proceso que diferenció la lengua local de la metropolitana, incluso hasta el punto de convertir a los hablantes locales en integrantes de una comunidad de habla o si siguieron siendo parte de la comunidad lingüística procedente de Chile; el grado de dinamismo con que la lengua en esta colonia se distinguió de la propia de los conquistadores; la incidencia posible del nuevo contexto de comunicación en el pasaje de la lengua recibida desde los fundadores hacia otro, con impronta local; la existencia de algún mecanismo de control que detuviera la variación lingüística en estos contextos o el modelo lingüístico que podrían haber representado los primeros pobladores de Mendoza.Fil: Ferro, Claudia M.. Universidad Nacional de Cuyo

    Análisis filológico de las actas del Cabildo de Mendoza

    Get PDF
    La tesis estudia el desenvolvimiento de la lengua española como lengua de implantación en Mendoza durante su periodo perifundacional. La fuente documental son las actas capitulares locales,que han contenido la lengua y permiten observar que en un punto tan distante y aislado de los centros de innovación lingüística, el español los derroteros de cambio evidente en el mundo panhispánico aunque generando cierta impronta conservadora.Fil: Ferro, Claudia María. Universidad Nacional de Cuyo. Facultad de Filosofía y Letras
    corecore