1,464 research outputs found

    Methodologies for the Automatic Location of Academic and Educational Texts on the Internet

    Get PDF
    Traditionally online databases of web resources have been compiled by a human editor, or though the submissions of authors or interested parties. Considerable resources are needed to maintain a constant level of input and relevance in the face of increasing material quantity and quality, and much of what is in databases is of an ephemeral nature. These pressures dictate that many databases stagnate after an initial period of enthusiastic data entry. The solution to this problem would seem to be the automatic harvesting of resources, however, this process necessitates the automatic classification of resources as ‘appropriate’ to a given database, a problem only solved by complex text content analysis. This paper outlines the component methodologies necessary to construct such an automated harvesting system, including a number of novel approaches. In particular this paper looks at the specific problems of automatically identifying academic research work and Higher Education pedagogic materials. Where appropriate, experimental data is presented from searches in the field of Geography as well as the Earth and Environmental Sciences. In addition, appropriate software is reviewed where it exists, and future directions are outlined

    Methodologies for the Automatic Location of Academic and Educational Texts on the Internet

    Get PDF
    Traditionally online databases of web resources have been compiled by a human editor, or though the submissions of authors or interested parties. Considerable resources are needed to maintain a constant level of input and relevance in the face of increasing material quantity and quality, and much of what is in databases is of an ephemeral nature. These pressures dictate that many databases stagnate after an initial period of enthusiastic data entry. The solution to this problem would seem to be the automatic harvesting of resources, however, this process necessitates the automatic classification of resources as ‘appropriate’ to a given database, a problem only solved by complex text content analysis. This paper outlines the component methodologies necessary to construct such an automated harvesting system, including a number of novel approaches. In particular this paper looks at the specific problems of automatically identifying academic research work and Higher Education pedagogic materials. Where appropriate, experimental data is presented from searches in the field of Geography as well as the Earth and Environmental Sciences. In addition, appropriate software is reviewed where it exists, and future directions are outlined

    Functional Text Dimensions for the annotation of web corpora

    Get PDF
    This paper presents an approach to classifying large web corpora into genres by means of Functional Text Dimensions (FTDs). This offers a topological approach to text typology in which the texts are described in terms of their similarity to prototype genres. The suggested set of categories is designed to be applicable to any text on the web and to be reliable in annotation practice. Interannotator agreement results show that the suggested categories produce Krippendorff's α at above 0.76. In addition to the functional space of eighteen dimensions, similarity between annotated documents can be described visually within a space of reduced dimensions obtained through t-distributed Statistical Neighbour Embedding. Reliably annotated texts also provide the basis for automatic genre classification, which can be done in each FTD, as well as as within the space of reduced dimensions. An example comparing texts from the Brown Corpus, the BNC and ukWac, a large web corpus, is provided

    Financial English language for corporate banking website

    Get PDF
    PRESENTACIÓN La última década del pasado siglo y la primera del actual serán recordadas en un futuro próximo como el período de transición entre la era de papel y la era digital. Durante estos veinte años, casi todo el material de papel se ha reciclado en formato electrónico. Por este motivo, la mayoría de las empresas se han visto obligadas a modificar sus estructuras de trabajo para seguir siendo competitivas en el mercado internacional. A día de hoy, ya es una realidad que muchas de las empresas que no han actualizado sus sistemas de comunicación están tendiendo a desaparecer gradualmente o han pasado a ser sustituidas por alternativas más rentables. En este sentido, la banca es una de las industrias más poderosas en la actualidad, siendo organizaciones constituidas por sus gobiernos con la función de administrar y organizar la economía de un país y de sus ciudadanos. Por lo tanto, los bancos no podían quedarse atrás en este proceso de digitalización. Como resultado, todos ellos tienen sus propias páginas web, donde pueden promover su imagen y sus servicios en todo el mundo por un precio ridículo en comparación con las formas más tradicionales de publicidad. Esta tesis doctoral se centra en la realización de un análisis de género sobre el lenguaje utilizado por los bancos en sus páginas web corporativas. En este caso hemos elegido el inglés como lengua franca de las páginas web de banca corporativa, lo que podría ser una buena contribución al campo de la investigación lingüística, ya que combina tres elementos que son fundamentales en nuestra sociedad actual: inglés (idioma), Internet (comunicación) y bancos (economía). MARCO TEÓRICO Y OBJETIVOS DE LA INVESTIGACIÓN Para el desarrollo de este proyecto, nos centramos en la elaboración de un análisis de género que establezca el lenguaje utilizado por los bancos en sus páginas web corporativas (Bhatia, 1993; Dudley -Evans, 1986; Swales, 1990). La cantidad de bancos analizados en este estudio es de sesenta y cuatro. La elección de los mismos se ha basado en el estudio publicado por la revista The Banker (2010), que clasificó a los cincuenta bancos más poderosos del mundo. Los otros catorce bancos fueron seleccionados entre conocidos bancos británicos, americanos y españoles, por razones de proximidad y relevancia en nuestro estudio. Con el fin de ser más selectivos enmarcamos nuestro estudio en el espacio que utilizan los bancos para presentarse en sus páginas web: 'Quienes Somos¿ (`About us¿). La introducción de esta investigación incluye seis capítulos que presentan diferentes temas teóricos incluyendo el inglés como lengua franca (Crystal, 1997; Firth, 1996), el inglés bancario (Casu et al., 2006; Marks, 2007), las taxonomías y la tipología textual en inglés bancario (Ruiz Garrido, 2010; Palmer, 2010), al igual que otros elementos fundamentales para nuestros propósitos como son el tipo de lenguaje electrónico (O'Hare et al., 2004; Posteguillo, 2002; Yus, 2011), y el diseño de páginas web (Alejo - González, 2005). En este sentido, nuestro estudio se divide en dos partes que están claramente conectadas: macro y microestructura. Por un lado, el estudio de la macroestructura se centra en el análisis de las partes generales y estructurales de las páginas web corporativas de bancos. Por otra parte, la microestructura presenta las principales formas de lenguaje y el vocabulario utilizado en cada una de las secciones. Estas dos partes se complementan con un estudio acerca del formato no lingüístico de las páginas web de bancos. En definitiva, el objetivo de este estudio es determinar el tipo de lenguaje y la estructuración de las páginas web corporativas de los bancos. PLANTEAMIENTOS Y METODOLOGÍA UTILIZADA Como hemos explicado previamente, nuestro estudio se ha dividido en dos partes, la macroestructura y la microestructura. A continuación presentamos nuestro modelo de análisis de textos. En referencia al estudio de la macroestructura, nuestra tesis comenzó con un estudio inicial para determinar la sección `Quienes Somos¿ en las páginas web de los bancos analizados, y las diferentes sub-secciones que la forman. En este caso, descubrimos que algunas de estas sub-secciones debían ser obligatorias y algunas otras opcionales. Creemos que la razón para determinar si una sección es obligatoria u opcional variará de acuerdo a los intereses de la empresa y del tipo de información a publicar. De acuerdo con nuestros criterios, se estableció que la sección sería obligatoria si su presencia se observa en más del 50 % de las páginas analizadas. En este caso, esta información se incluirá en el documento. Por otro lado, hay otras secciones en la que su presencia es opcional, si el porcentaje se encuentra entre el 30 y el 50% de las páginas analizadas. El mostrar o no a los miembros del grupo depende de los intereses y necesidades personales de los bancos. En otras palabras, un banco no debe publicar una sección presentando los miembros del grupo o patrocinadores si éstos pueden dar lugar a una promoción negativa del banco. Una vez que hemos determinado la estructura de la página de inicio y los movimientos que forman la sección `Quienes Somos¿, nos centramos en las cuantificaciones de las formas en cada una de las sub-secciones que hemos considerado necesarias para formar lo que denominaremos como género: párrafos para texto, oraciones por párrafo, palabras por párrafo, y palabras por oración. Con estos resultados, tendremos una visión superficial del aspecto de la página web. La tercera parte del estudio para establecer el modelo de la macroestructura consiste en la búsqueda de los diferentes contenidos de los párrafos y las oraciones. Esta parte del análisis nos permitirá determinar los contenidos utilizados en cada tipo de documento y su extensión dentro de cada una de las secciones presentes en el género `Quienes Somos¿. Con este tercer análisis consideramos que la macroestructura del género lingüístico estará completa. Seguidamente, una vez completado el análisis de la macroestructura, empezamos a trabajar con la microestructura. En este caso, sugerimos que se desarrollen 5 apartados: tipo de lenguaje, composición morfológica, terminología, formalidad y sintaxis. En el análisis del tipo de lenguaje nos centraremos en cada una de las secciones para determinar si el lenguaje es informativo, promocional, persuasivo, o una combinación de cualquiera de los tres. En el caso de los bancos descubrimos que el lenguaje es una combinación de lenguaje informativo y promocional, y que tan sólo en una sección podemos defdinirlo como parcialmente persuasivo. Pensamos que el predominio del lenguaje informativo y promocional se basa en la necesidad de los bancos de presentarse como empresas serias con una información que debe parecer real y objetiva. No obstante, debemos tener en cuenta que los bancos son un tipo de negocio y, como tal, su principal objetivo es la obtención de beneficios. Por lo tanto, los bancos necesitan un lenguaje verdadero, seguro y atractivo al mismo tiempo (Casu et al, 2006). Creemos que el uso de lenguaje persuasivo no está conectado con la imagen que los bancos quieren mostrar, contrariamente a otros tipos de empresas, como las cadenas de restaurantes, bebidas, supermercados o productos electrónicos. Después de determinar el tipo de lenguaje en las diferentes secciones, continuamos nuestra investigación con un análisis de la composición morfológica de los diferentes movimientos que forman el género. En este caso, hemos clasificado las palabras en grupos morfológicos: sustantivos, verbos, conectores, adjetivos, adverbios, pronombres, artículos y preposiciones. Con estos resultados, podemos establecer porcentajes para determinar el valor de cada grupo morfológico en el modelo estándar del texto. Este análisis proporciona resultados con los elementos más comunes de cada categoría, lo que nos permite la creación de nuestro propio modelo. Por otra parte, la naturaleza de estas palabras se clasifica en categorías para determinar el tipo de terminología en base a la lengua analizada. En nuestro caso, los resultados mostraron que la terminología más usual estaba conectada a los negocios y la industria. Con los resultados sobre la morfología de los textos podremos analizar el nivel de formalidad en cada sección. Como era de esperar, el tipo de lenguaje encontrado en los bancos es muy formal. Este lenguaje está conectado a una industria muy exigente que busca seriedad y confianza. Por lo tanto, los bancos deben utilizar un nivel de formalidad ligado a la altura de las expectativas de los clientes. Los resultados mostraron un uso muy variado de nombres, artículos, adjetivos y preposiciones, y por el contrario una presencia limitada de verbos, adverbios, y pronombres. La metodología que hemos tomado en este análisis es la que presentaron Heylighen y Dewaelee (1999), quienes desarrollaron una fórmula con resultados porcentuales que evitan la ambigüedad, como es el caso de las 4 máximas de Grice (1975): "Formalidad = [(frecuencia nombres + frec. Artículos + frec. Adjetivos + frec. Preposiciones) - (freq. verbos + frec. Adverbios + frec. Pronombres) + 100] / 2" El último elemento de este análisis de la microestructura es la sintaxis. En este caso, y después de analizar todos los textos en cuanto a tipo de lenguaje, morfología, terminología y formalidad, llegamos a la conclusión de que la estructura habitual en estos documentos es el estándar de la lengua inglesa: sujeto + verbo + objeto + complementos. El alto porcentaje de formalidad en este tipo de documento en comparación con otros documentos de naturaleza diferente certifica el tipo de sintaxis estándar. Como complemento del análisis de la macroestructura y la microestructura, esta investigación no estaría completa sin un análisis del formato de las propias páginas web corporativas de los bancos. En este caso se estudiaron diferentes elementos de la página web como fuentes, colores y estilos. Los resultados mostraron que la mayoría de los textos utilizan la fuente Arial, con un tamaño de 12 en el texto y 14 en los encabezados, espaciado simple, y que el color de fuente es negro. Además, los encabezados deben ir en negrita. En referencia a los colores de la página, encontramos que el color primario tiende a ser blanco, acompañado de un color secundario que puede ser cualquiera de los siguientes: rojo, azul o verde. En función de las necesidades y los valores del banco se puede elegir cualquiera de los tres colores secundarios, pero de acuerdo con nuestro estudio, creemos que el color azul es el que mejor representa los principales valores bancarios. RESULTADOS Y CONCLUSIÓN Después de analizar toda la información y los datos que hemos recopilado para este estudio, podríamos desarrollar nuestras directrices para crear el género textual `Quienes Somos¿ para páginas web corporativas de bancos. No obstante, la validez de este modelo se debe presentar en un modelo práctico con el fin de demostrar que los resultados obtenidos podrían utilizarse en un contexto real. En este campo de investigación, hemos elaborado y aplicado todos los datos obtenidos en nuestro estudio tanto sobre la macroestructura, la microestructura y el formato, y hemos creado la sección `Quién Somos¿ de un banco ficticio que hemos denominado 'Standard Bank'. Este banco ficticio incluye todas las secciones obligatorias y opcionales dentro del género con el fin de mostrar los resultados obtenidos. En primer lugar, hemos diseñado la macroestructura de cada sección, con la cantidad de párrafos, oraciones, palabras y el tipo de contenidos que hemos determinado en nuestro modelo estándar. Seguidamente, desarrollamos el lenguaje y el contenido de cada sección individualmente siguiendo los criterios que hemos establecido en cada una de las secciones de la microestructura. De este modo, podemos desarrollar los contenidos específicos de cada sección teniendo en cuenta el tipo de lenguaje de cada párrafo (informativo, persuasivo o promocional), así como la terminología específica. Tras la elaboración del primer borrador, analizamos y comparamos los resultados con el modelo estándar para hacer las modificaciones pertinentes en relación a la morfología, sintaxis y terminología. La validez de los textos se puede llevar a cabo una vez se ha finalizado la redacción del texto para cada sección. Simplemente comparamos los resultados del modelo estándar creado con el texto final. En el caso de la macroestructura la validez es fácil de evaluar, al contrario que con la microestructura. En este caso, intentaremos que ninguno de los parámetros del texto creado varíe por encima de dos puntos del valor porcentual del modelo estándar. Finalmente, a pesar de algunas limitaciones y dificultades que pudimos encontrar en el proceso de elaboración y desarrollo de este proyecto, hemos sido finalmente capaces de crear un modelo práctico del género `Quienes Somos¿ para páginas web corporativas de bancos, siguiendo los resultados que establecimos en nuestro modelo estándar, tanto en relación a la macroestructura y microestructura, así como en el formato de la página web. La aplicación de los resultados en la página web corporativa de un banco ficticio demuestra la validez de nuestros resultados y la posibilidad de aplicar nuestra metodología a la creación de textos estándar para lenguajes específicos. En resumen, este proyecto demuestra la posibilidad de establecer modelos estándar de la lengua inglesa en páginas web de bancos. Este tipo de proyecto es positivo para las empresas e instituciones que necesitan mejorar la comunicación con los clientes. Consideramos que las empresas multinacionales y locales deberían valorar la posibilidad de trabajar con lingüistas profesionales, que puedan desarrollar un estudio personalizado de las necesidades de la empresa y trabajar en conjunto con los expertos de marketing con el fin de presentar los productos con un lenguaje adecuado y adaptado, siguiendo unos criterios estándar predeterminados

    Financial English language for corporate banking website

    Get PDF
    PRESENTACIÓN La última década del pasado siglo y la primera del actual serán recordadas en un futuro próximo como el período de transición entre la era de papel y la era digital. Durante estos veinte años, casi todo el material de papel se ha reciclado en formato electrónico. Por este motivo, la mayoría de las empresas se han visto obligadas a modificar sus estructuras de trabajo para seguir siendo competitivas en el mercado internacional. A día de hoy, ya es una realidad que muchas de las empresas que no han actualizado sus sistemas de comunicación están tendiendo a desaparecer gradualmente o han pasado a ser sustituidas por alternativas más rentables. En este sentido, la banca es una de las industrias más poderosas en la actualidad, siendo organizaciones constituidas por sus gobiernos con la función de administrar y organizar la economía de un país y de sus ciudadanos. Por lo tanto, los bancos no podían quedarse atrás en este proceso de digitalización. Como resultado, todos ellos tienen sus propias páginas web, donde pueden promover su imagen y sus servicios en todo el mundo por un precio ridículo en comparación con las formas más tradicionales de publicidad. Esta tesis doctoral se centra en la realización de un análisis de género sobre el lenguaje utilizado por los bancos en sus páginas web corporativas. En este caso hemos elegido el inglés como lengua franca de las páginas web de banca corporativa, lo que podría ser una buena contribución al campo de la investigación lingüística, ya que combina tres elementos que son fundamentales en nuestra sociedad actual: inglés (idioma), Internet (comunicación) y bancos (economía). MARCO TEÓRICO Y OBJETIVOS DE LA INVESTIGACIÓN Para el desarrollo de este proyecto, nos centramos en la elaboración de un análisis de género que establezca el lenguaje utilizado por los bancos en sus páginas web corporativas (Bhatia, 1993; Dudley -Evans, 1986; Swales, 1990). La cantidad de bancos analizados en este estudio es de sesenta y cuatro. La elección de los mismos se ha basado en el estudio publicado por la revista The Banker (2010), que clasificó a los cincuenta bancos más poderosos del mundo. Los otros catorce bancos fueron seleccionados entre conocidos bancos británicos, americanos y españoles, por razones de proximidad y relevancia en nuestro estudio. Con el fin de ser más selectivos enmarcamos nuestro estudio en el espacio que utilizan los bancos para presentarse en sus páginas web: 'Quienes Somos¿ (`About us¿). La introducción de esta investigación incluye seis capítulos que presentan diferentes temas teóricos incluyendo el inglés como lengua franca (Crystal, 1997; Firth, 1996), el inglés bancario (Casu et al., 2006; Marks, 2007), las taxonomías y la tipología textual en inglés bancario (Ruiz Garrido, 2010; Palmer, 2010), al igual que otros elementos fundamentales para nuestros propósitos como son el tipo de lenguaje electrónico (O'Hare et al., 2004; Posteguillo, 2002; Yus, 2011), y el diseño de páginas web (Alejo - González, 2005). En este sentido, nuestro estudio se divide en dos partes que están claramente conectadas: macro y microestructura. Por un lado, el estudio de la macroestructura se centra en el análisis de las partes generales y estructurales de las páginas web corporativas de bancos. Por otra parte, la microestructura presenta las principales formas de lenguaje y el vocabulario utilizado en cada una de las secciones. Estas dos partes se complementan con un estudio acerca del formato no lingüístico de las páginas web de bancos. En definitiva, el objetivo de este estudio es determinar el tipo de lenguaje y la estructuración de las páginas web corporativas de los bancos. PLANTEAMIENTOS Y METODOLOGÍA UTILIZADA Como hemos explicado previamente, nuestro estudio se ha dividido en dos partes, la macroestructura y la microestructura. A continuación presentamos nuestro modelo de análisis de textos. En referencia al estudio de la macroestructura, nuestra tesis comenzó con un estudio inicial para determinar la sección `Quienes Somos¿ en las páginas web de los bancos analizados, y las diferentes sub-secciones que la forman. En este caso, descubrimos que algunas de estas sub-secciones debían ser obligatorias y algunas otras opcionales. Creemos que la razón para determinar si una sección es obligatoria u opcional variará de acuerdo a los intereses de la empresa y del tipo de información a publicar. De acuerdo con nuestros criterios, se estableció que la sección sería obligatoria si su presencia se observa en más del 50 % de las páginas analizadas. En este caso, esta información se incluirá en el documento. Por otro lado, hay otras secciones en la que su presencia es opcional, si el porcentaje se encuentra entre el 30 y el 50% de las páginas analizadas. El mostrar o no a los miembros del grupo depende de los intereses y necesidades personales de los bancos. En otras palabras, un banco no debe publicar una sección presentando los miembros del grupo o patrocinadores si éstos pueden dar lugar a una promoción negativa del banco. Una vez que hemos determinado la estructura de la página de inicio y los movimientos que forman la sección `Quienes Somos¿, nos centramos en las cuantificaciones de las formas en cada una de las sub-secciones que hemos considerado necesarias para formar lo que denominaremos como género: párrafos para texto, oraciones por párrafo, palabras por párrafo, y palabras por oración. Con estos resultados, tendremos una visión superficial del aspecto de la página web. La tercera parte del estudio para establecer el modelo de la macroestructura consiste en la búsqueda de los diferentes contenidos de los párrafos y las oraciones. Esta parte del análisis nos permitirá determinar los contenidos utilizados en cada tipo de documento y su extensión dentro de cada una de las secciones presentes en el género `Quienes Somos¿. Con este tercer análisis consideramos que la macroestructura del género lingüístico estará completa. Seguidamente, una vez completado el análisis de la macroestructura, empezamos a trabajar con la microestructura. En este caso, sugerimos que se desarrollen 5 apartados: tipo de lenguaje, composición morfológica, terminología, formalidad y sintaxis. En el análisis del tipo de lenguaje nos centraremos en cada una de las secciones para determinar si el lenguaje es informativo, promocional, persuasivo, o una combinación de cualquiera de los tres. En el caso de los bancos descubrimos que el lenguaje es una combinación de lenguaje informativo y promocional, y que tan sólo en una sección podemos defdinirlo como parcialmente persuasivo. Pensamos que el predominio del lenguaje informativo y promocional se basa en la necesidad de los bancos de presentarse como empresas serias con una información que debe parecer real y objetiva. No obstante, debemos tener en cuenta que los bancos son un tipo de negocio y, como tal, su principal objetivo es la obtención de beneficios. Por lo tanto, los bancos necesitan un lenguaje verdadero, seguro y atractivo al mismo tiempo (Casu et al, 2006). Creemos que el uso de lenguaje persuasivo no está conectado con la imagen que los bancos quieren mostrar, contrariamente a otros tipos de empresas, como las cadenas de restaurantes, bebidas, supermercados o productos electrónicos. Después de determinar el tipo de lenguaje en las diferentes secciones, continuamos nuestra investigación con un análisis de la composición morfológica de los diferentes movimientos que forman el género. En este caso, hemos clasificado las palabras en grupos morfológicos: sustantivos, verbos, conectores, adjetivos, adverbios, pronombres, artículos y preposiciones. Con estos resultados, podemos establecer porcentajes para determinar el valor de cada grupo morfológico en el modelo estándar del texto. Este análisis proporciona resultados con los elementos más comunes de cada categoría, lo que nos permite la creación de nuestro propio modelo. Por otra parte, la naturaleza de estas palabras se clasifica en categorías para determinar el tipo de terminología en base a la lengua analizada. En nuestro caso, los resultados mostraron que la terminología más usual estaba conectada a los negocios y la industria. Con los resultados sobre la morfología de los textos podremos analizar el nivel de formalidad en cada sección. Como era de esperar, el tipo de lenguaje encontrado en los bancos es muy formal. Este lenguaje está conectado a una industria muy exigente que busca seriedad y confianza. Por lo tanto, los bancos deben utilizar un nivel de formalidad ligado a la altura de las expectativas de los clientes. Los resultados mostraron un uso muy variado de nombres, artículos, adjetivos y preposiciones, y por el contrario una presencia limitada de verbos, adverbios, y pronombres. La metodología que hemos tomado en este análisis es la que presentaron Heylighen y Dewaelee (1999), quienes desarrollaron una fórmula con resultados porcentuales que evitan la ambigüedad, como es el caso de las 4 máximas de Grice (1975): "Formalidad = [(frecuencia nombres + frec. Artículos + frec. Adjetivos + frec. Preposiciones) - (freq. verbos + frec. Adverbios + frec. Pronombres) + 100] / 2" El último elemento de este análisis de la microestructura es la sintaxis. En este caso, y después de analizar todos los textos en cuanto a tipo de lenguaje, morfología, terminología y formalidad, llegamos a la conclusión de que la estructura habitual en estos documentos es el estándar de la lengua inglesa: sujeto + verbo + objeto + complementos. El alto porcentaje de formalidad en este tipo de documento en comparación con otros documentos de naturaleza diferente certifica el tipo de sintaxis estándar. Como complemento del análisis de la macroestructura y la microestructura, esta investigación no estaría completa sin un análisis del formato de las propias páginas web corporativas de los bancos. En este caso se estudiaron diferentes elementos de la página web como fuentes, colores y estilos. Los resultados mostraron que la mayoría de los textos utilizan la fuente Arial, con un tamaño de 12 en el texto y 14 en los encabezados, espaciado simple, y que el color de fuente es negro. Además, los encabezados deben ir en negrita. En referencia a los colores de la página, encontramos que el color primario tiende a ser blanco, acompañado de un color secundario que puede ser cualquiera de los siguientes: rojo, azul o verde. En función de las necesidades y los valores del banco se puede elegir cualquiera de los tres colores secundarios, pero de acuerdo con nuestro estudio, creemos que el color azul es el que mejor representa los principales valores bancarios. RESULTADOS Y CONCLUSIÓN Después de analizar toda la información y los datos que hemos recopilado para este estudio, podríamos desarrollar nuestras directrices para crear el género textual `Quienes Somos¿ para páginas web corporativas de bancos. No obstante, la validez de este modelo se debe presentar en un modelo práctico con el fin de demostrar que los resultados obtenidos podrían utilizarse en un contexto real. En este campo de investigación, hemos elaborado y aplicado todos los datos obtenidos en nuestro estudio tanto sobre la macroestructura, la microestructura y el formato, y hemos creado la sección `Quién Somos¿ de un banco ficticio que hemos denominado 'Standard Bank'. Este banco ficticio incluye todas las secciones obligatorias y opcionales dentro del género con el fin de mostrar los resultados obtenidos. En primer lugar, hemos diseñado la macroestructura de cada sección, con la cantidad de párrafos, oraciones, palabras y el tipo de contenidos que hemos determinado en nuestro modelo estándar. Seguidamente, desarrollamos el lenguaje y el contenido de cada sección individualmente siguiendo los criterios que hemos establecido en cada una de las secciones de la microestructura. De este modo, podemos desarrollar los contenidos específicos de cada sección teniendo en cuenta el tipo de lenguaje de cada párrafo (informativo, persuasivo o promocional), así como la terminología específica. Tras la elaboración del primer borrador, analizamos y comparamos los resultados con el modelo estándar para hacer las modificaciones pertinentes en relación a la morfología, sintaxis y terminología. La validez de los textos se puede llevar a cabo una vez se ha finalizado la redacción del texto para cada sección. Simplemente comparamos los resultados del modelo estándar creado con el texto final. En el caso de la macroestructura la validez es fácil de evaluar, al contrario que con la microestructura. En este caso, intentaremos que ninguno de los parámetros del texto creado varíe por encima de dos puntos del valor porcentual del modelo estándar. Finalmente, a pesar de algunas limitaciones y dificultades que pudimos encontrar en el proceso de elaboración y desarrollo de este proyecto, hemos sido finalmente capaces de crear un modelo práctico del género `Quienes Somos¿ para páginas web corporativas de bancos, siguiendo los resultados que establecimos en nuestro modelo estándar, tanto en relación a la macroestructura y microestructura, así como en el formato de la página web. La aplicación de los resultados en la página web corporativa de un banco ficticio demuestra la validez de nuestros resultados y la posibilidad de aplicar nuestra metodología a la creación de textos estándar para lenguajes específicos. En resumen, este proyecto demuestra la posibilidad de establecer modelos estándar de la lengua inglesa en páginas web de bancos. Este tipo de proyecto es positivo para las empresas e instituciones que necesitan mejorar la comunicación con los clientes. Consideramos que las empresas multinacionales y locales deberían valorar la posibilidad de trabajar con lingüistas profesionales, que puedan desarrollar un estudio personalizado de las necesidades de la empresa y trabajar en conjunto con los expertos de marketing con el fin de presentar los productos con un lenguaje adecuado y adaptado, siguiendo unos criterios estándar predeterminados

    Crowdsourcing for web genre annotation

    Get PDF
    Recently, genre collection and automatic genre identification for the web has attracted much attention. However, currently there is no genre-annotated corpus of web pages where inter-annotator reliability has been established, i.e. the corpora are either not tested for inter-annotator reliability or exhibit low inter-coder agreement. Annotation has also mostly been carried out by a small number of experts, leading to concerns with regard to scalability of these annotation efforts and transferability of the schemes to annotators outside these small expert groups. In this paper, we tackle these problems by using crowd-sourcing for genre annotation, leading to the Leeds Web Genre Corpus—the first web corpus which is, demonstrably reliably annotated for genre and which can be easily and cost-effectively expanded using naive annotators. We also show that the corpus is source and topic diverse

    Scientific dissemination and professional practices through digital media: The study of pragmatic strategies in the communication of international research projects

    Get PDF
    La investigación científica hoy en día está ligada a los procesos de globalización y a la búsqueda de la innovación y la excelencia, lo cual favorece una creciente colaboración, internacionalización y multidisciplinariedad. Para llevar a cabo estas iniciativas ambiciosas y de gran escala, los investigadores necesitan la financiación externa que distintas organizaciones, instituciones y programas pueden proporcionar. Esta reconfiguración del trabajo académico va de la mano de la ubiquidad y popularidad de Internet. Un extenso abanico de géneros, plataformas y medios digitales permiten a los científicos y académicos difundir sus investigaciones a una audiencia amplia y heterogénea. La inversión de esfuerzo en la comunicación mediada digitalmente permite a los investigadores contribuir a una diseminación más efectiva del conocimiento generado, así como cumplir con su compromiso social. Por otra parte, este esfuerzo les puede permitir reforzar su reputación como investigadores y conseguir un mayor impacto. Un ejemplo destacado de este escenario académico cambiante donde se maximiza el discurso digital para propósitos investigadores es el de los proyectos de investigación internacionales. Se trata de consorcios compuestos de miembros provenientes de entornos socioculturales y profesionales distintos que hacen uso de sitios web y redes sociales para la diseminación de sus proyectos conjuntos y utilizan las características tecnológicas y comunicativas de estos espacios digitales para ofrecer actualizaciones periódicas de su trabajo e información sobre hallazgos en progreso y resultados de investigación. De este modo, rinden cuentas a los organismos que los financian y aumentan su visibilidad entre los lectores digitales. Las intenciones comunicativas de estos equipos de investigación para cumplir dichos objetivos se codifican y transmiten discursivamente a través de diversas estrategias pragmáticas, que se encuadran en determinados parámetros contextuales y que responden a las especificidades del medio y se ven constreñidas por estas. Estas estrategias revelan cómo los investigadores comparten la información, cómo publicitan sus hallazgos y cómo se dirigen a sus potenciales lectores.Así, esta tesis doctoral tiene como objetivo investigar las estrategias pragmáticas prominentes en lengua inglesa empleadas por grupos de investigación internacionales en sus prácticas digitales discursivas, que normalmente se materializan en sitios webs y redes sociales para sus proyectos. Con este propósito, se compiló y analizó el corpus digital EUROPRO, que contiene 30 sitios web de proyectos de investigación que recibieron financiación en el marco del programa Horizonte2020 (subcorpus EUROPROwebs) y las correspondientes cuentas de Twitter de aquellos proyectos (subcorpus EUROPROtweets). Dichos subcorpus han sido extraídos de la base de datos digital EUROPRO recopilada por el grupo de investigación InterGedi. En mi tesis doctoral propongo una taxonomía derivada de los datos como resultado del análisis del corpus, que comprende 27 estrategias organizadas en torno a tres macrocategorías: informativas, promocionales e interaccionales. Incido teórica y metodológicamente en el proceso de diseñar y revisar esta herramienta analítica para así demonstrar su solidez y viabilidad. Además, analizo el rango de ocurrencia, la frecuencia y el uso específico de estas estrategias en las secciones que aparecen de manera sistemática en los sitios web incluidos en el corpus y en las páginas web donde se aloja la mayor parte de la información sobre el proyecto (Homepage, About, Partners, News & Events), en las cuentas de Twitter y, de forma comparativa, entre las secciones web y los tuits, con el fin de observar tendencias significativas y en cuanto a similitudes y diferencias en su funcionamiento en estos medios digitales. Además, adopto un enfoque etnográfico mediante la inclusión de evidencias contextuales conseguidas a través de entrevistas semi-estructuradas con investigadores de los proyectos Horizonte2020, cuyos resultados ayudan a sustentar los hallazgos procedentes del análisis textual. También tomo una perspectiva multimodal sobre cómo se emplean las estrategias pragmáticas en los sitios web de proyectos de investigación en relación a la sección Homepages. Este análisis, en concreto, permite reconocer el potencial de los recursos verbales y visuales para la construcción de significado desde una perspectiva pragmática. En general, el presente estudio busca ahondar en nuestro entendimiento de prácticas académicas digitales que están evolucionando rápidamente y que tienen gran alcance, en particular adoptadas por grupos de investigación, que pueden beneficiarse de los resultados y las implicaciones de esta investigación para la futura comunicación y diseminación de sus proyectos científicos.<br /

    Active tourism: a linguistic-textual contrastive analysis of trail guides in Spanish and English

    Get PDF
    This undergraduate dissertion aims to provide a linguistic and textual contrastive analysis of Spanish and English online trail guides within the active tourism genre considering the scarcity of literature from the point of view of translation studies and contrastive analysis in this specific field. Trail guides are a touristic subgenre that includes a description of the itinerary and the surroundings of a trail or walk. In order to carry out my analysis, I have focused on the linguistic and textual features of the texts -selected from five websites-, and then I have analyzed and compared the results obtained. After having analyzed and compared the results, I have presented my complementary purpose, which is to provide a translation proposal of a text beloning to a Spanish website that has not been translated so far.El objetivo de este trabajo de fin de grado es proporcionar un análisis lingüístico y textual de las guías en formato online sobre rutas correspondientes al género del turismo activo teniendo en cuenta la escasez de estudios de traducción y análisis contrastivo relativo a este campo. Las guías sobre rutas son un subgénero del turismo que incluyen una descripción del recorrido y los alrededores de la ruta o senda. Para llevar a cabo mi análisis, me he centrado en los aspectos lingüísticos y textuales de los textos -obtenidos de cinco páginas web-, y, a continuación, he analizado y comparado los resultados. Después de haber analizado y comparado los resultados, he presentado mi objetivo complementario, el cual consiste en ofrecer una propuesta de traducción de un texto perteneciente a una página web en español, la cual no se ha traducido hasta ahora.Departamento de Filología InglesaGrado en Estudios Inglese
    corecore