9 research outputs found

    Recipe instruction semantics corpus (RISeC) : resolving semantic structure and zero anaphora in recipes

    Get PDF
    We propose a newly annotated dataset for information extraction on recipes. Unlike previous approaches to machine comprehension of procedural texts, we avoid a priori pre-defining domain-specific predicates to recognize (e.g., the primitive instructionsin MILK) and focus on basic understanding of the expressed semantics rather than directly reduce them to a simplified state representation (e.g., ProPara). We thus frame the semantic comprehension of procedural text such as recipes, as fairly generic NLP subtasks, covering (i) entity recognition (ingredients, tools and actions), (ii) relation extraction (what ingredients and tools are involved in the actions), and (iii) zero anaphora resolution (link actions to implicit arguments, e.g., results from previous recipe steps). Further, our Recipe Instruction Semantic Corpus (RISeC) dataset includes textual descriptions for the zero anaphora, to facilitate language generation thereof. Besides the dataset itself, we contribute a pipeline neural architecture that addresses entity and relation extractionas well an identification of zero anaphora. These basic building blocks can facilitate more advanced downstream applications (e.g., question answering, conversational agents)

    The Terminology of Puerto Rican Gastronomy: Reflections on its Background and Representation

    Get PDF
    Nuestro estudio da cuenta del entramado que subyace a la terminología utilizada en cinco libros de recetas de Puerto Rico, publicados en momentos clave de la historia puertorriqueña: la década de los cincuenta del siglo xx, marcada por los cambios políticos en la isla, y la primera década del siglo xxi. Por medio del análisis de la terminología, a la luz de múltiples niveles de contexto, entre los que se incluye el contexto cultural, el dominio, la producción textual y el uso de los términos en el corpus, llegamos a conclusiones respecto a la conceptualización del dominio culinario en Puerto Rico. A partir de estos hallazgos, proponemos una base de datos terminológica que considera los aspectos culturalmente marcados de esta terminología. A fin de ilustrar la forma en que estos aspectos se integran en la investigación y en la forma en que se representa el conocimiento especializado en la base de datos, describimos, a modo de ejemplo, cómo inciden estos contextos en la configuración y representación de los términos que forman parte de la categoría de ingredientes denominados viandas.Our investigation looks into the background behind the terminology used in five Puerto Rican cookbooks, published in two key periods in Puerto Rico’s history: the fifties, a period characterized by political changes in the island, and the first decade of the 21st century. Based on a terminological analysis that takes into account different levels of context, including the cultural context, the culinary domain, the textual production, and the use of the terms in the corpus, we arrive at some/several conclusions regarding the conceptualization of the culinary domain in Puerto Rico. Finally, we propose a terminological database that considers the culture-specific aspects of this terminology. In order to illustrate the various levels of context and how they are incorporated in our research, as well as how the information is represented in the database, we describe how these levels of context influence the configuration and representation of the terms in the ingredient category identified as viandas

    Sistemas de recomendación en el contexto gastronómico: elaboración y enriquecimiento de un dataset de recetas de cocina

    Full text link
    El uso de sistemas de recomendación en Internet está teniendo una popularidad creciente y son utilizados en diferentes tipos de aplicaciones de la Web. En el contexto de la gastronomía, Internet ha contribuido a la diversidad en la cultura gastronómica de las personas, permitiendo que existan diversos tipos de aplicaciones orientadas a la gastronomía, como por ejemplo las redes sociales de cocina. Los sistemas de recomendación también han aterrizado en el ámbito de la gastronomía, posibilitando la existencia de aplicaciones en la Web que realizan sugerencias de platos de comida a los usuarios. En este trabajo se realiza un proceso completo de minería de datos, que abarca desde la adquisición de datos hasta la puesta en funcionamiento de modelos analíticos predictivos. El trabajo comienza con una revisión del estado del arte en los sistemas de recomendación en el contexto de la gastronomía, principalmente en la búsqueda de datos de recetas de comida que sean totalmente públicos y que cumplan una serie de requerimientos determinados. Ante la complejidad para encontrar este tipo de datos, se ha decidido realizar un proceso de extracción de información, a partir de una fuente de datos de recetas de comida, escogida como resultado de un análisis previo de las diferentes fuentes de datos que hay disponibles. La extracción de datos constituye la parte central de este trabajo, para lo cual se ha desarrollado un software automático que extrae los datos de manera incremental y automática. Este programa ha permitido la obtención de los datos requeridos, coleccionando un total de 362 usuarios, 12151 recetas y 495210 revisiones con rating asociado. El trabajo restante abarca el desarrollo y evaluación de dos sistemas de recomendación, basados en contenido, y utilizando los datos que se han obtenido previamente mediante el software de extracción de datos.The use of recommender systems on the Internet is experiencing a growing popularity as lots of applications across the Web are offering personalized content. In the context of gastronomy, the Internet has contributed positively to the diversity of the gastronomic culture around people, allowing the existence of many different gastronomy-oriented web applications on the Internet, such as cooking-oriented social networks. Recommender systems have also left a mark on gastronomy, since we can find on the Internet lots of applications suggesting food recipes to Internet users. In this work a complete data mining process is performed, starting from data acquisition and ending with the testing of various predictive models. This work starts with the revision of the state-of-the-art trends in gastronomy-oriented recommender systems, mainly focused on the search of any available public dataset about cooking recipes, given a set of restrictions. Given the difficulty at finding this kind of data, we have decided to develop a program to extract that data from a previously analyzed data source that met a set of requirements. The data extraction process is the main part of this work, and in order to get the required data we have developed a software that obtains that data in an incremental and automatic manner, using various scraping and crawling techniques. Through this program we have been able to collect a set of 362 users, 12151 cooking recipes and 495210 revisions with associated rating. The remaining part of this work is oriented to the development and evaluation of two content-based recommender systems that use the data previously gathered by the data extraction software developed

    Gastronomia digitale: un'analisi di food blog in Inglese come Lingua Franca e tradotti

    Get PDF
    La popolarità dei contenuti mediatici alimentari in generale, e dei food blog nello specifico, è in costante aumento. In un mondo globalizzato, non è raro che questi blog siano scritti o tradotti nella lingua ormai identificata come la lingua franca globale, l’inglese, da autori non madrelingua. Il presente elaborato indaga i tratti tipici del linguaggio dei food blogger nella traduzione e nella produzione in una lingua seconda. A questo fine, si è effettuata l’analisi di un corpus di food blog redatti da madrelingua italiani in inglese e tradotti verso l’inglese. L’analisi del corpus, composto da circa 200 testi e da un totale di 110.550 parole, è stata preceduta da un approfondimento sul tema dell’alimentazione e dei contenuti alimentari, tra cui i food blog. La prima fase dell’analisi si è concentrata sull’estrazione dei termini più ricorrenti nel corpus principale e nei suoi sottocorpora. Durante la seconda fase sono stati estratti i termini caratteristici del corpus principale mediante l’utilizzo di un corpus di riferimento comparabile di circa 184.000 parole, composto da 200 testi tratti da food blog in lingua inglese e incentrati sulla cucina italiana, redatti da blogger anglofoni. L’analisi ha evidenziato la presenza di numerosi temi ricorrenti all’interno del corpus, nonché di meccanismi linguistici caratteristici del genere del food blog. L’analisi ha inoltre evidenziato le differenze esistenti tra i sottocorpora del corpus principale e di riferimento, quali la prevalenza di determinate categorie grammaticali in un determinati sottocorpora. I dati ottenuti durante l’analisi contrastiva suggeriscono una consapevolezza del proprio pubblico di riferimento e del ruolo del blogger come divulgatore culturale, evidenziata dagli adattamenti nei contenuti diretti a un pubblico internazionale. I risultati dell’analisi hanno indicato l’influenza della madrelingua degli autori sui testi in lingua inglese, attraverso la presenza di fenomeni di contatto linguistico

    La terminología de la gastronomía puertorriqueña y su traducción al inglés

    Get PDF
    [ES] La cocina se presenta como un espacio en el que los alimentos se transforman en cultura. La receta, particularmente, aquella que se enmarca en el contexto de un libro vinculado a una cocina nacional, se configura como un acto de comunicación especializada en el que se integran el conocimiento técnico y la definición de la identidad. Estudiamos el entramado que subyace a la terminología utilizada en cinco libros de recetas de Puerto Rico, en su versión original y en su traducción al inglés. Los textos de los que extraemos los términos objeto de análisis se publicaron en momentos clave de la historia puertorriqueña: la década de los cincuenta del siglo XX, marcada por los cambios políticos en la isla con respecto a su relación con Estados Unidos, y la primera década del siglo XXI, momento en que el movimiento “foodie” se encuentra en auge. A fin de representar los términos en una base de datos terminológica que dé cuenta de las categorías y relaciones conceptuales del dominio, combinamos el estudio de corpus paralelos con fuentes de referencia, estudios semánticos y ontologías que describen el dominio culinario desde diferentes perspectivas. El estudio se inserta en los Estudios de Traducción y en la Terminología. [EN] In the kitchen, food transforms into culture. Recipes, particularly those framed in the context of recipe books linked to a national cuisine, stand as an act of specialized communication that combines technical knowledge with the definition of identity. We describe the framework that underlies the terminology used in a sample of recipes from five iconic Puerto Rican cookbooks, both in their original version in Spanish and in their English translation. The texts included in the corpus were published during key periods in Puerto Rican history, the fifties of the 20th century, an era marked by political changes on the island dealing with its relationship to the United States, and the first decade of the 21st century, a decade characterized by a “foodie boom”. In order to create a terminological database that gives an adequate account of the categories and conceptual relations of this domain, we combine the analysis of parallel corpora with lexicographic resources, semantic studies, and ontologies that describe the culinary domain from different points of view. The theoretical framework includes literature from both Translation Studies and Terminology
    corecore