5,678 research outputs found

    Comparison of Multivariate Data Analysis Methodsin Corpus Linguistics: Principal Component Analysis vs. Correspondence Analysis

    Get PDF
    本研究では,コーパス言語学において,多変量解析の手法として使用されることの多い,(a) 主成分分析,(b) コレスポンデンス分析,(c) 行列データを転置して行う主分分析の3つの結果を比較した。その結果,コレスポンデンス分析が変数間の差異を調べるような研究ではふさわしいということが確認されたが,目的に応じて使い分けることが重要であるということも示唆された。This paper reports on a comparison of multivariate data analysis methods in corpus linguistics: principal component analysis, correspondence analysis, and principal component analysis with transposed matrix. The results show that correspondence analysis is the most suitable method for exploring the differences among variables

    主成分分析による地域経済特性の計測

    Get PDF

    Using Multivariate Data Analyses to Categorize Subcorpora of the PERC Corpus

    Get PDF
    本研究は,世界でも最大の科学技術英語コーパスであるPERCコーパスの領域(サブ・コーパス)が,どのように分類できるか,多変量解析を用いて検討することを目的とした。PERCコーパスの22領域における高頻度語を用い,機能語を除く上位200語を分析対象として,(a) クラスター分析,(b) 因子分析,(c) 主成分分析,(d) コレスポンデンス分析の4 つを行った。その結果,それぞれの方法で目的に合わせて領域分類が行えることが確認され,PERC コーパスはESP(EAP)において利用価値が高い言語資料であるということが確認された。The purpose of current study is to investigate how subcorpora of the PERC Corpus can be categorized into registers by using a multivariate data analysis approach. The most frequent words, excluding function words, were used for the following analyses: cluster analysis, factor analysis, principal component analysis, and correspondence analysis. The results show that the PERC Corpus can be categorized into reasonable groups and that it is a very valuable source of ESP (EAP) discourse

    Decision of Number of Systematic Factors Based on Principal Component Analysis when Factor Model is Introduced

    Get PDF
    信用ポートフォリオ・リスクを評価する際、一般に、各債務者の資産収益率を複数の市場変動要因(システマティック・リスクファクター)と1つの債務者固有の変動要因の線型和でモデル化するが、ファクター間の依存構造を所与としたとき、ファクター数とリスク量の関係を調べることは、リスク管理上重要な課題である。本稿では、主成分分析に基づくファクター数決定モデルにより、独立なファクターの数とリスク量との関係を調べる。また、比較として、ファクター間の相関を考慮したモデルを用いて、依存構造の違いがリスク量に与える影響を調べる。研究論

    Cognitive mechanisim underlying reading behavior (2) : the development of scales for reading behavior

    Get PDF
    The purpose of the present study was to develop two kinds of scales to measure reading behavior. Two scales were constructed to measure reading behavior and motive for reading behavior. The scale items were based on items written by Hirayama (2004, 2005). Female undergraduates (N=201) completed those scales. The principal component analyses (with promax rotations) of those scales yielded six components, respectively. According to the secondary component analyses, those components were divided into two categories : achievement and consumption. The significance of this research was discussed from the point of view of Deci\u27s intrinsic motivation theory.原著論

    Applying Statistical Methods to Develop a Better Vocabulary List

    Get PDF
    これまでに数多くの学習語彙表が開発されているが,より良い語彙表を作るために,既存の語彙表における情報を統計的手法によって統合しているような研究はほとんどない。本研究では,基礎語の抽出のために,いくつかの語彙表などにおける語彙の特徴指標を統合し,より良い学習語彙表を開発するための統計的手法の検討を行うことを目的とした。まず,中学校主要英語教科書をコーパス化したものの頻度を基にした語彙表を作成し,いくつかの既存の語彙表や語に対する親密度,語の長さなどを語の特徴指標とし,それらをクラスター分析によってどのように分類できるのか確認し,因子分析によって潜在的な因子を調査した。いくつかの指標を統合するためには主成分分析が試された。結果として,これらの手法により,より良い学習語彙表が開発できるのではないかという可能性が示唆された。Many word lists for educational purposes have been developed thus far. However, no attempt has been made to integrate the information on the other word lists in the past with a statistical approach. The purpose of this study was thus to suggest statisticalmethods to incorporate several measures of individual words in order to develop a betterbasic word list. To this end, a junior high school textbook corpus was utilized to make afrequency-based word list out of it. The characteristics indices of vocabulary in this study include figures such as ranks or word levels in other word lists, word familiarity, and word length. With cluster analysis and factor analysis, categorization and latent factors behind these characteristics were examined. For the purpose of integrating the several measures for each word, principal component analysis was employed. The results suggest that the methods proposed here are promising in developing a better vocabulary list
    corecore