「決定木」分析によるコーパス研究の可能性--副詞と共起する接続助詞「から」「ので」「のに」の文中・文末表現を例に

自然言語処理 13 巻 2 号 169-179 頁 2006-04 発行
アクセス数 : 1473
ダウンロード数 : 509

今月のアクセス数 : 8
今月のダウンロード数 : 3
ファイル情報(添付)
13407619_13_2_169_tamaoka.pdf 640 KB 種類 : 全文
タイトル ( jpn )
「決定木」分析によるコーパス研究の可能性--副詞と共起する接続助詞「から」「ので」「のに」の文中・文末表現を例に
タイトル ( eng )
Possibility of 'Decision Tree' Analysis on Collocation Frequencies: In the Case of conjunctive Particles kara, node and noni co-occurring with Adverbs at the Middle and End of Sentences
作成者
玉岡 賀津雄
収録物名
自然言語処理
13
2
開始ページ 169
終了ページ 179
抄録
SPSS社のAnswerTree3.0Jに搭載されたCHAIDで決定木を描く統計手法が、コーパスから得られる2つ以上の変数からなる共起頻度を分析するのに有効であるかどうかを検討した。本研究では、3種類の接続助詞「から」「ので」「のに」が、7種類の副詞「何しろ」「何せ」「せっかく」「現に」「どうせ」「実際」「本当に」と共起する場合に、文中と文末の表現でどちらが使われるかを、新潮文庫の100冊を使って解析した。決定木(図1を参照)は、3種類の接続助詞と7種類の副詞の共起頻度によって、接続助詞の位置が文中にくるか文末にくるかを予測するという分析結果を描いたものである。決定木から5つの特徴を読み取ることができる。まず第1に、接続助詞「ので」と「から」が副詞との共起頻度において文中・文末で顕著な違いを示した。「ので」は文末ではほとんどみられず(5回あるいは4.59%)、「から」は頻繁にみられた(220回あるいは31.56%)。第2に、副詞「何しろ」と接続助詞「から」がもっとも典型的な文末表現であることが分かった(この種の組み合わせの合計324回のうち140回あるいは43.21%)。第3に、接続助詞「から」と副詞の「せっかく」の共起は、かなりあるものの、文末では非常に少ないことも分かった(この種の組み合わせの合計67回のうち6回あるいは8.96%)。第4に、接続助詞「から」と副詞「何せ」「現に」「どうせ」「実際」「本当に」はいずれも、文中・文末にほぼ同じようなパターンで共起していることも示された。第5に、接続助詞「のに」は副詞の文中・文末の共起パターン(文中が78.82%、文末が21.18%)が、全体の共起頻度(文中が72.73%、文末が27.27%)と類似していた。以上のように、AnswerTree3.0Jによる決定木の手法は、複数の変数からなる共起頻度データを構造的に分析することができ、今後のコーパス研究において有効な手段の一つとなるであろう。
Using 'decision tree' drawn by a statistical algorism CHAID in SPSS AnswerTree3.0J, the present study investigated the collocation frequencies of three conjunctive particles(kara, node and noni) appearing in the middle of at the end of sentences, with seven selected adverbs(nanishiro, nanise, sekkaku, gen'ni, doose, jissai, and hontooni). Collocation frequencies were taken from the corpus of the Shinchoo Bunko Collection of 100 Novels. Analysis results depicted in the decision tree predict two different particle positions(middle and end) of three conjunctive particles appearing with the seven adverbs. Five noteworthy collocation tendencies were observed. First, the conjunctive particles node and kara showed distinctive differences in the middle and ending positions when appearing with the adverbs: node was seldom seen at the end of sentences(5 times, or 4.59%), while kara was often seen at the end (220times, or 31.56%). Second, the combination of the adverb nanishiro and the conjunctive particle kara occurred most frequently at the end of sentences(140 out of 324 times, or 43.21%). Third, although kara occasionally appeared with the adverb sekkaku, this combination was seldom observed at the end of sentences(6 out of 67 times, or 8.96%). fourth, the conjunctive particle kara showed a similar pattern of collocation frequencies in the middle and at the end of sentences when combined with the five adverbs nanise, gen'ni, doose, jissai and hontooni.Fifth, the conjunctive particle noni appeared in the middle and at the end of sentences(78.82 0n the middle and 21.18-0x1.47b00bfff994p-149t the end), similar to the overall percentages of the conjunctive particles(72.73-1073777684n the middle and 27.27 0x0.006c8000006c9p-1022t the end). As such, in structurally depicting the collocation frequencies of conjunctive particles and adverbs, 'decision tree' analysis has considerable potential as a statistical approachi in duture collocation studies.
著者キーワード
決定木
SPSS Answer Tree
共起頻度
接続助詞
副詞
文末表現
decision tree
collocation frequency
conjunctive particles
adverbs
ending expression
NDC分類
日本語 [ 810 ]
言語
日本語
資源タイプ 学術雑誌論文
発行日 2006-04
出版タイプ Version of Record(出版社版。早期公開を含む)
アクセス権 オープンアクセス
収録物識別子
[ISSN] 1340-7619
[NCID] AN10472659