「決定木」分析によるコーパス研究の可能性--副詞と共起する接続助詞「から」「ので」「のに」の文中・文末表現を例に

自然言語処理 Volume 13 Issue 2 Page 169-179 published_at 2006-04
アクセス数 : 1388
ダウンロード数 : 460

今月のアクセス数 : 0
今月のダウンロード数 : 0
File
13407619_13_2_169_tamaoka.pdf 640 KB 種類 : fulltext
Title ( jpn )
「決定木」分析によるコーパス研究の可能性--副詞と共起する接続助詞「から」「ので」「のに」の文中・文末表現を例に
Title ( eng )
Possibility of 'Decision Tree' Analysis on Collocation Frequencies: In the Case of conjunctive Particles kara, node and noni co-occurring with Adverbs at the Middle and End of Sentences
Creator
Tamaoka Katsuo
Source Title
自然言語処理
Volume 13
Issue 2
Start Page 169
End Page 179
Abstract
SPSS社のAnswerTree3.0Jに搭載されたCHAIDで決定木を描く統計手法が、コーパスから得られる2つ以上の変数からなる共起頻度を分析するのに有効であるかどうかを検討した。本研究では、3種類の接続助詞「から」「ので」「のに」が、7種類の副詞「何しろ」「何せ」「せっかく」「現に」「どうせ」「実際」「本当に」と共起する場合に、文中と文末の表現でどちらが使われるかを、新潮文庫の100冊を使って解析した。決定木(図1を参照)は、3種類の接続助詞と7種類の副詞の共起頻度によって、接続助詞の位置が文中にくるか文末にくるかを予測するという分析結果を描いたものである。決定木から5つの特徴を読み取ることができる。まず第1に、接続助詞「ので」と「から」が副詞との共起頻度において文中・文末で顕著な違いを示した。「ので」は文末ではほとんどみられず(5回あるいは4.59%)、「から」は頻繁にみられた(220回あるいは31.56%)。第2に、副詞「何しろ」と接続助詞「から」がもっとも典型的な文末表現であることが分かった(この種の組み合わせの合計324回のうち140回あるいは43.21%)。第3に、接続助詞「から」と副詞の「せっかく」の共起は、かなりあるものの、文末では非常に少ないことも分かった(この種の組み合わせの合計67回のうち6回あるいは8.96%)。第4に、接続助詞「から」と副詞「何せ」「現に」「どうせ」「実際」「本当に」はいずれも、文中・文末にほぼ同じようなパターンで共起していることも示された。第5に、接続助詞「のに」は副詞の文中・文末の共起パターン(文中が78.82%、文末が21.18%)が、全体の共起頻度(文中が72.73%、文末が27.27%)と類似していた。以上のように、AnswerTree3.0Jによる決定木の手法は、複数の変数からなる共起頻度データを構造的に分析することができ、今後のコーパス研究において有効な手段の一つとなるであろう。
Using 'decision tree' drawn by a statistical algorism CHAID in SPSS AnswerTree3.0J, the present study investigated the collocation frequencies of three conjunctive particles(kara, node and noni) appearing in the middle of at the end of sentences, with seven selected adverbs(nanishiro, nanise, sekkaku, gen'ni, doose, jissai, and hontooni). Collocation frequencies were taken from the corpus of the Shinchoo Bunko Collection of 100 Novels. Analysis results depicted in the decision tree predict two different particle positions(middle and end) of three conjunctive particles appearing with the seven adverbs. Five noteworthy collocation tendencies were observed. First, the conjunctive particles node and kara showed distinctive differences in the middle and ending positions when appearing with the adverbs: node was seldom seen at the end of sentences(5 times, or 4.59%), while kara was often seen at the end (220times, or 31.56%). Second, the combination of the adverb nanishiro and the conjunctive particle kara occurred most frequently at the end of sentences(140 out of 324 times, or 43.21%). Third, although kara occasionally appeared with the adverb sekkaku, this combination was seldom observed at the end of sentences(6 out of 67 times, or 8.96%). fourth, the conjunctive particle kara showed a similar pattern of collocation frequencies in the middle and at the end of sentences when combined with the five adverbs nanise, gen'ni, doose, jissai and hontooni.Fifth, the conjunctive particle noni appeared in the middle and at the end of sentences(78.82 0n the middle and 21.18-0x1.47b00bfff994p-149t the end), similar to the overall percentages of the conjunctive particles(72.73-1073777684n the middle and 27.27 0x0.006c8000006c9p-1022t the end). As such, in structurally depicting the collocation frequencies of conjunctive particles and adverbs, 'decision tree' analysis has considerable potential as a statistical approachi in duture collocation studies.
Keywords
決定木
SPSS Answer Tree
共起頻度
接続助詞
副詞
文末表現
decision tree
collocation frequency
conjunctive particles
adverbs
ending expression
NDC
Japanese [ 810 ]
Language
jpn
Resource Type journal article
Date of Issued 2006-04
Publish Type Version of Record
Access Rights open access
Source Identifier
[ISSN] 1340-7619
[NCID] AN10472659