誰がログ

歯切れが悪いのは仕様です。

Wikipedia「分散形態論」作成の記録と補足など

はじめに

言語学な人々アドベントカレンダー

この記事は「言語学な人々 Advent Calendar 2023」の2日目の記事として書きました。

adventar.org

今年もなんとか登録できて良かったです。あっという間に枠が埋まってしまったので第2弾もできています。

adventar.org

何を書くか

Wikipedia日本語版に私の専門に関する項目「分散形態論」を作成しましたので、その記録と、補足などを簡単に書いておきます。

ja.wikipedia.org

「分散形態論 (Distributed Morphology)」は言語学の理論的枠組みの1つで、大学院生の後期課程から本格的に取り組むようになってからもう20年近い付き合いになります。

この項目内でも引いている『分散形態論の新展開』という本が来週12月5日に発売になりますのでその宣伝として良いタイミングだなという気持ちも少しありました。私も執筆者の1人でこの本はすでに手元にありますのでWikipediaを書くのはもちろん本の内容を確認しながらやりました。

この本の宣伝のためにWikipediaの項目を作成したということはなく、実は10年以上前からこの項目は作りたいなと思いつつなかなか手が付けられていなかったので(そのうち誰か作るかなという淡い期待もあったのですが…)、アドベントカレンダーをきっかけになんとか着手したという感じです。

Wikipediaの項目を作成してみて

今回はじめてWikipediaの項目を作成しました。かなり大変だったのでもう少し事前に練習というか既存の項目を修正するといった作業を通して慣れておいた方が良かったかなと思います。以前からWikipediaの運営や編集に関わっている人たちはリスペクトしているというか応援していて定期的に寄付もしてきたのですけれど、今回自分で体験してみてその思いが強まりました。

形式面

WikiはWikipedia以外もほとんど触ったことがありません。ただ、ふだんObsidianでメモを取っていますしはてなブログもMarkdownで書いているので簡易マークアップ?の記法にはすんなりなじめました。

今回はObsidianで下書きを書いてWikipediaの編集ページにコピーして編集していくという方法を取りました。リアルタイムでプレビューができるのは良いのですがそれほど快適ではないと感じたのでVisual Studio CodeにWiki編集用のプラグインを入れるなどしてある程度の段階まで作ってしまった方が良かったのかもしれません。これは後で思いついたのでまだ試してはいません。

書いてて大変だなと思ったのは文献情報です(形式自体はBibTeXに似ているので戸惑いとかはありませんでした)。Wikipediaの記事では出典と文献の情報が重要だと思いますので大変だなと思いつつも丁寧にやりました。参考にした英語版の記事も実はけっこう文献情報が雑なところがあったので、その点では今回作成した日本語版の記事の方がちゃんとしていると思います。日本語版の方は内容がまだ少ないので文献の数自体は少ないですけれども。

これもほとんど作業が終わりに近づいてから思いついたので1, 2件しか試せていないのですが、ChatGPT(GPT-4)にBibTeXからWikipediaの出典表記形式への変換をお願いしたらあっさりやってくれました。BibTeXの形式を何もお膳立てせずそのまま入れても、@articleを読み取ってCite journalにしたり複数著者をきれいに処理したりするだけでなく、Citation keyとかshortjournalとかの不必要な情報は適切に無視してくれましたし、タイトルの一部に付けてる{{}}もちゃんと削除してくれました。いやーすごい。

人によってはChatGPTを使うよりWikipediaの文献編集ツールを使う方が楽なのかもしれませんが、私はふだんから文献管理ツールのZoteroでプラグイン(Better BibTeX)を使ってbibファイルを自動生成しているのでBibTeXからの変換ができるのは楽です。もっと早く気付いていれば。

内容面

英語版にはすでに "Distributed Morphology" の項目があったので当初はそれを翻訳すれば良いかなと考えていました。ところがやってみるとあまりうまくいきませんでした。翻訳するにしても大変だろうという予測はしていたのですが、実はベースにしようと思った英語版の項目自体にいくつか問題があることが分かったのです。

ちなみに英語版からの翻訳もChatGPTとDeepLで試してみたのですがあまり使える水準にはならなかったので、DeepLを少し確認に使ったものを除いて、翻訳した部分は基本的には私が一からやっています。

英語版の問題点

ここから先はさすがに内容に少し踏み込んで話をせざるを得ません

英語版の項目は内容が間違っているというわけではないのですが、標準的な内容になっているところとそうでないところが混在している感じがします。なので、日本語版の方は可能なところは英語版の訳になっていますが、かなりの部分で相当の意訳をしたり私の方で新しい文章や表現に置き換えたり、問題のあるところを削ったりしました。その具体的な内容は以下の補足のところに書きます。

これはおそらく日本語版の項目でも引用しているNevins (2016)という文献の内容を中心に書いているからだと思われます。この文献の著者であるAndrew Nevinsはいろいろ重要な研究成果を挙げている研究者で、分散形態論の前線を担っている1人と言っても良いのではないかと思います。ただDavid Embick, Heidi Harley, Jonathan Bobaljikといった研究者たちに比べればそれほど分散形態論の研究者という感じはしないかもしれません。

おそらく問題があるのはこの文献の性質で、これlecture notesなんですよね。読んでみると面白くて受けたいなこの授業と思える内容なんですけど、やっぱり基礎的な部分と発展的というかchallengingな部分があるわけです。Wikipediaにはその辺りのことをあまり踏まえずに参照されちゃってる感じです。あとこの文献内でのほかの研究の参照も論文に比べればそれほどしっかりしてはいなかったりします。たとえばroot-derivedとcategory-derivedの違いとしてdenominal verbを挙げているところは明らかにMaya Aradの研究を下敷きにしていると思われるのに引用されていません。おそらく授業ではその辺りのことに補足や言及があったのではないかと思いますが…それでもWikipediaとしてはNevins (2016)の内容を適切に紹介できていれば問題ないのかもしれません。しかし、Nevins (2016)の内容の紹介であることが分かるようにも書かれていません。

英語版の項目がそのような状況でしたので、分散形態論の標準的な内容になっているなと考えられるところを残し、それがはっきりと書かれている文献の情報をNevins (2016)以外にもいろいろ新しく追加しました。問題がある箇所は削除したものもありますし、内容・表現を修正したものもあります。文献としては、比較的新しめでHandbook系の概説であるMcGinnis-Archibald (2016)とSiddiqi (2019)、2010年代の概説としては内容も信頼でき具体例も豊富なBobaljik (2017)、貴重な和文の概説でありもちろん内容も信頼できる大関 (2023)を採用しました。

用語の翻訳

分散形態論は1993年スタートとされているのでできてからちょうど30年経過したことになります。それでも用語の中には日本語訳がないもの、安定していないものが少なくありません。

分散形態論独自の用語の日本語訳(で特に定着していないもの)はできるだけ上記の本のイントロである大関 (2023)をそのまま採用しました。私自身もこれまで自分でいくつか用語の日本語訳を考えていろいろ思うところはあるのですが、Wikipediaの項目としてはあまり日本語訳とその出典情報がごちゃごちゃしているのは良くないかなと考えたからです。この辺りのことはあまり調べなかったのですがどういう方針が良いのでしょうね。記事の長さとか専門性にもよるのかな。

たとえば、私は分散形態論の "root" という用語を「語根」と訳すのはあまり良くないと考えていて、以前から和文文献でも大文字始まりの "Root" を使っています。これは分散形態論でこの概念の指す内容や理論的位置付けが言語学一般で用いられる「語根 (root)」とは異なっておりその違いが重要だと考えているからです。ただ明らかに異なるというわけでもなく実は外延がけっこう重なってしまうことも多いですしこの用語の使い始めに当たるMarantz (1997)ではそれほどそのような違いについて意識しているようにも思えませんので「語根」と訳すのが間違いというわけでもありません。紛らわしい、くらいでしょうか。

そういえば "morpheme" という概念・用語も分散形態論ではまた言語学一般で用いられる「形態素」と違った使い方をするのですよね。これも項目内のどこかに書いておいた方が良いかなあ。

補足など

ここでは主に内容面に関する補足・解説として執筆時に特に気になったところについて書いておきます。こちらも実質的には英語版の項目の問題点と思ってもらって良いです。英語版の方も修正した方が良いのでしょうけれど誰かやってくれないかな…

用語・概念に関する変更

分散形態論で仮定される3つのリストのうち、統語部門への入力として参照されるリストは英語の方でもあまり名前が定まっていません。単に "List A" のように呼ばれることさえあります。それを踏まえても "Formative List" という名称はあまり用いられないので、大関 (2023)で提案されている名称「形態統語素性のリスト」に変えました。

例に関する修正

語彙項目の例として英語版の方で上げられているロシア語の接辞の語彙項目はHalle (1997)からの引用であるように書かれていますが、Halle (1997)を読み直してもどれを指しているかよく分かりません。おそらくどこか間違っているか引用とは言えないほど変えていると思われます。Bobaljik (2017)からの例に差し替えました。

そのすぐ下の英語の一人称代名詞に関する例は英語版では語根に対する語彙挿入の例として紹介されているように読めますが、これはそう言いきれるかどうか微妙なので語彙項目の競合とその解消に関する説明の例であるように変更しました。語根を対象とした語彙挿入の例としては補充法などを取り上げた方が良いと思います。

ここで合わせて競合と不完全指定についても紹介することにして、概要の一番最後にあった "Derivation" という項目は訳さないことにしました。確かにこういう具体例がある方が分かりやすいのですが、ほかの部分の内容と重なっていたり内容は重なっているのに用語や説明に不統一なところがあったので保留です。今後大幅に修正してまた書き加える可能性はあります。

そのほか

Alexiadou and Lohndal (2017)は語根の範疇化に関する4つの方法を紹介しているというよりは4つのタイプの説について紹介している先行研究のレビュー的な側面が強いので、それが分かるように書くようにしました。

おわりに

英語版の方の "Morphological operations" と "Distributed morphology approach to core theoretical issues" は内容としてはあった方が良いのですが、いろいろ気になるところがあるのでもう少し時間をかけて日本語版の方に反映させたいと考えています。"Morphological operations" の方はある程度目処が立っているので、それほど時間はかならないと思います。

なおこの項目を作成する際にリンクをはってみて、「語彙主義」といったより基本的な用語・概念についても項目がないことに気付きました。新しい項目の執筆をするかどうかは未定ですが、とりあえず既存の項目への関連づけで処理できるようなものについては取り組んでも良いかなと考えています。

文献

  • Alexiadou, Artemis; Lohndal, Terje (2017). “The structural configurations of root categorization”. In Bauke, Leah; Blümel, Andreas eds. Labels and Roots. De Gruyter Mouton. 203-232.
  • Bobaljik, Jonathan (2017). “Distributed Morphology”. Oxford Research Encyclopaedia of Linguistics.
  • Halle, Morris (1997). “Distributed Morphology: Impoverishment and Fission,” in Lecarme, Jacqueline, Jean Lowenstamm, and Ur Shlonsky eds. Research in Afroasiatic Grammar. Amsterdam: John Benjamins, 125–149.
  • Marantz, Alec (1997). “No Escape from Syntax: Don’t Try Morphological Analysis in the Privacy of Your Own Lexicon,” Univerisity of Pennsylvania Working Papers in Linguistics 4(2): 201–225.
  • McGinnis-Archibald, Martha (2016). “Distributed Morphology”. In Hippisley, Andrew; Stump, Gregory T. eds. The Cambridge Handbook of Morphology. Cambridge: Cambridge University Press. 390-423.
  • Nevins, Andrew (2016). Lectures on Postsyntactic Morphology.
  • 大関洋平 (2023)「分散形態論の概要」大関洋平・漆原朗子編『分散形態論の新展開』開拓社, 8-27.
  • Siddiqi, Daniel (2019). “Distributed Morphology”. In Masini, Francesca; Audring, Jenny eds. The Oxford Handbook of Morphological Theory. Oxford: Oxford University Press. 143-165.