
総合評価
(9件)| 2 | ||
| 3 | ||
| 2 | ||
| 1 | ||
| 0 |
powered by ブクログ『これまでの文学のなかで、時代を問わず最良の物語のひとつに数えられているのが、たった6語の作品だ。「For sale: baby shoes, never worn (売ります: ベビー靴、未使用)」。この物語はアーネスト・ヘミングウェイの作とみなされることが多い(中略)すべての言葉のなかで最悪な要素がひとつあるとすると、それが副詞なのである』―『1章 控えめに用いなさい』 文体、という概念が正確に何を指しているのかと問われてもきちんと答えられる(きちんと、というのは理系的考えでは、誰しもが理解できるような定義可能でかつ論理的な概念としてという意味で、となるけれど、この「論理的」というやつが理系と類される人々の文系科目に対するもやもやの根底にあると思う。ただ、それを好意的に捉えてもらえる)気がしない。そういう向きには、多分、本書で解き明かされている事柄は、そのもやもやを吹き飛ばしてくれるものとなるだろう。 本書が語るのは、正確に言うなら「文体」という言葉が一般に意味するであろう文学的な作家の「癖」の話ではない。もっと「無味乾燥」な「統計」の話だ。しかし驚くべきことにそこに作家の「癖」(それが意識的なものであろうと、無意識のうちに出てしまうものであろうと)が有意な差として表れるという。そう言われてしまうと、統計解析を永らくやってきた身としては読む前から興味津々となる。 九つの章からなる本書の中で最も興味深いのは第三章。「文章に「指紋」はあるか」と題されたこの章では、作家が「使いがちな単語」を単純に数え上げて、異なる作家の間に見られる特徴の違いを炙り出す試み。著者が本書を執筆する切っ掛けとなったというエピソード、合衆国建国の父たちの書き下ろした匿名の論文が実際には誰の手によるものかを推論したモステラ―とウォレスの手法(1963年の論文発表当時、モステラーたちは当たりを付けた単語を一つひとつ手で数え上げて分析を行ったのだ!)を、2014年当時のデジタル技術を存分に活用して行った分析結果は意外でもあるし想定内のことであるような気もする。ただ、分野を変えて別のペンネームで執筆を行った作家の作品群に明らかな類似性を指摘できるなど、この手法の有効性は一定程度あると訴えるには充分だ。確かに使いがちな単語というものが各々作家にはあるのだろう。蛇足ながら、今なら差し詰め機械学習による判別を試みるだろうけれど、それはそれとして。 ただし。そう、統計学的にはどうしても「ただし」と言わざるを得ないと思うのは、著者ベン・ブラットは網羅的に単語を数え上げて作家同士の「多次元空間における距離」が離れている「軸(単語の数、出現確率)」を選び出している訳だが、よく知られているように次元が高くなればなるほど要素間の独立性が問題となる。多変量解析において単純に説明変数の数が増えれば推定誤差は小さくなるけれど、その推定が統計学的に有効かどうかはまた別の話(であるから著者がグラフにして示すのは二変量の平面上のデータだけなのだと、推察される)。極端に言ってしまえば、この手法が依拠しているのはある作家の多次元空間における「位置」と他の作家の「位置」の間の距離を最大化する説明変数を選ぶことだが、「距離」を測るというのは単純に言えば「平方定理」の概念を用いて測っている訳で、その際に必要なのは二つの「直交する」軸の距離を二乗して平方和を取るという過程。この「直交する」ということこそ二つの軸(変数)の「独立性」を示すものなのだ。それが多次元になればなるほど担保され難く、変数間の相関により導き出される結果が変わり得るということが起こる。もちろん統計学者として著者もその点を気にかけ単語の選択に恣意性が入らないようにしているとは思うものの、「単語」の独立性を少しナイーヴに取り扱って、結果ありきな答えを導き出してしまってはいないだろうか、と思ったり。単語と小説の分類や時代性にはきっと相関があるだろうと予測できるし(その点は著者も考慮してはいるけれど)単純に各単語の出現確率が独立事象であるとは想定できないのでは、などと考えてもみる。まあ、そんな風に考えて読む必要もないし、自分も日本語の小説で同じような分析をしてみたい気になってはいるけれど 『人気の犯罪小説作家P・D・ジェイムズはこう述べている――「すべてのフィクションは大部分が自伝的であり、そして当然、多くの自伝がフィクションである」。この引用の後半は、単語の頻度を使ってもたしかめられない。しかし彼女の言葉の前半(「すべてのフィクションは自伝的」)は、あらゆる作家が意識的であれ無意識的であれ、自分自身のある部分にもとづいて登場人物を描いているという考えにかかわっている。その可能性を探求する際には、単語の頻度が作家の心に入り込む入り口になってくれる』―『2章 彼の書き方、彼女の書き方』 本書の主題とは無関係かも知れないけれど、引用された犯罪小説家の言葉は妙に頭の中で反響する。そう、多分自分もそんなことをいつも思いながら作家と作品の関係性のようなことが気になってしまうのだ。ただし、それを「男性・女性」の主語の在り方で読み取ろうというのは、少し穿ち過ぎな気もするけれど。そもそも日本語ではこの分析方法は応用可能ではないしね。
3投稿日: 2025.11.14
powered by ブクログ言語コーパスで、作家たちが意識的か無意識的かはとりあえず不明な面もあるのだが、いろいろなことが見つけることができるのは、小気味いい。新たな小説の読み方ができたと思う。
0投稿日: 2024.03.30
powered by ブクログ内容はなかなか興味深い。英語の書籍に関する分析なので日本の小説事情とはちょっと異なるが、それはそれで英米小説を読む際、新たな視点になるかも。各章の最後にある、本分の引用でしかないまとめページは読みにくいだけですね。
1投稿日: 2021.02.26
powered by ブクログ小説の文章を解析し統計手法により小説を解剖する試み。 副詞は控えるべきなのか・!は使わないのか・大衆小説はバカになっているのか・男女によって使う単語は異なるのか・単語の使用率によって小説の筆者は特定できるのか、などなど。 興味深い研究だが題材が英文学のため、副詞や作家の文体論も英語が対象で、小説も英語で書かれたものが対象にしている。
2投稿日: 2020.12.08
powered by ブクログ琉球大学附属図書館OPAC https://opac.lib.u-ryukyu.ac.jp/opc/recordID/catalog.bib/BB26629913
0投稿日: 2020.10.16
powered by ブクログこのレビューはネタバレを含みます。
面白い内容だった。 ・文章の中身ではなく、使っている単語で、それが誰が書いているものかわかる。 ・著名な小説家が避けること(副詞を使わないとか)が、実際にどうなのか(本当にやっているのか?)をチェック(そうだった)。
1投稿日: 2019.08.14
powered by ブクログ英米の小説には、言葉の使い方に作者の癖が反映されている。計量文献学と言われる分野で、文献の特徴を数値化し統計手法を使って分析や比較を行う。欧米のベストセラー作家の作品群について考察したのがこの本である。 ベストセラーとなった本、作家について、品詞の使い方から表紙の文字まで、数字に置き換えて判りやすく解説している。図表も充実して面白い分析だが、全体として、英米の小説に特化した分析のため、考察した内容が日本の小説に当て嵌まるわけではなく、また取り上げられた作家も作品も馴染みのない人が多くて、彼等の小説を読んでいないと判りにくい部分もあった。(原文で読める人には、納得できる部分も多いと思うけれど) この本には多くのノウハウが紹介されているが、それを利用して小説を書いてみても、ベストセラーになるのかどうか判らない。良い小説は書けるかもしれないけれど、おそらく個性の無いつまらない小説になりそうな気がする。ファンは、作家の癖も含めて好みなのだから。
1投稿日: 2018.12.01
powered by ブクログ小説に使われる単語を対象にした面白い統計。表紙がキャッチーなので興味を持った。作家の性別で使用単語に特徴かあったり、英米文学の差や作家ごとの文章の特長かなんとなくわかる。惜しいのは本文が縦書きなのに注記が横書きでページがおかしいこと。全部横書きにすればよかったのに。
1投稿日: 2018.11.25
powered by ブクログ・機械言語学習でベストセラーからファンノベルまで解析 ・副詞が少ない方が人気がでる、性別や作者により特徴が出るなどの結果を述べてる ・本の長さやタイトルよりも大きな作者名なども調べている
1投稿日: 2018.09.15
