先日洋書多読は難しいという記事を書きました。ありがたいことにそれなりに好評をいただけただようです。
英語学習の方法は色々ありますが、洋書多読というのはメジャーな方法の1つかなと思います。ハリーポッターを英語で読んで学習しているという方も多そうですよね。自分はアニメやゲームなどのサブカルチャーが好きなので、アニメの原作になっているライトノベ[…]
この記事の中で、洋書はノンネイティブには難しすぎるという風に書いたのですが、その主な理由が語彙レベルです。個人的には「分からない単語は文脈から推測しよう」「多読で自然に覚えよう」と言った主張は必ずしも正しくないと考えていて、洋書多読に当たって十分な単語学習は必須だと考えています。だとしたらどのくらい語彙レベルを鍛えれば洋書が読めるようになるのでしょうか?今回はその辺りを少しリサーチした上で色々と検証してみようかと思います。
語彙カバー率に関する理論
検証を始める前にまず紹介したい理論があります。語彙カバー率(Lexical Coverage)とは、英文読解においてテキスト内の単語の何%を知っているかという指標です。この分野の研究では、長年「何%の単語を知っていれば、その文章を理解したと言えるのか?」という読解の閾値について議論されてきました。現在、世界的に広く支持されている基準の2つを紹介いたします。
Paul Nation教授の「98%基準」
現在、英語教育や多読指導において最も一般的かつ有力な指標がこの98%という数字です。これはその名の通り50単語に1語(2%)だけ知らない単語がある状態を指しており、これが辞書を使わずに楽しみながらスラスラ読み進めることができる「自律的読解」の境界線と考える理論です。
98%の単語が基地であれば、2%の知らない単語の意味も文脈から正確に推測することができ、この「推測しながら読み進める体験」が最も効率よく英語力を高めるとされています。
Batya Laufer教授の「95%基準」
こちらは98%基準が広まる以前から、読解成立の最低限の閾値として知られている数字です。20単語に1個(5%)知らない単語がある状態が、辞書を使って一文ずつ丁寧に分析すれば、内容を理解できる「学習限界」の境界線であるという理論です。
1〜2行ごとに知らない単語が出現するため、読解のスピードが著しく落ち、内容に没頭することが難しくなります。Laufer教授は、これ以下のカバー率になると、いくら時間をかけても正確な理解が困難になる(理解が崩壊する)と指摘しています。
英文読解に関してはこの2つ以外にも多くの理論があるようですが、今回は一旦この2つの理論が競合せずともに正しいと仮定して以降の検証を進めていきます。
実際の記事での検証
それでは上記の理論を適用して実際の記事で検証を始めていきます。実際に98%と95%という基準がどの程度のものなのか体験してみましょう。
まず、題材にしたのは洋書多読で人気がありそうなハリーポッターです。
ハリーポッターと賢者の石
Amazonでサンプルが見られたので冒頭を少しGeminiに解析してもらったところ、3ページ目までの語数が670語であり、その中での難単語上位30が以下の通りでした。
| tawny (黄褐色の・茶色の) | chortled (満足げに笑う) |
| tabby (トラ猫・しま猫) | tyke (ちび・わんぱく小僧) |
| getups (奇抜な服装) | craning (首を伸ばして見る) |
| tantrum (かんしゃく) | huddle (ごちゃごちゃした群れ) |
| stunt (人目を引く行為・スタント) | cloaks (マント・外套) |
| pecked (軽くキスした ※鳥がつっつく動作) | shuddered (身震いした・ぞっとした) |
| enraged (激怒した) | wrestled (格闘した・無理やり座らせた) |
| flutter (羽ばたき・ひらひら飛ぶこと) | beefy (肉付きの良い・筋肉質の) |
| jerked (急に動かした) | peculiar (奇妙な) |
| nerve (図々しさ・厚かましさ) | good-for-nothing (ろくでなしの) |
| spying (のぞき見する) | dull (どんよりした・退屈な) |
| hummed (鼻歌を歌った) | blinked (まばたきした) |
| stared (じっと見た) | bear (耐える) |
| nonsense (ばかげたこと) | mysterious (不思議な) |
| drills (ドリル ※工具) | fences (垣根) |
3ページまでに分からない単語が13語以内なら98%基準、33語以内なら95%基準の範囲内となります。こう見ると13語以内に収めるのは大変かもしれませんが、33語以内というのはある程度学習していた方なら達成できそうに見えます(もちろんこのリスト以外にも難しい単語があるかもしれませんが)。
Holes
次は私が前の記事でおすすめしたHolesです。冒頭3ページ980単語の中から難単語上位30を抽出してみました。
| befell (降りかかった ※befallの過去形) | shriveled (しぼんだ・干からびた) |
| stifling (息苦しい・重苦しい) | perseverance (忍耐力・根気) |
| gruff (しわがれ声の・ぶっきらぼうな) | descendants (子孫) |
| outlaw (無法者) | stagecoach (駅馬車) |
| wasteland (不毛の地・荒れ地) | convicted (有罪判決を受けた) |
| supposedly (たぶん・建前上は) | hovers (うろつく・空中に停止する) |
| scorpions (サソリ) | rattlesnake (ガラガラヘビ) |
| woodpecker (キツツキ) | warden (所長・看守) |
| crammed (詰め込まれた) | odor (臭い) |
| obstacle (障害物) | ratios (比率) |
| handcuffed (手錠をかけられた) | stationery (便箋・文房具) |
| slumped (ドシッと座った・崩れるように座った) | discouraged (落胆した) |
| hammock (ハンモック) | mansion (大邸宅) |
| fortune (財産・大金) | embarrassment (恥ずかしさ・当惑) |
| innocent (無実の) | inventor (発明家) |
この中で分からない単語が20単語未満なら語彙カバー率98%を超えて多読題材にできる計算になります。これも未知語を20語以内に抑えるのは少し大変そうなラインナップですね…。
ダ・ヴィンチ・コード
続いては映画も大ヒットしたダ・ヴィンチ・コードの冒頭440単語からの抽出です。
| brethren (同胞・信者 ※古風で宗教的な響き) | curator (館長・管理者) |
| parquet (寄木細工の床) | gilded (金箔を貼った・金色の) |
| cavernous (洞窟のような・広くてうつろな) | tempest (大嵐・暴風雨 ※比喩的表現) |
| assailant (襲撃者・加害者) | immobile (動かない・静止した) |
| recoiled (後ずさりした・ひるんだ) | taunted (あざけった・なじった) |
| staggered (よろめいた) | lunged (飛び出した・突進した) |
| heaved (力を入れて持ち上げた・放った) | barricading (バリケードを築く・塞ぐ) |
| stammered (口ごもった・どもった) | seeped (じわじわ滲み出た) |
| cavity (空洞・腔 ※chest cavityで胸腔) | renowned (名高い・高名な) |
| albino (アルビノ・先天性色素欠乏) | glint (きらめき・閃光) |
| leveled (銃などを向けた・水平にした) | smugly (独りよがりに・自己満足して) |
| breastbone (胸骨) | drawn-out (長引いた・延々と続く) |
| witnessed (目撃した) | protocol (手順・規約) |
| instinctively (本能的に) | defenseless (無防備な) |
| smirked (ニヤリと笑った) | gaze (凝視・眼差し) |
この中で知らない単語8単語以下なら98%以上、22単語以下なら95%以上です。ハリーポッターやHolesのような子ども向けの文学と違って明らかに単語レベルが難しいですね。これを多読推奨レベルの98%以上のカバー率で読める方は少ないのではないかと思います。
TOEIC
多読とは少し趣旨がずれますが次は試験編です。公式問題集12でおそらく語彙が一番難しいであろうarticle問題を分析してみました。
| foothold (足がかり・拠点) | chronicles (〜を記録する ※動詞) |
| gripping (心を捉えて離さない) | readership (読者層・読者数) |
| solidify (強固にする・確固たるものにする) | memoir (回顧録・自伝) |
| well-regarded (高く評価されている) | visibility (認知度・存在感) |
| emerging (新進の・現れつつある) | acquisition (買収・獲得) |
| significance (重要性・意義) | notable (注目に値する・著名な) |
| expansion (拡大・進出) | thrillers (スリラー作品) |
| remote (辺ぴな・遠く離れた) |
約160語の記事だったので、知らない単語が3単語以下で98%、8単語以下で95%です。article問題なので他の文章よりも使用単語は難しいとは思いますし、洋書に比べるとレベルは大分下がるかと思うのですが3単語以下というのはなかなか大変そうですね。
共通テストリーディング
こちらもおまけで最後は2026年共通テスト最後のリーディングです。最後の大問8は問題形式が複雑だったので大問7を分析してみました。語数は615語で、上位30単語を抽出しています。
| neuroimaging (神経画像処理・脳機能イメージング) | incubation (孵化・熟考期間) |
| undemanding (要求が厳しくない・容易な) | receptive (受容力がある) |
| unconsciously (無意識に) | approximately (およそ・約) |
| associating (関連づけること) | seemingly (見たところ・どうやら) |
| daydreaming (白昼夢・空想) | absorbed (夢中になって・没頭して) |
| apparent (明白な・はっきりと見える) | passive (受動的な) |
| enrich (豊かにする) | depression (うつ病・憂鬱) |
| sculpture (彫刻) | merely (単に〜にすぎない) |
| generate (生み出す) | interval (間隔・合間) |
| critical (極めて重要な) | regions (領域・部位) |
| participants (参加者) | concentrating (集中すること) |
| negatively (否定的に・悪影響を与えて) | unrelated (無関係の) |
| discoveries (発見) | hatch (孵化する) |
| shift (移行・変化) | aware (気づいて) |
| flow (流れる) | mood (気分) |
未知語が12語以下で98%です。neuroimagingのように明らかに受験者が知らないことを前提としていると思われる単語もあり、それを含めて12語以下にするのはなかなか大変そうですね。
目指すべきレベル
ここまでいくつかサンプルを見てきましたが、実際にどの程度まで語彙レベルを鍛えればいいのかというのは気になるところですね。
やはり目指すのは98%
自分の感覚としても、多読しようと思う題材の語彙カバー率は98%を超えているべきかなと思います。以前の記事では多読では楽しむことが重要という話をしたかと思います。難しすぎる課題は多読学習は楽しめずに挫折してしまうので、難解な題材で多読するというのはやはりオススメできません。また、SSS英語多読研究会の多読3原則では辞書を引かないことを多読の要件としているので、辞書を引く前提の95%基準だと多読は難しいでしょう。
多読とは少し話がずれますが、TOEICや共通テストなどの試験でもやっぱり98%が基準になるかなと思います。試験中は当然辞書が使えないので辞書前提の95%では無理があります。知らない単語は文脈から推測すれば大丈夫と思う方もいるかと思いませんが、この98%基準自体が文脈からの推測を前提とした上での基準なので、これを大きく下回るのは良くないかなと思います。

98%基準を達成できる語彙数とは
じゃあ実際どのくらい単語を覚えたら良いのかという話ですね。こちらに関しては98%基準を提唱したPaul Nation教授が2006年に学術誌『Canadian Modern Language Review』で発表した『How Large a Vocabulary Is Needed For Reading and Listening?(読むことと聞くことには、どれくらいの語彙サイズが必要か?)』という論文が非常に興味深いものになっています。
結論だけ書くと、シチュエーションごとに以下の語彙サイズが98%の基準となっているようです。
子供向け映画 (Children’s movies): 6,000 word families
話し言葉/日常会話 (Spoken English): 7,000 word families
新聞 (Newspapers): 8,000 word families
小説 (Novels): 9,000 word families
ここではword familyという言葉が使われていますが、これは派生語を含めて1つと数えるということです。例えばactでしたら、action, active, actively なども全部ひっくるめて1つのword familyと数えるということです。これを日本でよく使われている見出し語(lemma)のカウントに直すのがまた厄介なのですが、研究結果上ざっくり「1 word family ≒ 1.6〜2.0 lemma」という数値が出ているようです。この値を上記に代入すると以下のようになります。
子供向け映画 (Children’s movies): 約9,600 〜 12,000語
話し言葉/日常会話 (Spoken English): 約11,200 〜 14,000語
新聞 (Newspapers): 約12,800 〜 16,000語
小説 (Novels): 約14,400 〜 18,000語

15,000語レベルとは

自分がこれまで実施してきた英語学習のうちもっとも他の方にお勧めしたいのがAnkiです。ダントツでAnkiです。誰が何と言おうとAnkiです。文部科学省が推奨して義務教育に取り入れるべきと思っているくらいオススメです。Ankiを始めるまで自分[…]
まとめ
洋書多読をしたいと思う方はまず15,000語レベルを目指して語彙数を増やした方が良いと思います。もちろん15,000語レベルの語彙力が無いと洋書多読ができないなんてことはありませんし、ラダーシリーズや児童書など語彙数が制限された洋書を読むという方法もあります。とは言え語彙数の多さは多読の快適さに直結するというのは絶対に覚えておいて欲しいです。
個人的には、学習者のレベルを問わず単語学習が全く必要無いという方はほぼいないと思っています。上級者の方ほどネイティブが楽しむような洋書・洋画に触れたいと考えると思いますし、そうなるとネイティブと同等の語彙数(最低20,000語レベル)があることがやはり望ましく、かつこのレベルの語彙数を備えている方はほとんどいないと思われるからです。


