「35人学級見直し議論」を大人の茶番ですませてはいけない

公立小学校1年生の35人学級を、40人学級に戻すよう求める方針が財政制度等審議会で決められたことを端に、少人数学級・学級規模削減について様々な議論が繰り広げられている。しかしその多くは、学級規模削減について論じるために押さえておかなければならない知識やデータに基づいたものとは言えない。

 

そこで本稿は、おもに米国で長年繰り広げられてきた学級規模削減の費用対効果検証の議論を紹介し、学級規模削減の議論のあるべき進め方を提示したい。その中で、35人学級見直しや現在の議論の問題点についても言及していく。

 

以下では、1章で米国での学級規模削減の効果についての議論を紹介する。2章では日本の教育状況から小1での学級規模削減の教育政策的優先順位と、米国の知見を日本に適応する際の注意点を議論する。3章では、1章・2章での議論の内容を受けて、現在日本で行われている小1の35人学級見直しについての議論の問題点を列挙する。

 

 

1. 学級規模削減の効果について

 

1.1. 学級規模削減の効果検証の難しさ

 

米国では長年、学級規模削減の効果検証が行われてきた。しかし、分析の難しさから信頼するに足るようなデータは、21世紀になってから出てきたと言える。日本でもここ数年でようやく因果推論的な手法を用いて学級規模削減の効果を検証する研究が出てきているが、その数は極めて少ない。今回の財務省の資料もそうであるように、学級規模の議論で言及されるようなデータは不十分なものがほとんどである。

 

例えば財務省側の主張の一つに、「小1に35人学級が導入された平成23年(2011年)以降いじめの件数が減っていない」というものがある。しかし、一般的に政策の効果を検証する際に「Aという政策が導入されたB年以降、Cの件数は……」という方法を用いることは、とくにCという現象に影響を与える要因が多岐にわたる場合、望ましくない。米国でリーマンショックが起きた年にある雇用促進政策を実施し一定の効果があったとしても、それ以上のショックによって、米国全体で見た失業率は翌年には上昇していたであろう。

 

年度別の集計データを使ってある政策の是非を問うと、この様な事態が往々にして発生する。ちなみに、小1の35人学級が導入された2011年は、東日本大震災の発生、福島原子力発電での事故など、近代日本の転換点となるような年であった。一連の出来事が日本の子供達に何の影響も与えなかったと考えるのは、リーマンショックが米国経済に何の影響も与えなかった、と仮定するぐらい無理があるのではなかろうか。

 

また学級規模と学習成果を使った散布図や、県別の学級規模のバラつきを活かした行政データを用いた回帰分析から、学級規模削減の効果を検証するのも望ましくない。観測不可能な要因が多過ぎるからである。

 

具体例を挙げていこう。まず平均学級規模は過疎地に行くほど小さくなる。また、他国では過疎地ほど、優秀な教員を集めづらくなるのが一般的だ(ただし、日本にはあまり機能していないものの広域教員人事制度[*1]があるため、一概に同様とはいえない)。さらに、日本の高い私教育費を考えれば、教育熱心な親が子供の教育のために都会に行くケースも他国以上に考えうるだろうし、教員と同様に優秀な教育行政官ほど都会で就職しているかもしれない。

 

[*1] 詳しくは「日本の強みを活かした教員マネージメントとは?-国際教員指導環境調査の結果から」を参照。

 

これらは、学級規模が小さいほど子供の学力が悪くなる要因となる。しかし単純な散布図では考慮されないし、単純な回帰分析では観測しづらい。そのため、仮に「学級規模削減が学習成果を向上させる」としても、「学級規模が小さいほど成績が悪い」ため、「学級規模を削減しても学習成果は向上しない」というミスリーディングな結論を導く要因となる。字数の制約で触れないが、逆の作用を与える要素も存在する。

 

つまり、学級規模削減の効果を検証するためには、時系列の集計データを見たり、行政データだけに頼った散布図や単純な回帰分析ではなく、因果推計のための手法を用いる必要がある。しかし教育政策の中でもその効果検証は難しく、非実験的な因果推計手法では正確な結果を得ることが難しいと考えられる[*2]。よって、学級規模削減の効果検証のためにはランダム化比較試験(RCT)[*3]を用いた政策実験を実施する必要があると言える。

 

[*2] Wilde & Hollister (2007)が示唆している。

 

[*3] RCT (Randomized Controlled Trial)は調査対象者をランダムにコントロール群とトリートメント群に割り当て、政策効果を検証する方法である。様々な批判もあるが、サンプリングバイアスが発生する可能性の低さから、現在のところ政策効果を推計するのに最も適した手法の一つだと考えられている。Propensity Score MatchingとDifference in Differenceの組み合わせ、Instrumental Variable、Regression Discontinuityなど、因果推計のための手法は色々あるが、RCTはバイアスの小ささに加えてその手法の理解のしやすさから、特に国際協力分野で実務家の間でも好まれている手法である。

 

 

1.2. 学力から見る学級規模削減の効果の特徴

 

学級規模削減の効果検証は、米国の教育分野で最も議論が行われてきた分野の一つと言っても過言ではない[*4]。学級規模削減の効果は、計測の難しさだけでなく文脈によって効果量が異なってくるため、これまで行われてきた効果検証の結果は様々であった。そこで実施されたのがRCTを用いた学級規模削減も含んだ教育政策実験、テネシー州のProject STAR (Student-Teacher Achievement Ratio)である。

 

[*4] この分野で最も有名な論争は、Hanushek vs Kruegerである。詳しくは、「The Class Size Debate」を参照。

 

Project Starは、小規模クラス(13人から17人)と一般クラス(22人から25人)に子供達をランダムに割り振り、学級規模削減の効果を検証した。Kruegerによる学級規模削減の費用対効果分析では、その内部収益率を6%前後であると結論付けられている[*5]。Kruegerの分析では、学級規模削減に伴う必要教員数及び教室数の増加をコスト、学級規模削減による学力向上と他の研究によって明らかにされた学力向上と将来賃金の増加を結び付けたものをベネフィットとしている。

 

[*5] 詳しくはKrueger(2003)。

 

またこの分野の実証研究の多くは、学級規模削減の効果は低学力層や貧困層の間・低学年でより大きくなることを示している[*6]。これは、教室内でのピア効果に着目して学級規模削減についてモデルを構築したLazear (2001)とも整合的である。

 

[*6] RCTを用いた分析ではないもののRivkin et al (2005)の分析結果が象徴的だ。

 

Lazearモデルの入り口は、授業中のある時間に生徒がpの確率で授業をちゃんと聞き、(1-p)の確率で授業を妨害し、教室内にはn人の生徒がいるというものである。例えば、教室内にp=0.95な生徒(5%の確率で授業を妨害する)が一人いて、授業時間が100分とする。この時ちゃんと授業が成立している時間は0.95×100=95分となる。生徒の数が2人の場合は 0.952×100=90.25分となる。つまり、p%の確率でちゃんと授業を聞けるn人の生徒が学ぶq時間の授業で、n人の生徒がちゃんと授業を受けられる総時間数はn×pn×qで表現される。

 

以下では100人いる1学年が100分の授業を受ける時、優秀な生徒のケースと問題を起こしやすい生徒のケースを想定して(全く授業妨害が発生しない完璧な生徒の場合、学級規模にかかわらず100人×100分で総学習時間は10000となる)、具体的な数字を当てはめることで、Lazearモデルが示唆する学級規模削減の効果を議論したい。

 

 

ケース1-優秀な生徒(p=0.98)の25人学級(n=25)が4クラスある場合:

教室内の学習時間-25×0.9825×100≒1508

学年の総学習時間-1508×4=6032

 

ケース2-優秀な生徒(p=0.98)の50人学級(n=50)が2クラスある場合

教室内の学習時間-50×0.9850×100≒1820

学年の総学習時間-1820×2=3640

 

ケース3-問題を起こしやすい生徒(p=0.95)の25人学級(n=25)が4クラスある場合

教室内の学習時間-25×0.9525×100≒693

学年の総学習時間-693×4=2772

 

ケース4-問題を起こしやすい生徒(p=0.95)の50人学級(n=50)が2クラスある場合

教室内の学習時間-50×0.9550×100≒385

学年の総学習時間-385×2=770

 

 

ケース1と2、ケース3と4を比べると分かるように、学級規模削減によってちゃんと授業が成立している時間が伸び、子供達がより多く学ぶことができるようになる。しかし、それぞれ必要な教員数が2倍になるため、かかるコストも2倍となる。

 

Lazearモデルが示唆する学級規模削減のポイントは、学級規模が削減されたことによる学習環境の改善によって将来子供達の所得がどれぐらい伸びるかというベネフィットと、学級規模を削減するためにどれぐらいのコストがかかるかの均衡点がどこにあるか、というものである。そしてケース2→1とケース4→3の学級規模削減を比較すると、前者も後者も教員数を2倍にするためコスト面に違いはないが、前者は学年の総学習時間が65%しか伸びていないのに対して、後者は260%も伸びていることから、学級規模削減は問題を起こしやすい生徒の間でこそ効果が大きい可能性が高いことが分かる。そして、授業中に問題を起こしやすいのは恐らく高学年よりは低学年、高学力よりは低学力、富裕層よりは貧困層の生徒であろう。

 

この議論をもっと卑近な例に引き寄せると、浪人生を対象とした予備校であれば、その機会費用が高いにもかかわらず、教室に100人いるような状況にも100万円でも支払うであろう。しかし、3歳児を対象とした就学前教育であれば、もちろん3歳児に仕事が出来るわけがないのでその機会費用も0と安いものであるものの、教室に100人もいるような状況では危なっかしくてたとえ100万円貰えたとしても我が子を行かせることを躊躇するであろう。また教員側からしても、ある程度成熟した子供であれば学級規模が大きくてもなんとかなるだろうが、成熟していない子供を大人数コントロールするのは難しい。

 

 

1.3. 学級規模削減の効果についての新たな議論-非認知能力から

 

前節の議論は学級規模削減が学力に与える影響、そして学力向上が将来賃金に与える影響から学級規模削減の効果に着目したものであった。しかし、近年これまでさほど分析されてこなかった非認知能力に着目した学級規模削減の効果が議論されてきている。

 

非認知能力とは、学校や労働市場でのパフォーマンスに影響を与える行動や態度のことを意味する。具体的にはやる気・好奇心・粘り強さ・自制心などと言ったものだ。学力は低学年からの積み重ねがあり、一度躓くとそこまで戻ってやり直さなければならないため学年とともに向上させることが難しくなるが、非認知能力は生徒の年齢や学年が上がっても向上の余地があると考えられている[*7]。

 

[*7] 非認知能力と賃金について分析した研究の代表として、Heckman et al (2006)がある。

 

Dee and West (2011)は非認知能力に着目して、Krueger (2003)と同じような手法で学級規模削減の費用対効果分析を行った。その結果、8年生段階(日本での中学2年生)での学級規模削減による学力改善は統計的に有意ではなかったが、いくつかの非認知能力に対しては改善効果が確認された。

 

この非認知能力がどの程度所得向上効果を持つのか推計した後、8年生での学級規模削減の費用対効果分析が行われた結果、4.6%前後の内部収益率があるとされた。このことから、これまでの学力に注目した学級規模削減の議論で考えられていたよりも、学級規模削減はより高い収益性を持ち、学年が上がっても効果があるのではないかとここ数年で考えられるようになってきている。【次ページへつづく】

 

 

 

シノドスのコンテンツ

 

●ファンクラブ「SYNODOS SOCIAL」

⇒ https://camp-fire.jp/projects/view/14015

 

●電子メールマガジン「αシノドス」

⇒ https://synodos.jp/a-synodos

 

●少人数制セミナー「シノドス・サークル」

⇒ https://synodos.jp/article/20937

 

 

 

 

1 2
シノドス国際社会動向研究所

vol.2019.4.15 

・打浪文子「知的障害のある人たちと「ことば」」

・照山絢子「発達障害を文化人類学する」
・野口晃菜「こうすれば「インクルーシブ教育」はもっとよくなる」
・戸谷洋志「トランスヒューマニズムと責任ある想像力」
・濵田江里子「「社会への投資」から考える日本の雇用と社会保障制度」
・山本章子「学びなおしの5冊 「沖縄」とは何か――空間と時間から問いなおす」
・鈴木崇弘「自民党シンクタンク史(6)――設立準備期、郵政民営化選挙後」