INDEX
ですが、普段はどんな活動をしているのかイメージしにくい方も多いのではないでしょうか。世界銀行で衛星データを使った貧困の課題解決を試みているという若手のデータサイエンティスト、眞明 圭太(しんめい けいた)さんに、途上国を支援する衛星データと貧困研究の関係についてうかがってみました。
■世界銀行の仕事のひとつ、貧困推定。 なぜ必要?
――衛星データを貧困推定に使用されているそうですが、具体的にどのような手法なのでしょうか? 具体的な事例はありますか?
眞明:僕はデータサイエンティストとして、貧困を分析する道具に衛星データを使っています。最近では、ガーナの首都アクラで、スラムを見つけ出す「スラム判別」手法に衛星画像を使いました。これは、画像データに深層学習を加えた使い方なんです。
スラムとは、都市部で貧困な人々が集中して住んでいる地域です。そうした地域は、トイレがない、飲み水がないといった公衆衛生上の問題を抱えていたり、海抜が低くて水害の危険が高かったりするという問題を抱えています。もともとは農村から出稼ぎなどで都市部に流入してきた人々が、住まいを求めてスラムを形成してしまうわけですね。
世界銀行(以下:世銀)の目標は貧困の撲滅であり、支援にあたっては、対象となる貧困な人たちの住んでいる場所、つまりスラムの場所を知る必要があります。ですが、途上国では国勢調査や家計調査といった生活者の情報を知る統計調査がコストの問題であまり実施できません。ガーナの場合、一番新しい情報は2010年の国勢調査で、スラムの地域に関する情報が古く、その後に新たに増えた場所もたくさんあります。支援するためには、もっと直近の情報を知りたいわけです。
■衛星データからスラム街を特定する方法
眞明:解析する流れは、まず、2010年の国勢調査でスラムだと判明した場所は、現在もスラムだと仮定し、その情報を元に、新たにスラム化しているかもしれない場所を予測するというものです。
この解析を行うために、衛星画像と、畳み込みニューラルネットワーク(CNN)という機械学習でよく使われる方法を利用します。
アクラの高分解能の画像をグリッドに分割することで、機械学習に用いるデータセットを作成します。以前の国勢調査でスラムだと判明した箇所の画像にラベル付けすることで教師データとします。
スラムと、裕福な家庭が多い地域を衛星画像で比べると、家屋の屋根の大きさや、植え込みの緑のあるなしなどがまったく違うのですね。そこで、現地からの情報も加えて明らかにスラムではない場所の画像にもラベル付けします。こうして1400枚ほどのラベルをつけたデータセットを作り、1400箇所から学習させた上で、まだスラムかどうかわからない地域の画像を読み込ませ、予測させてみます。
すると、海沿いの地域に「スラム化していそうだ」という場所が見つかりました。現地で実際の支援にあたる人々は、「アクラの海岸沿いにスラムができている」という感触はあったものの、実際にどこなのかわからなかったのですが、その地域でスラムが増えていると把握することができました。
送ったデータは都市部でゴミの収集所を作るための基礎資料として役立てられているそうです。
――世界銀行にとって、衛星データはどのような強みを持つデータだと捉えられていますか?
眞明:宇宙から国境関係なく、地上の様子を観測できる衛星データは、世界銀行にとって今後も重要で興味深いデータだと考えています。まず、世銀という組織がどのようなものか、基本的なところから解説しますね。
■世界銀行の2つのミッション
眞明:世銀とは、発展途上国の支援を行う国際機関で、2つのミッションを持っています。ひとつは、「極度の貧困をなくす」こと。極度の貧困というのは、1日あたり1.9ドルまでの生活費で暮らしている人たちを指し、2015年には世界人口の10%程度いました。これを2030年までに3%へ減らすことを目標としています。もうひとつは「繁栄の共有」。支援を偏らずに行き渡るようにするということです。主なクライアントは、途上国政府がほとんどです。
世銀が行う支援には、「投資」がまず挙げられます。低金利または無利子で資金を支援する、贈与することもあります。支援対象となる国ごとに5年計画の長期目標があり、その計画に沿って農業や環境、教育など分野ごとにプロジェクトを立ち上げ、個別の課題解決に当たるわけです。
眞明:組織は教育、水管理、農業、電力など15ほどのセクションに分かれていて、僕は「Poverty and Equity(貧困・平等)」という部門にいます。貧困はすべての分野に関わるのですよね。組織はもう経済学から工学から地理学から、博士号を持った人ばかりで、大学の教授だった人が赴任してくることも多いですね。
その中には地域ごとの担当もあり、投資部門、つまり実際にお金を貸すプロジェクト実行にあたる人たちがいます。投資のためには、プロジェクトをどこでどのように実施するのか計画を立てなくてはなりません。
たとえば、ある国で貧困な人たちがいたとして、そうなってしまう原因があります。農業で作物を育てているにも関わらず、道路のインフラが整っていないために市場で農産物を販売して収入を得ることができないために貧困になっているような場合もあります。あるいは親自身が教育を受けていないため、自分の子供に教育を受けさせる選択肢が考えられず、現状から変わらない、つまり貧困から抜け出せないのかもしれません。
■世界銀行が考える衛星データの強みとは?
眞明:僕たちデータサイエンティストの役割は、これをデータで把握することです。ある国で農家はどこにどのくらいいて、インフラの問題で農産物を販売できない人はどの程度いるのか? ボトルネックになっているのは何のインフラなのか? 「誰がどこで貧困で、どのように困っているのか?」ということがわからないと貧困を解決できないので、課題解決の第1歩として、計画を立てるためのデータが必要なのです。
逆に言えば、データがなければ、課題解決の第一歩を踏み出すことができません。
これまで使っていたデータには、まず国勢調査や家計調査などの「世帯調査」がありますが、すべての国で過不足なくデータがあるわけではありません。
宙畑メモ:宇宙産業の市場規模
国勢調査は、国が定めた周期で全国民に対して状況を調査するもの。途上国の場合すべて人力で調査、つまり脚で回ることも多くて、対象の人数が多いため質問項目は数十項目程度と限られています。コストは1回あたり100億円規模でかかってきます。2020年の日本の国勢調査では、「国勢調査の円滑な実施及び経済統計の改善」という面目で818.7億円の予算が計上されていました。
もうひとつの家計調査は1地域からxx人、のようにサンプリングする調査。対象人数が比較的少なく、たくさんの質問項目を設定することができます。たとえば、ある世帯が1ヶ月間に購入したジャガイモやトマトの数なども聞くことができる。こうして家計ごとの経済規模を把握していくのです。
これらの世帯調査を元に、国ごとに「貧困ライン」という基準を作り、生活に使えるお金がある閾値を下回ったら貧困、上回れば貧困ではないとします。「貧困率」というのは、閾値を下回る人がどの程度いるのかという割合です。そのほかに国連では、国語や算数のスキル調査などもしています。
眞明:なぜなら、コスト等の面で国勢調査が実施できない国があるからです。何もデータが取れない国、あるいはデータを公表していない国もあります。また、調査は3~5年ごとの場合も多く、例えばCOVID-19が調査と調査の間に発生したとすると、感染症の影響により従来通りの調査ができないという問題も起きます。
このギャップを埋め、データを得るための取り組みとして、最近では衛星画像を多く利用しています。「裕福さ」というのはガーナの例での家の大きさのように、宇宙から見ればある程度わかりますし、衛星画像は世帯調査よりはるかに高頻度に取得できる情報なので、メリットが大きいのです。
――世帯調査というデータが十分に揃っていないところに対して、衛星を使って宇宙からのデータレイヤーを重ねていけるわけですね。
眞明:まさにそのとおり。そういうことです。
■世界銀行が利用する衛星データの種類
――利用する衛星データは、画像が多いのでしょうか?
眞明:実は、さまざまな種類のデータをつかっているんです。世銀で大きな仕事に、ある国の各世帯が貧困かどうかを測る、「貧困測定」があります。
基本的な方法で、先程の国勢調査と家計調査を使います。家計調査はサンプル数が少ないけれども質問数が多く、国勢調査は全世帯のデータを取るけれども質問数が少ないという特徴があります。
例えば、家計調査のデータから機械学習による予測モデルを作成し、国勢調査の全世帯に当てはめて「貧困地図(Poverty Map)」というものを作成する手法があります。この際に貧困地図の予測モデルの精度向上のために衛星データを使うわけです。
利用するデータは夜間光や、地図から得た道路の密度、正規化植生指数(NDVI)、気象データなど。これを各国に対して行うわけで、正しく使えば予測精度が上っていきます。気象データでは、気温や降水量などはもちろん、1年の洪水の頻度を利用している人もいます。
僕が行ったガーナのスラム化分析は、画像そのものを使うタイプですが、貧困測定の場合は衛星データの「特徴量」を使うタイプのものもあります。
――衛星から夜間の地上の人工照明の明るさを観測し、経済活動の規模を推定する「夜間光」はどのように利用されているのですか?
眞明:夜間光というのは僕にとって思い出の衛星データなんです。僕が学生のころからもともと扱っていたのは家計調査のデータ、つまりはテーブルデータでした。そのころは宇宙から見て地上の貧困のことが何かわかるとは想像もしていなかった。それが夜間光が経済活動を分析できると聞いて「ビビビッ」と来て感動したんです。発想がすごいですよね。
世銀では10年前から夜間光を経済分析に使っています。大雑把には、夜間の人工照明が明るいということは、経済活動が盛んだ、ということが夜間光のデータからわかります。今年3月に、モロッコでCOVID-19下の経済活動を夜間光で分析するという手法の報告がありました。
眞明:モロッコはGDPデータを四半期ごと公開しているのですが、そのデータと、夜間光の観測データを重ねてみたところ、夜間光とGDPがほぼ相関することがわかりました。つまり、夜間光は経済活動の指標として利用できることがわかったわけです。
そこで、コロナ前データの夜間光のデータを作り、経済活動の予測モデルを作成します。
一方で、実際にCOVID-19の影響下での夜間光観測データがあるわけですから、予測と実際の推移を比較してみたのです。すると、モロッコ全体の経済が感染症前と比較して10%も落ち込んでいることが判明しました。国全体だけでなく、都市ごとにモデルを作成し、都市単位での比較もできます。
GDPは国単位ですから、夜間光のほうが細かく違いを知ることができてとてもよい。夜間光には、GDPの完全な代理変数ではないこと、また人工照明の多い都市域では使えるけれども、もともと光量の小さい農村地域では変化がとらえにくいという欠点はあります。とはいえ、なんで誰もいままでやらなかったんだろう? というくらいすごいデータですよね。
――衛星データを使った貧困測定の手法の発展をリアルタイムで体感されて、今後どのように活用していきたいと思われますか?
眞明:そうですね、まず僕が現在取り組んでいるプロジェクトですが、対象の国は国勢調査や家計調査データがまったく公開されておらず入手できないため、これまで世銀は何も支援できなかったところなんです。最近ようやく実態把握プロジェクトが進行し始めています。
衛星画像よりも、まずは気温、降水量など気象データのを利用から始まっています。意外に世界の研究者が研究用に作成した処理済の衛星データを公開している場合もあり、そうしたデータセットの中から、例えば耕作地のデータを利用して耕作が行われている地域を推定することができるようにもなりました。これまで家計データがまったくなかったところですから、耕作がどこで行われているのか、都市がどこにあるのかを推定できるだけでも違います。夜間光も利用していますね。
衛星データによる調査手法というのは、その国固有の部分が大きく、ガーナで開発したスラム化調査のような手法を他の国にまで一般化できるかどうかはまだわからない部分も多いです。
たとえば、国勢調査を実施していない国の場合、学習データとして利用できる10年前のデータすらないわけですね。複数の国で観測したスラムの画像を学習に使えばよいのかもしれませんが、家屋というのは、屋根の素材など国によって特徴が大きく異なります。ただ、気候が似ていれば共通する部分があるかもしれないわけですし、そうした地域にも今後は手法を展開できれば理想だと思っています。それはきっと、支援のオペレーションチームの役にたつはずです。
今後は、小型衛星のコンステレーションによる渋滞のデータも利用できるようになるそうですし、日本が開発した3D地図の「AW3D」等も使ってみたい。そして、衛星画像を使った予測モデルをデータの少ない国に展開していければ思っています。
編集後記
今回のインタビューでは、衛星画像を利用しながら支援するための情報を収集している、という世界銀行でのお話をお聞きしました。
日本に暮らしていると、ものだけでなく、情報があるのも当たり前、と思ってしまいがちですが、そうでない国も多い。そしてそのような国を支援するためには情報が必要で、だけど情報を現地調査するにもハードルが高くて・・・そのようなときに衛星データが役に立つのだ、ということを知ることができました。
情報がまったく出てこない白紙の国に対して、現状はこうなっているのだ、という色を衛星データ解析の結果から塗ることで、適切な支援を行い、国を豊かにしていく。そうすることで、世界銀行のみならずSDGsの目標でもある貧困を撲滅することに繋がっていく小さな一歩目を踏み出すことができるのですね。