Blog Listing

GAN(敵対的生成ネットワーク)の地理情報分野における可能性

AI(人工知能)ブームの火付けの一つになっているGAN(Generative Adversarial Nets:敵対的生成ネットワーク)は現在も盛んに研究が行われています。地理情報分野においてもGANが注目されています。

本記事では最先端の地理情報分野におけるGANの研究を紹介します。

GANの概要と種類

2014年のIan J. Goodfellow氏の論文から派生して、今日ではさまざまなGANがあります。

GAN
cGAN(Conditional GAN)
pix2pix
ACGAN
InfoGAN
DCGAN
StarGAN
SAGAN
LSGAN
WGAN
cycleGAN

参考記事: https://qiita.com/enmaru/items/ce22bc6479cc39448019

地図の自動生成に用いられるGAN

さまざまに存在するGANのなかでも、注目されている一つがpix2pix です。

pix2pixとは、CVPR 2017で発表された論文 Image-to-Image Translation with Conditional Adversarial Networks で発表された手法です。2つのペアの画像から画像間の関係を学習し、画像を生成する予測モデルと、生成された画像が偽画像かどうか判定する判定器を競わせあうことで、その関係を反映したペア画像を生成する技術です。CGANの拡張版ともいえ、Pix2Pixは条件ベクトルの代わりに条件画像を使用し、画像から画像への変換問題を扱います。

原著論文では、地図から衛星画像へ、衛星画像から地図への変換においても実施事例として紹介されています。

source: https://arxiv.org/pdf/1611.07004.pdf figure.8

非常にくっきりと予測とされており、実用性が高い手法といえます。本手法は2016年の年末に知りましたが、地理情報データを携わってきた身として、もっとも衝撃的な手法でした。

LANDSATにおいて適用し、土地利用や地すべりの作成に用いられた事例 がQiitaから公開されています。どのような主題図を対象とするかでさまざまな可能性を秘めていますね。また、空間分解能が高い画像を生成するには、バンシャープン(Pansharpening)法が行われてきましたが、画像がエリアによって不足している問題や、手法上の難しさもありますが、こうした点においても解決の一途となりそうです。

pix2pixはPyTorchTensorFlow において、著者らよりソースコードが公開されており、簡単に試すことができます。ぜひお試しください。

実用性の観点

地理情報データの分析では、対象とする画像の空間分解能が高ければ高いほど、計算コストが高くなるという性質があります。こうした問題により、強力なGANの登場する一方で、実用のうえでは考慮しなくてはいけない問題といえます。

このような問題に有用な研究が、昨年に発表されていました。スタンフォード大学のSwetava Ganguli氏らによる GeoGAN: A Conditional GAN with Reconstruction and Style Loss to Generate Standard Layer of Maps from Satellite Images という論文において、より実践的な結果が報告されています。エンコーダ付とない場合でのcGAN、RealNVPを用いた場合の3パターンを試し、15エポックでハイパーパラメータの探索がなく、結果が得られたことが報告されています。

実際の説明動画はこちら。

予測精度はもちろんとして、このような学習の高速化に向けたデータセットの集め方やモデル構築の改善はとても重要な観点と考えられます。地理情報に限った問題ではありませんが、当面はこうした点が注目されていくものと思われます。直接は関係ありませんが、Deep Learningの実用においてタイルマップシステムの存在も大きいと感じさせられます。



Leave a Reply