べつにメッシュが欲しいわけでなくて、仮想的なカメラを特定の姿勢にもっていった時に画面のそれぞれの画素がどの写真のどの位置をサンプリングすればいいかだけわかればいいのよね。それだけならなんとかなりそうじゃない?と思ったけど結局それぞれの写真から見た推定深度は欲しくてじゃあそれって結局SfMがやってることじゃない?てなってループしてきた。
7144民向け