論文紹介(近藤)

一学期のゼミ・講義などで読んだ主な論文を紹介します。

単一の2D画像内にあるオブジェクトをインタラクティブに操作し、再配置する画像編集手法の提案を行っています。
この手法のポイントは、一つの画像から三次元空間を構築し、違和感無く操作できるようにすることにあります。
移動させたいオブジェクト群(直方体に近似できるものが理想)の頂点配置からカメラ配置と消失点の位置を計算し、影とオブジェクトの対応付けから光源位置を検出します。
これらを組み合わせた後にオブジェクトと背景に簡単な画像補完を適用することで、ユーザはインタラクティブな操作でオブジェクトを(擬似的な)三次元空間上で移動させることが出来ます。
実際に動画を見てみるとわかりますが、かなり現実に近い挙動が期待でき、制約もそれほど厳しいものではないので、非常に興味深い研究であると言えます。

人間画像のデータベース生成の為のパイプラインを提案している論文です。
人間画像に限らず、膨大な量のデータを扱うデータベースを生成する際には出来る限りデータ生成を自動化することが求められます。
手動でデータを生成するには限度があるのでこれは当然のことですが、従来の人間画像データベースでは自動化が困難とされていたため、数千程度のデータしか扱えませんでした。
この論文では、
・動詞をキーワードとした画像検索により対象画像内の人間のポーズと単語(動詞)の関連付け
・画像内の人間検出と、検出ボックスからはみ出やすい皮膚パーツの高精度な検出
を行うことで数十万規模のデータベース作成に成功しています。
また、色情報や人間形状の法則などから画像に様々な属性を付加し、応用の幅も広くなっています。

ここからは講義「情報システムデザイン論」で読んだものです。
コンピュータグラフィックスと直接関係があるわけではありませんが、視覚的表現ということで参考になる面もあるかと思います。

主に生物学などで用いられる、階層構造(ツリー構造)の比較手法の提案になります。
生物学における系統樹は、生物(有機体)における進化の関係を示すツリー構造の典型例の一つであり、論文内ではこの系統樹を同時にインタラクティブに解析することで、進化のプロセスについてより高度な考察を得ることが出来ます。
従来の手法では三つ以上のツリー構造を局地的に比較する手段が無く、それを直感的に見易く達成したこの手法には一定以上の価値があるのは間違いないと思います。他方で生物学の専門家と密接に連携して行われた研究であるため、応用の幅が狭く専門家以外には理解し難い部分が多いという意見も質疑で多数見受けられました。

CommandMapsと呼ばれる、GUIアプリケーションにおけるコマンド選択コンポーネントの提案を行っています。
Microsoft office のリボン(メニューバー等の代わりに配置されているタブ表示インタフェース)を、特定キーを押している間だけ全て展開し、全てのコマンドをワークスペース上に表示する技術、と言えば比較的分かりやすいかもしれません。
この手法はユーザの空間記憶能力を頼りに操作速度を向上させることが目的であり、熟練者ほど有効であると考えられる一方で、初心者に対しても被験者実験を行い、従来手法と同等以上の結果が出ることを示しています。
この論文の提案手法については有効性に疑問を持つ人も多く、特に実験がマウスによるコマンド操作のみを対象としているため、熟練者は結局キーボードによるショートカットを好んで用いるのではないかという意見が多数出ました。しかし、熟練者も初心者も効果的に操作時間を短縮できる手法として、選択肢としては十分有りなのではないかと考えています。

(近藤)