エッジ検出
[Wikipedia|▼Menu]

エッジ検出(エッジけんしゅつ、: edge detection)は、画像処理コンピュータビジョンの用語で、特徴検出 (feature detection) や特徴抽出 (feature extraction) の一種であり、デジタル画像画像の明るさが鋭敏に、より形式的に言えば不連続に変化している箇所を特定するアルゴリズムを指す。
背景

画像の明るさの鋭敏な変化を検出する目的は、実世界の属性の重要な事象や変化を捉えることである。一般的な画像形成モデルにおいて、画像の明るさの不連続な変化は次のような事象と一致する可能性がある。

深さが不連続である。

面の向きが不連続である。

材質が変化している。

照明が変化している。

理想的には、画像にエッジ検出を施すことで、物体の境界を示す連続する曲線が得られ、面の向きが不連続に変化している部分(要するに角)も曲線として得られる。したがって、エッジ検出を画像に施すことで処理すべきデータ量が大幅に削減され、相対的にあまり重要でない情報を排除しつつ、画像の構造的属性だけを保持する。エッジ検出が成功すると、その後の画像処理がずっと単純化される。しかし、それなりに複雑な実際の画像で理想的なエッジを抽出するのはそう簡単ではない。実際の画像から得られるエッジは、興味深い現象と一致しない「偽のエッジ」があったり、エッジ曲線が途切れていて「断片化」していることがあり、その後の画像処理を複雑にしている。
エッジの特徴

3次元のシーンの2次元画像から抽出されるエッジは、視点依存のエッジと視点独立なエッジに分類できる。視点独立のエッジは、3次元の物体の本質的な特徴を反映したもので、表面の形状などに対応している。視点依存のエッジは、視点が変わると変化するもので、どの方向から撮影するかに依存している。例えば視点によって物体同士が重なる場合などである。

典型的なエッジは、例えば赤のブロックと黄色のブロックの間の境界がある。一方、直線状のものは数ピクセル幅の色が異なる部分が背景と違っている。この場合、その物体の両サイドにエッジを検出することになる。

エッジは画像処理の多くの応用で極めて重要な役割を担っており、特にマシンビジョンシステムで制御された照明下で製品を撮影して、それを解析する場合によく使われる。しかし、@media screen{.mw-parser-output .fix-domain{border-bottom:dashed 1px}}最近[いつ?]では前処理としてエッジ検出を行わずに画像処理する手法の研究[要説明]が進んでいる。
単純なエッジモデル

書籍には理想的なエッジの検出が説明されているが、実際の画像から得られるエッジは理想のエッジとは程遠く、一般に以下のような点に影響を受ける。

被写界深度が有限であるため、それ以外の部分はピンぼけになる(点拡がり関数)。

光源が理想的な点光源でないため、影の境界がぼやける(半影)。

物体の丸い角における陰影

物体のエッジ近辺での局所的な鏡面反射拡散反射

以下のモデルは実際の画像におけるエッジの可変性を完全に捉えているわけではないが、誤差関数 erf {\displaystyle \operatorname {erf} } はエッジのぼやけをモデル化する単純な方法としてよく使われている[1][2]。1次元の画像 f {\displaystyle f} があり、 x = 0 {\displaystyle x=0} の位置に1つのエッジがあるとき、そのモデルは次のように表される。

f ( x ) = I r − I l 2 ( erf ⁡ ( x 2 σ ) + 1 ) + I l {\displaystyle f(x)={\frac {I_{r}-I_{l}}{2}}\left(\operatorname {erf} \left({\frac {x}{{\sqrt {2}}\sigma }}\right)+1\right)+I_{l}}

エッジの左側では、輝度は I l = lim x → − ∞ f ( x ) {\displaystyle I_{l}=\lim _{x\rightarrow -\infty }f(x)} 、右側では I r = lim x → ∞ f ( x ) {\displaystyle I_{r}=\lim _{x\rightarrow \infty }f(x)} となる。尺度パラメータ σ をエッジのぼやけ尺度と呼ぶ。
エッジ検出法蒸気機関のカラー写真にガウシアン平滑化を行った画像の例(元の画像はFile:Valve_original_(1).PNG

エッジ検出には様々な手法があるが、大まかに2種類に分類できる。探索ベースの手法とゼロ交差法をベースとした手法である。探索ベースの手法ではまず、通常1次微分で勾配を計算することでエッジの強さを計算し、勾配の方向からエッジの局所的方向を予測し、その方向の勾配が局所的に極大となる箇所を探す。ゼロ交差法ベースの手法では、対象の画像から計算した2次微分式でのゼロ交差を探すもので、一般にラプラシアンでのゼロ交差か非線形微分式でのゼロ交差を探す。エッジ検出の前段階として平滑化(ガウス平滑化が一般的)を行うのが普通である(ノイズリダクション参照)。

エッジ検出法は、主に利用する平滑化フィルタの種類とエッジの強さの計算方法が異なる。多くのエッジ検出法は画像の輝度の勾配計算に基づいており、X軸方向とY軸方向で勾配を見積もる計算に使うフィルタの種類もそれぞれで異なる。
キャニー法 (Canny edge detector)キャニー法を適用した結果「:en:Canny edge detector」も参照

ジョン・キャニーは1986年[3]、エッジの検出・局所化・複数応答の最小化を可能にする理想の平滑化フィルタを数学的に検討した。彼はこれらの仮定に基づく理想のフィルタが4つの指数項の総和で表されることを示した。また、そのフィルタはガウス関数の1次微分で近似できることも示した。彼はまた「非最大(エッジ)抑制」という観念を導入した。それは事前平滑化フィルタを適用したとき、エッジが勾配方向の勾配の大きさが局所的な極大となる箇所であると定義したものである。

同氏はコンピュータビジョンの先駆者だが、キャニー法は今[いつ?]でも最先端のエッジ検出法である。事前条件が特殊でない限り、キャニー法よりも性能のよいエッジ検出法を見つけることは難しい。

キャニー・デリチェ法[4] (Canny-Deriche detector) もキャニー法と同様の数学的手法で得られたエッジ検出法だが、離散的観点から出発しているため、指数フィルタやガウシアンフィルタではなく画像平滑化の再帰フィルタを生み出した。


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:28 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef