この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)
出典検索?: "ベクトルのなす角"
平面や空間上では、ふたつのベクトルのなす角は図形的に求めることができる。そしてベクトルはさらに、図形とは無関係なベクトルに一般化されるが、この一般的なベクトルでも二つのベクトルのなす角を定義することができ、それにはベクトルの長さと内積を用いる。 任意の零でないベクトル x , y {\displaystyle {\boldsymbol {x}},{\boldsymbol {y}}} について、次の値がベクトルのなす角となる。 θ = Arccos ⟨ x , y ⟩ ‖ x ‖ ‖ y ‖ {\displaystyle \theta =\operatorname {Arccos} {\frac {\langle {\boldsymbol {x}},{\boldsymbol {y}}\rangle }{\lVert {\boldsymbol {x}}\rVert \lVert {\boldsymbol {y}}\rVert }}} ?x, y? は x, y の内積、||x|。は x のノルム(長さ)である。主値は 0 ≦ θ ≦ π とするのが普通である。 ベクトルのなす角が 0 の場合、二つのベクトルは一次従属すなわち方向が同じであり、π/2 の場合は直交する。 ベクトルのなす角 θ の余弦である次の値をベクトルの類似度として、以下を定義する。 cos θ = ⟨ x , y ⟩ ‖ x ‖ ‖ y ‖ {\displaystyle \cos \theta ={\frac {\langle {\boldsymbol {x}},{\boldsymbol {y}}\rangle }{\lVert {\boldsymbol {x}}\rVert \lVert {\boldsymbol {y}}\rVert }}} この値は0から1の間の値を取るが、2つのベクトルx, yの向きが等しい(一次従属)ほど1に近づき、類似していることが分かる。 n個の要素をもつデータをn次のベクトル空間に落とし込み、それらがどれだけ類似しているかを比べるのにこの性質が利用されることがあり、特にコサイン類似度(英: Cosine similarity)と呼ばれる。この類似度を高速に算出するアルゴリズムにMinHash
定義と性質
類似度
関連項目
ハミング距離
相関
情報検索