この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)
出典検索?: "ジップの法則"
ジップの法則確率密度関数
N = 10の両対数スケールのZipf確率密度関数。横軸は順位k。この関数はkの整数値のみについて定義されていることに注意。点間の接続線は連続であることを意味してはいない。)
累積分布関数
N = 10のZipf累積分布関数。横軸は順位k。(この関数はkの整数値のみについて定義されていることに注意。点間の接続線は連続であることを意味してはいない。)
母数 s ≥ 0 {\displaystyle s\geq 0\,} (実数)
N ∈ { 1 , 2 , 3 … } {\displaystyle N\in \{1,2,3\ldots \}} (整数)
台 k ∈ { 1 , 2 , … , N } {\displaystyle k\in \{1,2,\ldots ,N\}}
確率密度関数 1 / k s H N , s {\displaystyle {\frac {1/k^{s}}{H_{N,s}}}} ここでHN,sはN番目の一般化調和数
累積分布関数 H k , s H N , s {\displaystyle {\frac {H_{k,s}}{H_{N,s}}}}
期待値 H N , s − 1 H N , s {\displaystyle {\frac {H_{N,s-1}}{H_{N,s}}}}
最頻値 1 {\displaystyle 1\,}
分散 H N , s − 2 H N , s − H N , s − 1 2 H N , s 2 {\displaystyle {\frac {H_{N,s-2}}{H_{N,s}}}-{\frac {H_{N,s-1}^{2}}{H_{N,s}^{2}}}}
エントロピー s H N , s ∑ k = 1 N ln ( k ) k s + ln ( H N , s ) {\displaystyle {\frac {s}{H_{N,s}}}\sum \limits _{k=1}^{N}{\frac {\ln(k)}{k^{s}}}+\ln(H_{N,s})}
モーメント母関数 1 H N , s ∑ n = 1 N e n t n s {\displaystyle {\frac {1}{H_{N,s}}}\sum \limits _{n=1}^{N}{\frac {e^{nt}}{n^{s}}}}
特性関数 1 H N , s ∑ n = 1 N e i n t n s {\displaystyle {\frac {1}{H_{N,s}}}\sum \limits _{n=1}^{N}{\frac {e^{int}}{n^{s}}}}
テンプレートを表示
ウィキペディア(30ヶ国語版)における単語の出現頻度
ジップの法則(ジップのほうそく、Zipf's law)あるいはジフの法則とは、出現頻度が k 番目に大きい要素が、1位のものの頻度と比較して .mw-parser-output .sfrac{white-space:nowrap}.mw-parser-output .sfrac.tion,.mw-parser-output .sfrac .tion{display:inline-block;vertical-align:-0.5em;font-size:85%;text-align:center}.mw-parser-output .sfrac .num,.mw-parser-output .sfrac .den{display:block;line-height:1em;margin:0 0.1em}.mw-parser-output .sfrac .den{border-top:1px solid}.mw-parser-output .sr-only{border:0;clip:rect(0,0,0,0);height:1px;margin:-1px;overflow:hidden;padding:0;position:absolute;width:1px}1/k に比例するという経験則である。Zipf は「ジフ」と読まれることもある。また、この法則が機能する世界を「ジフ構造」と記する論者もいる。
包括的な理論的説明はまだ成功していないものの、様々な現象に適用できることが知られている。この法則に従う確率分布(離散分布)をジップ分布という。ジップ分布はゼータ分布(英語版)の特殊な形である。
この法則はアメリカの言語学者ジョージ・キングズリー・ジップに帰せられている。ジップ以前に似た観察をしていた先行研究としてFelix Auerbach(英語版)、Jean-Baptiste Estoup(フランス語版)などの研究があり、ジップ自身もそのことを1942年の論文で紹介した[1]。 次のような様々な現象(自然現象、社会現象など)に成り立つ場合があることが確認されている: 一般のジップの法則は f ( k ; s , N ) = 1 / k s ∑ n = 1 N 1 / n s {\displaystyle f(k;s,N)={\frac {1/k^{s}}{\sum _{n=1}^{N}1/n^{s}}}} (ただし N は全要素の数、k は順位)と書き表される。 ここで元来のジップの法則では s = 1 である。このとき N を無限大にすると分母は収束しない(無限大に発散する、「調和級数」を参照)ため、元来のジップの法則では N を有限としなければならない(現実にもそう考えられる場合が多い)。 ただし s が1より少しでも大きい実数ならば、N を無限大にしても分母は収束し(ゼータ関数 ζ(s) に等しい)、k の値を無限にとりうる分布関数とすることができる。 ジップの法則は冪乗則 (Power law) の一種である。また、ジップ分布は変数変換によりパレート分布(連続分布)と同じ形になることが示されている。パレート分布の離散型である。パレートの法則はパレート分布の特別な場合に当たり、また80-20の法則とも関係がある。順位規模の法則とも呼ばれる。
法則が成立する現象の例
単語の出現頻度:言語全体だけでなく、例えば「ハムレット」など1作品中でも成り立つことが示されている。
ウェブページへのアクセス頻度
都市の人口(都市の順位・規模法則)
上位3%の人々の収入
音楽における音符の使用頻度
細胞内での遺伝子の発現量
地震の規模
固体が割れたときの破片の大きさ
論理的な定義
関連する概念
脚注[脚注の使い方]^ Zipf, George Kingsley (1942). “The Unity of Nature, Least-Action, and Natural Social Science”