二項係数を組合せ論的量として表記した二項定理は、二項係数の三角形パターンについて記述した11世紀アラビア数学アル?カラジ(英語版)の業績にも見つけることができる[5]。アル?カラジはまた、原始的な形の数学的帰納法を用いて二項定理およびパスカルの三角形に関する数学的証明も与えている[5]。ペルシアの詩人で数学者のウマル・ハイヤームの数学的業績のほとんどは失われてしまったが、彼は恐らく高階の二項定理についてよく知っていた[2]。低次の二項展開は13世紀中国の楊輝[6]や朱世傑[2]の数学的業績にも見られる。楊輝は遥か旧く11世紀の賈憲(英語版)の書の方法に従った(しかし、それらもまた今日では失われてしまった)[3]:142。
1544年にミハエル・シュティーフェル(ドイツ語版、英語版)[7]は "binomial coefficient"(「二項係数」)の語を導入し、(1 + a)n の (1 + a)n−1 での表し方を、「パスカルの三角形」により示した[8]。ブレーズ・パスカルは、今日彼の名を冠して呼ばれる三角形の包括的な研究を論文(英語版)Traite du triangle arithmetique (1653) に著したが、これらの数の規則性はルネッサンス後期ヨーロッパの数学者たち(例えばシュティーフェル、タルタリア、シモン・ステヴィンなど)には既に知られていた[8]。
アイザック・ニュートンは有理数冪に対して成り立つ一般化された二項定理を示したと考えられている[9][8](二項級数を参照)。 定理によれば、x + y の冪を展開すると、冪指数 n を自然数として、 ( x + y ) n = ( n 0 ) x n + ( n 1 ) x n − 1 y 1 + ( n 2 ) x n − 2 y 2 + ⋯ + ( n n − 1 ) x 1 y n − 1 + ( n n ) y n {\displaystyle (x+y)^{n}={\binom {n}{0}}x^{n}+{\binom {n}{1}}x^{n-1}y^{1}+{\binom {n}{2}}x^{n-2}y^{2}+\cdots +{\binom {n}{n-1}}x^{1}y^{n-1}+{\binom {n}{n}}y^{n}} (1) となる。この展開した式の係数 (n
定理の主張
k) を二項係数と呼び、正整数となる。この等式はしばしば二項公式
x0 = y0 :=1[注 1]と定義すれば、全ての項を総和記号 Σ で一律に表示できる: ( x + y ) n = ∑ k = 0 n ( n k ) x n − k y k = ∑ k = 0 n ( n k ) x k y n − k {\displaystyle (x+y)^{n}=\textstyle \sum \limits _{k=0}^{n}{\dbinom {n}{k}}x^{n-k}y^{k}=\textstyle \sum \limits _{k=0}^{n}{\dbinom {n}{k}}x^{k}y^{n-k}} (2) 最後の等号は、x, y についての対称性と、二項係数の列の対称性により得られる。 二項公式を簡略化した一変数版もよく知られる: ( 1 + x ) n = ( n 0 ) + ( n 1 ) x 1 + ( n 2 ) x 2 + ⋯ + ( n n − 1 ) x n − 1 + ( n n ) x n = ∑ k = 0 n ( n k ) x k . {\displaystyle (1+x)^{n}={\binom {n}{0}}+{\binom {n}{1}}x^{1}+{\binom {n}{2}}x^{2}+\cdots +{\binom {n}{n-1}}x^{n-1}+{\binom {n}{n}}x^{n}=\textstyle \sum \limits _{k=0}^{n}{\dbinom {n}{k}}x^{k}.}