このページはWikipedia:井戸端での過去の議論などを保存したものです。
他の過去ログはWikipedia:井戸端/過去ログに保存しています。
ここでの議論を継続するときにはWikipedia:井戸端にてお願いします。目次
Wikipedia:井戸端会議ログ8#記事カウントの問題
Wikipedia:井戸端会議ログ8#駅名と地名の曖昧性の回避について
Wikipedia:井戸端会議ログ8#路線名の前に会社名をつけるか否か
まずは経緯を報告します。
なかなか増えない記事数の謎という題で、以前井戸端でも話題にしたことのある記事数問題です。Wikipedia:井戸端会議ログ1
コンマがないと記事として数えないことから、日本語のページで、相当に内容や長さがあるものでも、記事としてカウントされていないものがあるのが現状です。
その議論を受けて、英語版の ⇒Wikipedia:What is an articleのノート(トークページ)へ書き込みをしたのですが、返事などはありませんでした。
先月には、ウィキペディア全般の問題を扱うメーリングリストWikipedia-lの方で、記事カウントの問題がとりあげられたことがありました。日本語版のウィキペディアが1000ページを突破したというアナウンスメントを(英語版の方へ)出したことを受けて普段は来ない方がやってきてサイトの統計を見て、ページ数に比べて記事数が少ないことに驚いて質問をしていました。 ⇒アーカイブにある[Wikipedia-l] japanese wikipedia: article count and embassyというタイトルのやりとりがそれです。
Aoinekoさんが日本語では英語のコンマを必ずしも使わないことなどを説明し、僕も後から加わって記事数カウントはファイルのサイズを基準にしてほしいということを伝えたのですが、ブライオンさんの返事では、それをやると記事カウントが減ってしまうので反対する人が多いのだそうです。 その議論はそれっきりだったのですが、先ほど、同じリストでブライオンさんが ⇒[1] 他にいい案が出ない限り、コンマのある記事の数を数えるのをやめて、ファイルサイズがゼロ以上、という方式に変える、と宣言していました。12時間以内に実施するそうです。 フランス語版の方で、記事内に <--!,-->という風にコンマを埋め込んで記事数を水増ししているケースを見つけたことや、これまで英語版の方で記事数10万を達成したいと願う人たちがカウント方式の変更に反対していたけれど、堪忍袋の緒が切れたというようなことを書いています。 ちなみに問題の記事はこちらです。 ⇒[2]
一応、これまで日本語版のユーザーの間でもぽつぽつ話題になっていたことなので、ここに報告します。もしもどなたかが意見などを書き込んだ場合、メーリングリストの方にも報告しようと思います。
ちなみにメーリングリストは誰でも参加できるものなので、僕を通す必要などはありません。日本語で書いても、読める人がいる(日本語版の登録ユーザーでもあるAoinekoさんとか、TakuyaMurataさんとか)ので、まあ誰かが訳してくれたり、大意を伝えてくれたりすると思います。英語以外の言語での投稿もあるリストですし。 あと、僕もこれから10時間近く留守にする可能性もあるので、ブライオンさんの実行前に間に合わないような可能性もあります。(だとしても意見を伝えることは今後の変更などに役立つ可能性はもちろんあると思います。)
以上で報告部分は終わりです。
以下は私見です。
新しく書いただけ記事数が増えると、やっていて張り合いがありますし、他の言語のウィキペディアとの比較や競争もできるようになるという利点はありそうです。
が、記事以外のページ(ノート、Wikipedia、利用者などのページ)はそれほど増えないので、ページ数の増分が記事数の増分の目安として使えます。日本語サイトの成長が他の多くのサイトと比べてかなり早いようだということもまあわかります。
僕は日本語版がここまで成長した背景にはそもそも英語版の10万ページ達成があった(それがわいヤードでとりあげられ、更に日本語版ワイヤードに翻訳され、日本語版の活動が活発になった)ことを考えると、日本語版の記事数を増やしたいからコンマ方式はやめろ、英語版は多言語版を犠牲にして自分たちに都合のいいようにやっている、とばかりも言えない感じがしています。そういう考え方をする人は少なくないらしいし、根拠のない考え方ではないと思うのですが。
あと、記事カウントは、例えば5千とか1万になったらまた発表を出してスラッシュドットなり他のメディア経由から新規参加者の方が来るきっかけをつくる、という形では役に立つかも知れませんが、それは数週間かそれ以上先のことだろうと思います。
最近のように、登録ユーザー数は少しづつしか増えないけれども、あれこれと表記やフォーマットについて議論を重ね、新しい記事も着実に増え、ウィキペディアの使い方がわかるユーザーが増え、ユーザー間のコミュニケーションが密になる、というのは新規参加者の大量参加に備える形として悪くないように思います。そこで、日本語サイトに限って言えば、当面は記事カウントが間違っていてもそれほど大きな問題ではないんじゃないか、ということを感じます。ブライオンさんにしてみればもう十分過ぎるほど待った挙句の宣言なのだろうと思うので、止めはしませんが。
それから、0バイト以上なら記事とする、という方法もやや無謀な感じがするので、せめて50とかにしたらどうか、と思います。(そうするとかえって処理が面倒なのかも知れませんが。)
とりあえずそんなことを書いて(僕個人の意見として)送ろうかと思っています。Tomos 07:15 2003年3月9日 (UTC)経緯のまとめをありがとうございます。私も、記事が増えないのは一抹の寂しさはありますが、それが目的のプロジェクトではないので、","カウント方式を否定はしません。でも&lt;!-- , --&gt;を使ったという話にはびっくりしました(^^;実際のところ、#REDIRECT[[]]のみのページは記事とカウントしなくて良いと思うので、この13バイト+日本語の記事名最大20字前後×3バイトとして「80バイト以上」を記事とすればどうか?と提案します。ただこれだと英語版の簡潔な記事が記事に含まれなくなって良くないかも知れません。ところで、今まで","をカウントしていたと言うことはファイルの内容をチェックしていたと言うことですよね。ということは、","ではない別のデータをチェックするようにしてはどうでしょうか。改行コードが2回以上入っていたら記事、とか…… 1ファイルあたりの数まで数える必要が加わると、処理としては難しいかな?- Gombe 00:47 2003年3月10日 (UTC)英語版の ⇒Wikipedia:What is an articleのノート(トークページ)へのTomosさんの書き込みですが、"End moved talk"に入れられているように見えますね。これは「議論の終わった話題」に当たるのかな? 末尾に書いたのが災いして、誰も読まなかったのかも。
- Gombe 01:09 2003年3月10日 (UTC)
コメントを使ったやり方は、誰かが「創造的会計」と評していました。(エンロンなどがやったあれです。)どうやら一件だけではないようです。
それからリダイレクトはカウントされない仕組みになっているんだそうです。
各方面からいろんな意見が出て議論がまとまる気配はありませんが、ブライオンさんは「3月13日7時(UTC)までに何かの代案が合意されなかったらおれはやるぞ、」と宣言しています。
改行コード2回、という案はメールで流しておきますね。
僕の書き込みをどの程度の人が読んだかはわからないのですが、「End moved talk」はその上の「Moved from Talk:Main Page」に対応しているんだと思います。その間に挟まった分はつまりメインページのノート(トークページ)でやってた分で、そこから下はそこから引っ越して来た後、と。一応末尾に発言を足す形になっているからまああれはあれでいいんではないかなと思います。議論の熱気が冷めたころに発言を足した辺りに問題があったのではないか、とは思わないでもないですが。。Tomos 01:23 2003年3月10日 (UTC)
メーリングリストで議論はまだまだ継続中ですが、ジミー・ウェールズさんが投票をやってみよう、という提案をしています。日本語版に関してはTakuyaMurataさんと、Gombeさんの意見(これは僕の解釈が入ったものですが)が出ているのですが、ブライオンさんが先ほど投稿したメッセージの中で、「じゃあとりあえず投票結果を待つことにして、とりあえず日本語版の方はリクエストに応じた変更をやります」と書いていました。
たぶんTakuyaMurataさんの「ゼロ以上というのが一番フェアーなんじゃないか」と意見を元に実装したのだろうと思います。
結果として、先ほどまで297本だった記事数は今は2976本になりました。
記事用の名前空間にあるファイルの総数は2983本で、サイズがゼロのものは7本あるようです。(時間と共に変動しますが。)
ちなみにMurataさんは、そもそも全言語のウィキペディアに単一の記事カウント方法でアプローチするのが間違っている、という意見や、こういう議題について英語でしか議論しないのはおかしいので、各言語版の井戸端などに通知を出してそれぞれ議論するのがいいんじゃないか、という意見も出しています。