マークアップ言語
[Wikipedia|▼Menu]
.mw-parser-output .hatnote{margin:0.5em 0;padding:3px 2em;background-color:transparent;border-bottom:1px solid #a2a9b1;font-size:90%}

ウィキペディア上でのページのマークアップ方法についてはHelp:ページの編集#マークアップWikipedia:スタイルマニュアルをごらんください。
.mw-parser-output .ambox{border:1px solid #a2a9b1;border-left:10px solid #36c;background-color:#fbfbfb;box-sizing:border-box}.mw-parser-output .ambox+link+.ambox,.mw-parser-output .ambox+link+style+.ambox,.mw-parser-output .ambox+link+link+.ambox,.mw-parser-output .ambox+.mw-empty-elt+link+.ambox,.mw-parser-output .ambox+.mw-empty-elt+link+style+.ambox,.mw-parser-output .ambox+.mw-empty-elt+link+link+.ambox{margin-top:-1px}html body.mediawiki .mw-parser-output .ambox.mbox-small-left{margin:4px 1em 4px 0;overflow:hidden;width:238px;border-collapse:collapse;font-size:88%;line-height:1.25em}.mw-parser-output .ambox-speedy{border-left:10px solid #b32424;background-color:#fee7e6}.mw-parser-output .ambox-delete{border-left:10px solid #b32424}.mw-parser-output .ambox-content{border-left:10px solid #f28500}.mw-parser-output .ambox-style{border-left:10px solid #fc3}.mw-parser-output .ambox-move{border-left:10px solid #9932cc}.mw-parser-output .ambox-protection{border-left:10px solid #a2a9b1}.mw-parser-output .ambox .mbox-text{border:none;padding:0.25em 0.5em;width:100%;font-size:90%}.mw-parser-output .ambox .mbox-image{border:none;padding:2px 0 2px 0.5em;text-align:center}.mw-parser-output .ambox .mbox-imageright{border:none;padding:2px 0.5em 2px 0;text-align:center}.mw-parser-output .ambox .mbox-empty-cell{border:none;padding:0;width:1px}.mw-parser-output .ambox .mbox-image-div{width:52px}html.client-js body.skin-minerva .mw-parser-output .mbox-text-span{margin-left:23px!important}@media(min-width:720px){.mw-parser-output .ambox{margin:0 10%}}

このページのノートに、このページに関する要望があります。
要望の要約:「マークアップ」と「マークアップ言語」の使い分け
SGMLで定義されたマークアップ言語がオックスフォード英語辞典の電子版を記述するのに利用されている。これによって、HTMLへの変換が容易となるだけでなく、高度なクエリの実行が可能となる。

マークアップ言語(マークアップげんご、: markup language)は、組版指定に使われる言語と言える[1][2]。視覚表現や文章構造などを記述するための形式言語である。テキストファイルであることが多いが、バイナリデータによる形式もある。

英語の「markup」という語は英語圏の出版業界で著者、編集者、印刷者の間で指示を伝える方法を意味していた(#語源を参照)。
特徴

マークアップ言語には様々なものがあるが、ここでは例としてHTMLにおける短い節を示す。 <h1>ガンカモ科</h1> <p> ガンカモ科にはカモ、ガン、ハクチョウが含まれるが、 それらは<em>非常に近い種であるというわけではない</em>。 </p>

HTMLでは、山括弧で囲ったタグにより、要素をマークアップする。要素の頭部と尾部にあるものがタグである。つまり、タグで囲まれた全体が要素である(タグも含む)。このHTMLの例では、.mw-parser-output .monospaced{font-family:monospace,monospace}h1 という第1レベルの見出し (headline) の要素があり、それに引き続いて1段落の文章が含まれているp要素(paragraph = 段落)がある。
分類

HTMLの変遷などの結果意識されるようになった、Web業界などにおけるマークアップ言語に対する理解として、3つに分類するものがある。視覚マークアップ、手続きマークアップ、意味マークアップである。
視覚マークアップ

視覚マークアップとはテキスト中の「手掛かり」から文書構造を推論しようという試みである。例えば、テキストファイルでは文書のタイトルの前にいくつか改行を入れたり、スペースを空けたりすることがあり、これらはレイアウトなどの視覚表現を暗示している。ワードプロセッサデスクトップパブリッシングソフト、いくつかのテキストエディタにはその種の慣習から構造を推論するものがある。
手続きマークアップ

視覚マークアップが暗黙的であったのに対し、手続きマークアップは明示的に視覚表現の命令(ディレクティブ)を記述する。処理系はこの命令をファイル中の出現順に解釈する。例えば、タイトル文の直前に「中央揃えモードに移る」「文字サイズを大きくする」「書体ボールドにする」などの命令を記述し、タイトル文の後にそれらの命令の終了を記述する、といったものである。手続きマークアップの処理系の例としては、nroff・troffTeX・Loutがある。
意味マークアップ

手続きマークアップは特定の視覚表現を実現する処理上の命令を付与するものであるが、意味マークアップはテキストの断片に印を付けていくものである。例えば、ウェブサイトの更新情報を記述するための Atom という言語には updated タイムスタンプを印すマークアップがあり、情報項目が最後にいつ更新されたのかを発行者が表明するのに使われる。Atom の規格では updated の意味するものについて論じており、そのマークアップ形式についても規定されているが、それがユーザに対してどのように表示されるのか、またそもそも表示されるべきなのかについては何の規定もない。このマークアップは処理系ごとに様々な用途に使われ、その中には Atom 言語の設計者たちが予想もしなかったものが多く含まれるだろう。SGMLXMLは意味マークアップ言語の設計を支援するために設計された仕様(メタ言語)である。

以上は概念的な分類であって、実際にはどのシステムでも別種のマークアップが共存している。例えばHTMLでは、純粋な手続きマークアップ(ボールドのための B など)と純粋な意味マークアップ(BLOCKQUOTE や href 属性など)が共存している。HTMLにはさらに PRE 要素があり、視覚マークアップの領域を囲んで、テキストをタイプしたとおりに表示させることもできる。

マークアップ要素とその使用に関する規則は通例、特定の企業やコミュニティごとの様々な種類の文書に対応するため、標準化団体によって開発される。最初期の例としては CALS があり、アメリカ軍で技術マニュアルに利用されていた。すぐに大規模文書を管理する必要のある企業がこれに続きだし、航空機、電気通信、自動車、コンピュータハードウェアのマニュアル用のタグ群が開発された。これはこの種のマニュアルの多くが電子的に配布されるきっかけとなり、企業は1つの(意味マークアップによる)オリジナルから印刷物、オンライン、CD版などを作り出すことができた。特筆すべき例は、サン・マイクロシステムズであり、ジョン・ボサック(英語版)がSGMLを複数媒体向けの文書配布に採用し、大幅なコスト削減を達成したことである。

現在では多くのマークアップ言語が存在する。よく知られたものでも DocBookMathMLSVG・Open eBook・TEIXBRLなどがある。多くはテキストのためのものだが、その他の用途で使われる専門化された言語もある。

汎用マークアップとは意味マークアップの別名である。現在のほとんどの意味マークアップシステムは文書を木構造に構造化する。また同時に、文書の一部分を文書内の他の箇所から参照する(クロス・リファレンス)手段を提供している。構造化によって、ソフトウェアが文書構造を(BLOBではないものとして)把握することができ、文書はデータベースとして扱うことが可能になる。関係データベースが持っているような厳格なスキーマを持たないので、「半構造化データベース」と呼ばれる。

2000年を過ぎたころから、木構造以外の文書構造に関する大きな関心が現れてきた。例えば、古代の宗教文学では文献構造(本・章・節・文)以外にも、修辞構造や散文構造が広く用いられる(ストーリー・引用章句・段落など)。これらの文書単位は文中でたびたび交差するので、簡単には木構造のマークアップシステムでデータ化することはできない。このような構造をサポートする文書モデリングシステムにはMECS[注釈 1]TEI Guidelines の一部やLMNL・CLIXなどがある。

意味マークアップの第一の長所はその自由度だとみなされている。テキストの断片が「どのように表示されるべきか」ではなく「何であるか」と印されていたなら、その言語の設計者が予想もしていなかった便利な用途でその断片を処理する処理系が作られるかもしれない。例を挙げると、HTMLのハイパーリンクは、元々、リンクをたどる人の手で利用されるために設計されたが、検索エンジンによって、インデックスするべき新しいリソースを発見するため、またウェブ上のリソースの人気を測るためにも利用されている。

意味マークアップはまた、文書の視覚表現の変更を効率化する。例えば、イタリック斜体)の表現を「強調」あるいは「外国語」の意図を示すために使うとする。両方とも単に表示方法の命令でイタリックとマークアップすると、両者の意図の違いが記録されず、区別が困難になる。後に外国語をイタリックにしない視覚表現に変更しようとすると、全てのイタリック部分をひとつずつ人間が判断して選り分ける作業が必要になる。しかし意味マークアップでは両者を区別してマークアップするので、視覚表現の変更が容易になる。
歴史
語源

「マークアップ」[注釈 2]という用語は、英語圏で伝統的な出版の作業過程である原稿の「マーキング・アップ」[注釈 3]という作業から派生した。「marking up」とは、原稿用紙の余白に印刷に関する指示の記号を書き加えることである。「マークアップ・マン」[注釈 4]や校正者と呼ばれる専門家が、文章の各部分にどんなスタイル、書体、サイズを適用すべきかなどを記して組版の担当者に原稿を渡すという作業が、何世紀にもわたって行われていた(校正記号についての詳細は「校正」の項目にある)。英語のmarkupに対応する印刷用語は、組版指定であり、書体・文字サイズ・行数・行間・字数・字送りなど,組体裁を定めるうえで必要となる情報を指定することである[3]


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:36 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef