この節には独自研究が含まれているおそれがあります。問題箇所を検証し出典を追加して、記事の改善にご協力ください。議論はノートを参照してください。(2012年1月)
中国語やサンスクリットなどの中国経由で入ってきた漢字を用いた語は漢語と呼んで区別し外来語に含めない。洋語のほか、アジアなど欧米以外の諸言語から入った語も外来語とされる。たとえ中国語から取り入れた語であっても、現代中国語音や現代広東語などの方言音による面子(メンツ)やワンタンなどは外来語に含まれる。ただし借用の時期が古い「馬(うま)」や「梅(うめ)」などは漢語でも外来語でもなく和語(大和言葉)に分類される。古い朝鮮語との類似が指摘される「カササギ」、「寺(てら)」などの語は仮に借用語であったとしても外来語には含めない。アイヌ語やニヴフ語のように日本またはかつて日本の支配が及んだ地域に土着する少数民族の言語由来の単語は外来語に含めないことも多い。なお、アイヌ語由来の語としては「ラッコ」「トナカイ」、ニヴフ語由来の語としては「クズリ」などが挙げられる。英語などの音訳に漢字を当てたものは一般に外来語と見なされない。画廊 (gallery)、簿記(bookkeeping、あるいはbookingという説も)などがある。また、日本語に入った年代の古い語や日本人の生活や文化に深く浸透したものを指す語の一部(「タバコ」「イクラ」「ルイベ」など)も外来語と認識されないことが多い。
西洋からの外来語が本格的に増加するのは、日本が近代化する幕末期?明治時代以降であるが、それ以前にも、16世紀にポルトガル語から入ってきたタバコやパン、江戸時代にオランダ語から入ってきたガラスなどが日本語としてよく定着している。これら比較的古い時代に流入した西洋語を「渡来語」と称し、近代化以降の外来語と区別することがある。西洋語が日本に本格的に入ってきたのは明治維新以降である。20世紀後半にアメリカ英語が台頭する前は各分野それぞれにおいて技術輸入元が違うことが多かったため、例えば、鉄道用語はイギリス英語、医学・政経用語はドイツ語、芸術用語はフランス語起源のものが多く使われている。
近年日本語では、和語や漢語が同義の洋語に置き換えられるか、同義の洋語が和語や漢語より優勢になる場合もある。「乳(ちち)、牛乳→ミルク(milk)」、「橙色(だいだいいろ)→オレンジ(orange)」、「葡萄酒→ワイン(wine)」、「乗合自動車→バス(bus)」などの例がある。また戦後の日本語では、古くから使用されているポルトガル語・オランダ語等からの外来語が、英語からの同義の語彙に置き換えられたりする場合もある。「ズック (蘭: doek) →カンバス・キャンバス (canvas)」、「ビロード (葡: veludo) →ベルベット (velvet)」などの例が挙げられる。
外来語をはじめとする新語に対して、旧来から存在する和語や漢語をあわせて「在来語」と表現する者もいる[9]。
稀に、外来語が日本人の姓になっている例もある。山口県を中心に見られる煙草谷(たばこたに)姓はその一つといえる。
外国語に借用された日本語の単語を「外来語」の逆として「外行語」と呼ぶ場合がある。
例:「Tsunami(津波)」など
外来語の導入の理由では、物と一緒に自然に入ってきた外来語と、日本人の側が意識的に入れた外来語があると思われる。物と一緒に自然に入ってきた物とは、日本に無い物が日本に入ってきた場合に、当然それを指し示す日本語もないために入ってきた語である。日本人が意識的に入れた外来語とは、菓子をスイーツに言い直すように、外国語で言い換えると格好良いと一般的に思われているため、販売促進などで言い換えられる語である。
外来語の表記・表現「外国語の日本語表記」も参照
日本語の場合、一般に外来語はカタカナで表記して区別されるが、「瓦斯」(gas)、「米」(meter)などのように漢字を当てる場合や、「頁」(page)のように訓読みになっている場合もある。ほかに、外来語との認識の薄い語がひらがなで表記される場合もある(「タバコ」を「たばこ」など)。また、2文字以上の漢字で表記されて熟字訓で読まれることのある語もある(「メリヤス」を「莫大小」、「タバコ」を「煙草」)。また、外来語を表記するために、国字(和製漢字)が作られた例もある(「ブリキ」を「錻力」または「錻」)。
また、英語において英語以外の言語に起源を求めることができる語のみにみられる"j"の文字、語頭に"v"を用いる綴り方(以上フランス語起源)、[k]と発音される"ch"(古典ギリシャ語、イタリア語)などのように、日本語についても同様に文字・綴り・発音の面において外来語に特有な次のような表記・表現がみられる。さらに外来語にのみあらわれる拗音風の仮名の組み合わせもある。「シ」「ジ」「チ」以外の「い段」音の仮名に「ェ」を組み合わせて「イェ」「キェ」等と表記したり、「い段」音以外の仮名に「ァ」「ィ」「ゥ」「ェ」「ォ」、または「ャ」「ュ」「ョ」をそれぞれ組み合わせて表記する。これらは、下の一覧表では外来語の表記に含めた。
第1字が「イ」または「ウ」である場合はそれが半母音化
これらの拗音風の外来語の表記は、できるだけ本来の外国語の発音に近づけるために1モーラで発音することを期待した表記であるが、なかには日本語母語話者には発音が困難であったり、従来からの慣用があるため、下記のように2モーラに発音したり、別の1モーラに置き換えて発音することがある。特に、「シ」「チ」「ジ」を除く「い段」直音に「ェ」を付した「イェ」「キェ」「ニェ」などや円唇化された子音を頭子音に持つ「ウィ」「クァ」「グァ」「スィ」などで表現される語の場合、日本語母語話者の多くは日常会話では、その2文字目を普通文字で表記した2モーラの「イエ」「ウイ」「クア」などで表現される語とは、意味上はもちろん、発音の上でもその違いをほとんど認識することはなく、その発音の可否にかかわらず多くの場合、いずれも2モーラに認識する(例:イェス/イエス、ウェハース/ウエハース、クェスチョン/クエスチョン、グァテマラ/グアテマラ、スェーデン/スエーデン/スウェーデン)。