ここから本文です

ウィキペディアが機械翻訳に汚染されてめちゃくちゃだって

7/16(火) 10:21配信

ギズモード・ジャパン

お世話になってます。

Wikipedia(ウィキペディア)さんには何から何まで。翻訳者の友と言ってもよいのではないかと思います。特に便利なのは、左のメニューから選択できる各国語版の存在ですよね。これって英語では何て言うの?っていうときに使えますし、逆にこの薬や花の名前は日本語でなんだっけ、という時にも使えます。これはみなさんもご存知ですよね。

【全画像をみる】ウィキペディアが機械翻訳に汚染されてめちゃくちゃだって

でも、実は本当に使えるのは英語版のWikipediaで、翻訳版の中には機械翻訳に汚染されてしまっている理解不能なWikipediaもあって、その言語の話者を困惑させているという事実はご存知でしょうか。

Wikipediaの方針とガイドラインには「ウィキペディアの目的は、信頼されるフリーな百科事典を、 質も量も史上最大の百科事典を創り上げることです 」とありますね。日本語のWikipediaはほとんどが日本語のネイティブが書いていることがわかるものですが、どうやら各国語のWikipedia、特にあまり人気のない(?)言語に至っては、この編集を機械翻訳でやりはじめたら、読者が困惑しはじめたという事態が発生しているようです。

英語と各国語のWikipediaには情報量に違いあり

Wikipedia最大のコミュニティはもちろん英語で、100万件以上の記事を有する言語は300カ国語中わずか15カ国語。もちろん日本語もその中に含まれています。なんでも統計をとるので有名なInternet World Statsのサイトによれば、ネットで使用されている言語のトップ10にも日本語は含まれています。1位はもちろん英語で次は中国語です。中国ではWikipediaにアクセスできないので必然的に記事数は少し減ります。それでも100万件以上の記事は有しています。

記事の内容についてですが、ときには英語と各国語との差が激しいことがあります。これには気づいている方もいらっしゃるかもしれませんが、英語の文字量と日本語の文字量が違うことも多々あります。また、見ることのできる言語が少ない記事もたくさんあるんです。まあ、ボランティアに頼っているWikipediaですから、仕方ないといえば仕方ないのかもしれませんが。

The vergeによれば、WikipediaはGoogle Translate と提携して記事を翻訳する計画があることが分かっています。Wikimediaのプレスリリースによれば、「ズールー語の話者は1200万人以上いるにもかかわらず、Wikipediaの記事数はわずか1100にすぎない」と嘆いています。多国語に広げたいというわけです。

1/2ページ

最終更新:7/16(火) 10:21
ギズモード・ジャパン

こんな記事も読まれています

あなたにおすすめの記事