日本語入力システム
日本語入力システムとは、日本語の漢字かな交じり文を入力するためのインプットメソッドである。
概要[編集]
- 使用文字数が数百を超える言語の文章を入力する際には、全ての文字に一つのキーを当てはめるキーボードは非現実的であるため、複数のキーの操作で一文字を入力するなどの仕組みが必要となった。
- 日本語の入力方法で現在主流なのは、かな漢字変換である。これが最初に実現したのは、JW-10である。
これは1編集者の私見。(編集者:早朝の掃除屋さん) |
---|
東芝の JW-1 を嚆矢とし、京大学派ではパターン認識[注 1]で著名な長尾真の率いる京大学派が覇を競い(Wnn は京セラに引き継がれている)、百花繚乱の時代があったが、いかんせん日本語文法の枠から出られなかったという憾みがある。
とかいった傾向があり、日本語文法に対する親和性が高いらしいことが知られている。
そんなわけで日本語の記述文法はそれなりに精度の高いもの(ただし、8ビットとか16ビットのCPU でメモリサイズが数百Kbとかのマシンで動かそうと思うと大変なのだが)がすでに動いており「漢字かな交じり文」と「ひらがな文字列」の相互変換くらいなら軽くこなすシステムもあった。 |
機能[編集]
この節はまだ執筆途中です。加筆、訂正して下さる協力者を募集中!
入力[編集]
この節はまだ執筆途中です。加筆、訂正して下さる協力者を募集中!
変換[編集]
この節はまだ執筆途中です。加筆、訂正して下さる協力者を募集中!
辞書[編集]
この節はまだ執筆途中です。加筆、訂正して下さる協力者を募集中!
学習機能[編集]
ユーザーの変換・確定結果を記憶し、それに基づいて入力予測を変更する仕組み。
一覧[編集]
名称 | 種別 | 開発元 | ライセンス | 料金 | 対応OS | 備考 |
---|---|---|---|---|---|---|
ATOK | かな漢字変換 | Just System | プロプライエタリ | サブスクリプション[1] | Windows, macOS, GNU/Linux, Android, iOS | |
Baidu IME | かな漢字変換 | Baidu | プロプライエタリ | 無料 | Windows | |
Google 日本語入力 | かな漢字変換 | プロプライエタリ | 無料 | Windows, macOS, ChromeOS, Android, iOS | ||
Microsoft IME | かな漢字変換 | Microsoft | プロプライエタリ | 無料 | Windows | |
mozc | かな漢字変換 | BSD | 無料 | Windows, macOS, GNU/Linux, Android, ChromiumOS | ||
Simeji | かな漢字変換 | Baidu | プロプライエタリ | 無料 | Android, iOS | |
VJE | かな漢字変換 | バックス | プロプライエタリ | 有料 | Unix系, MS-DOS, NEXTSTEP, Windows, PalmOS | 2005年に開発終了 |
ことえり | かな漢字変換 | Apple | プロプライエタリ | 無料 | macOS | 2013年に開発終了 後継は日本語入力プログラム (macOS) |
日本語入力プログラム (macOS) | かな漢字変換 | Apple | プロプライエタリ | 無料 | macOS |
批判[編集]
これは1編集者の私見。(編集者:早朝の掃除屋さん) |
---|
日本語を母語としない非・ネイティブの日本語使用者からすると、「電子テキストとしての漢字かな交じり文の入力」というのは絶望的に難しい。
の区別がつけづらい。「日」は「ひ」「び」「ぴ」「にち」「じつ」の読みがあるが、小学校の教科書の漢字表には「にっ」の音は入っていないため音便とも関係するため、「日本」よ読みもむつかしく、「にほん」か「にっぽん」も区別しづらい「日比谷(ひびや)から日本大学(にほんだいがく)を経て日本電気(にっぽんでんき)に入社」のルビをコンピューターに振らせることができるだろうか?という問題がある。 |
技術的な対策[編集]
これは1編集者の私見。(編集者:早朝の掃除屋さん) |
---|
てっとり早い対策はとりあえず三つある。
である。 |
文法的な対策[編集]
これは1編集者の私見。(編集者:早朝の掃除屋さん) |
---|
これ以外の「てっとり早くない」方法としては、とにかくデータを集めて「どの語とどの語が同一文書に出てきやすいか」をマハラノビスの距離かなにかを使ってベクトル化し、近そうな語の優先度を上げるという手がある。そこまでやらなくても、専門語辞書をいくつも用意しておいて、どれかに引っかかったらその辞書の優先度を上げればいいだけである。地名や人名などは同一地方、同一業種の人物は続けて出てきやすいことは容易に想像できるし、音楽用語・料理用語・数学者名を含む数学用語・物理用語・化学用語などは個別に作成し、同一表記のものは一つだけ定時すればよい。「さいとうひでお」は「齋藤秀雄」「斎藤秀雄」でよく、「音楽家ですか、評論家ですか?」は気にしなくてよい。 |
プライバシー[編集]
これは1編集者の私見。(編集者:naidepne(Talk))
プライバシーを重視している場合は、OpenSnitchやNetGuardなどのファイアウォールを使用して、mozcのネットワーク接続を禁じたうえで、mozcを使用することをおすすめする。Android版mozcは、[2]から入手でき、NetGuardは、[3]から入手できる。OpenSnitchの入手方法については、「OpenSnitch」を参照。
その他[編集]
これは1編集者の私見。(編集者:早朝の掃除屋さん) |
---|
文法と辞書は、意外なことに区別する必要がない。なぜ別になっているかというと、「接続テーブル法」という方法で文法を処理を行なっているシステムが過去(現在も?)にあったたため、文法を精密にしようと思うとテーブルがむやみに膨らんでしまう。 |
脚注[編集]
注釈[編集]
- ↑ 郵便番号の読み取りシステムなど。