(function() {function signalGooglefcPresent() {if (!window.frames['googlefcPresent']) {if (document.body) {const iframe = document.createElement('iframe'); iframe.style = 'width: 0; height: 0; border: none; z-index: -1000; left: -1000px; top: -1000px;'; iframe.style.display = 'none'; iframe.name = 'googlefcPresent'; document.body.appendChild(iframe);} else {setTimeout(signalGooglefcPresent, 0);}}}signalGooglefcPresent();})();

Daily Archive: 12月 1, 2016

ATOK 2017

以前はパッケージを購入していたのだが。

ディープコアエンジン

私はWindowsの日本語IMEとして長年ATOKを使用している。
昔は年1回パッケージを買い換えつつ(たまに2~3年後に乗り換えたが)、新しいATOKへとアップしていったのだが、ここ最近はずっとATOK Passportのプレミアム版で契約している。
Passportは、その時の最新のATOKが利用できるので、最終的にはオススメな製品になるのだが、唯一の弱点はパッケージのプレミアム版に付いてくるような辞書が付いてこない事である。
まぁ…特別辞書を必要としない人であれば、何ら問題はないのだが、英和・和英辞書や国語辞典などに登場するような、結構特殊な意味を持つ文字は、辞書がないと上手く変換してくれないので、ここらへんは実は大きな悩みどころだったりする。
私の場合は、昔パッケージのプレミアム版をインストールしていた関係から、その時の辞書を追加でインストールしてやれば、通常のPassport版だけでなく、そうした追加辞書を運用できるので、Passport版でも今は困っていない。

話は変わるが、そのATOKが来年2月でATOK 2017へと進化する。
日本語変換が英語圏のIMEと一番異なるのは、とにかく語彙が多いと言う事。英語等は単語の組合せは多いのだが、日本語の最小単位は単語よりも小さいため、その小さな単漢字や読みの組合せで、ものすごく多種多様な意味を持つ言葉が無数に存在するため、とにかく変換させた時に適切な語句として変換させるのが難しいというところに、そのプログラムの難しさがストレートに表れてくる。
なのでWindows標準のMS-IMEは昔より賢くなったとはいいつつも、今でも誤変換がとても多い。
その誤変換を極力少なくするプログラムを搭載しているのがATOKなのだが、今回のATOK 2017は、その複雑な日本語変換についにディープラーニングで抽出した変換アルゴリズムを使用する領域に突入した。
学習情報をとにかく蓄積させ、変換正解率を高めるデータをチューニングさせていき、最終的には誤変換を30%削減できる、という製品になったようだ。

単位を読んで適切な回答へ

昔からATOKを使っていて上手く変換しないなぁ、と私が常々思っていたのが、単位によって変わる漢字の変換である。
例えば「情報量」と「情報料」という同音異義語である。
例文として「じょうほうりょう2ぎがばいと」と変換した時「情報料2GB」と変換する事がある。しかし2GBという単語は量の単位であって、金額の単位ではないため、ここでは正解は「情報量2GB」が正しい事になるが、これが従来できなかったのだ。しかしATOK 2017は正しく変換するようになったらしい。
細かい事かもしれないが、とにかく長文を打ち込む場合は、こうした小さな変換誤差が積み重なると、効率に大きく響く。
ATOKはこういう累積させていく誤変換によるロスを常に改善してくるので、私からすると既にWindowsの必須アプリケーションの1つとなっている。
最近はスマホなどで類推変換や憶測変換で文字を入力する人も多いが、それだと自分の表現としての言葉が使えないようになるし、かといって変換後の文字の正しさは自分で調べ尽くせるわけではないので、ATOKのこの正確性は実に助かる機能である。
まぁ…私がATOKをオススメする理由は、これだけに留まらないが、進化していく過程でさらに入力が楽になっていくATOKは実にオススメである。

Continue reading…

Desktop Version | Switch To Mobile Version