mozc用郵便番号辞書データ(2019年10月版)の提供
ubuntuの日本語入力システムにはmozcが標準搭載されています。mozcは"Google日本語入力(IME)"のオープンソース版です。
残念なことにオープンソース版には幾つかの辞書が欠落しています。その一つが郵便番号辞書ですが、これが有ると無いでは住所入力の効率が全然違ってきます。そこで「無いものは作ろう」の精神で辞書データを自作しています。
日本郵便株式会社のサイトで公開されている最新の郵便番号データ(郵便番号データは毎月更新されています。)をプログラムで加工して、mozc用郵便番号辞書データのzipdicを作っています。
この辞書データを公開しますので、よろしければご利用下さい。
■郵便番号辞書データのダウンロード
mozc郵便番号辞書データのファイルは圧縮してあります。
ダウンロードはこちら
(圧縮ファイルなので「エラー プレビューに問題が発生しました」と表示されますが、ダウンロードできます)
圧縮ファイルの中にzipdicがあります。
2019/11/5作成(元データは2019年10月31日付更新のものを使いました。)
ubuntuでダウンロードすると、"/home/ユーザー名/ダウンロード/zipdic.zip"という形で保存されます。
この圧縮ファイルの中を見ると"zipdic"がありますので、これを適当なディレクトリに移動させます。
mozc用郵便番号辞書データ(zipdic)は単純なテキスト・ファイルですので、エディッタで確認出来ます。また表計算ソフトのCalcでも確認できます。
mozc用郵便番号辞書データ(zipdic)は、適当なタイミングで更新する予定をしています。
■mozcへの郵便番号辞書の登録方法
・mozcツールの中に有る辞書ツールを開きます。
・既に「郵便番号辞書」がある場合は先にこれを削除します。
既存の「郵便番号辞書」 を選んで→「管理」→「選択した辞書を削除」とします。
・辞書の追加は、「管理」→「新規辞書にインポート」をクリックします。
ファイル:先程用意した"zipdic"を(ファイルを選択)ボタンで選んで指定
辞書名 :「郵便番号辞書」
フォーマット:自動判定
エンコード :自動判定
・インポートをクリックします。
以上で「郵便番号辞書」が作られます。
尚、mozcのプロパティで"郵便番号変換"の項目には初期値でチェックが付いているとは思いますが、念のため確認しておいて下さいね。これにチェックが付いてないと郵便番号変換できません。
ご利用頂いて、ご意見を頂けると助かります。
参考情報として「日本郵政株式会社の郵便番号データについて」の記事を追加しました。
合わせてご覧頂けると嬉しいです。(2019/12/04)
スクリプトを公開しました。[mozc用の郵便番号辞書を作るpythonスクリプト](https://koukaforest.hatenablog.com/entry/2020/08/09/053000) (2020/08月)