こうかの雑記

こうかの雑記

昔の懐かしいこと、ubuntuのこと、その他いろいろ

mozc用郵便番号辞書データ(2019年10月版)の提供

 ubuntuの日本語入力システムにはmozcが標準搭載されています。mozcは"Google日本語入力IME)"のオープンソース版です。
 残念なことにオープンソース版には幾つかの辞書が欠落しています。その一つが郵便番号辞書ですが、これが有ると無いでは住所入力の効率が全然違ってきます。そこで「無いものは作ろう」の精神で辞書データを自作しています。
 
 日本郵便株式会社のサイトで公開されている最新の郵便番号データ(郵便番号データは毎月更新されています。)をプログラムで加工して、mozc用郵便番号辞書データのzipdicを作っています。

 この辞書データを公開しますので、よろしければご利用下さい。

■郵便番号辞書データのダウンロード

 mozc郵便番号辞書データのファイルは圧縮してあります。

 ダウンロードはこちら

drive.google.com

 (圧縮ファイルなので「エラー プレビューに問題が発生しました」と表示されますが、ダウンロードできます)

 圧縮ファイルの中にzipdicがあります。
   2019/11/5作成(元データは2019年10月31日付更新のものを使いました。)

 ubuntuでダウンロードすると、"/home/ユーザー名/ダウンロード/zipdic.zip"という形で保存されます。
 この圧縮ファイルの中を見ると"zipdic"がありますので、これを適当なディレクトリに移動させます。

 mozc用郵便番号辞書データ(zipdic)は単純なテキスト・ファイルですので、エディッタで確認出来ます。また表計算ソフトのCalcでも確認できます。
 mozc用郵便番号辞書データ(zipdic)は、適当なタイミングで更新する予定をしています。

■mozcへの郵便番号辞書の登録方法

・mozcツールの中に有る辞書ツールを開きます。

・既に「郵便番号辞書」がある場合は先にこれを削除します。
 既存の「郵便番号辞書」 を選んで→「管理」→「選択した辞書を削除」とします。

・辞書の追加は、「管理」→「新規辞書にインポート」をクリックします。

  ファイル:先程用意した"zipdic"を(ファイルを選択)ボタンで選んで指定
  辞書名 :「郵便番号辞書」
  フォーマット:自動判定
  エンコード :自動判定
・インポートをクリックします。

 以上で「郵便番号辞書」が作られます。

 尚、mozcのプロパティで"郵便番号変換"の項目には初期値でチェックが付いているとは思いますが、念のため確認しておいて下さいね。これにチェックが付いてないと郵便番号変換できません。

 ご利用頂いて、ご意見を頂けると助かります。

 

参考情報として「日本郵政株式会社の郵便番号データについて」の記事を追加しました。

合わせてご覧頂けると嬉しいです。(2019/12/04)

 

スクリプトを公開しました。[mozc用の郵便番号辞書を作るpythonスクリプト](https://koukaforest.hatenablog.com/entry/2020/08/09/053000) (2020/08月)