WILLCOM/WX310K/Dictionary

UPDATE Thu May 4 10:55:43 2006
Wiki [DoCoMo] [au] [SoftBank] [WILLCOM] [e-mobile] [WLAN] | Antenna [Ktai] [Zaurus] [WindowsMobile] [Other]
ページ一覧 [更新順] [RSS] | 差分履歴 [RSS] [差分] || 編集 | 管理 | 新規作成 | アップロード || 検索 | ヘルプ

もくじ

[↑] [編集]

京ぽん2「WX310K」の追加辞書について。

概要

[↑] [編集]

 ウィルコムの京ぽん2「WX310K」で追加できる「オプション辞書」についてまとめるページです。まずは、製品情報やFAQなどを「WX310K」のページでざっと見ておきましょう。

 オプション辞書は、開発元ではる京セラの公式サイト「サイトK」にて配布されており、WX310Kでダウンロードして追加することができるというものです。ダウンロードしたら、「データフォルダ」>「その他」からダウンロードしたファイルである「wx310k_dictionary_v1.dic」を選択すると登録できます。

 また、ユーザーが解析などをし、自作のオプション辞書を作成できるようにもなった。2ch辞書など、いくつかオリジナルな辞書が配布されている。

公式オプション辞書について

[↑] [編集]

オリジナル辞書の自作について

[↑] [編集]

 WX310K用辞書作成ツールが公開されています。http://eseuta.mine.nu/

2006年4月21日に2ちゃんねるにてauの京セラ製「A5502K」用の辞書を「WX310K」のオプション辞書に変換するツールを◆PUYO2v61AQ氏が公開してくれました。すでに、A5502Kの辞書はユーザーにより解析され、オリジナル辞書が作成可能となっているので、これにより「WX310K」用のオリジナル辞書も作成可能となっています。

各ツールのインストール

[↑] [編集]

 「WX310K ユーザ辞書変換ツール」が.NET Framework 2.0が必要となっているので、Windows2000 SP2およびWindowsXP SP1以上でないと利用できません。

作成方法

[↑] [編集]

 直接辞書を作るツールが公開されています。修正希望
 基本的には、「WX310K ユーザ辞書変換ツール」についてはReadmeを読みましょう。

  1. 「辞書穴」で辞書を作成する
  2. 「辞書穴」で作った辞書(*.dic)を「WX310K ユーザ辞書変換ツール」をインストールしたフォルダにコピーして、ファイル名を「a5502k.dic」に変更する
  3. 「WX310K ユーザ辞書変換ツール」を実行(ダブルクリック)し、右下のボタンをクリックする
  4. フォルダ内に「w310k.dic」という「WX310K」用のオリジナルオプション辞書ファイルができるので、ファイル名を適当に変更する(一つ目の時はファイル名はそのままでよい)
  5. WX310Kの本体メモリにコピーする(miniSDカード経由でOK)
  6. 「データフォルダ」>「その他」から当該ファイルを選び登録する

配布されているオリジナル辞書

[↑] [編集]

その他解析など

[↑] [編集]

京セラからのオフィシャル辞書ファイル内容の概略

[↑] [編集]

全体はおよそ3つのパートに分かれている

辞書本体は{変換結果1,変換結果2,...,変換結果n,読み}という並び。

内容抽出

[↑] [編集]
登録語抽出ツウール@2ちゃんねる
http://hobby7.2ch.net/test/read.cgi/keitai/1145294096/341n
辞書解析中・・・(ANOTHER WILLCOM NEWS)
http://another.willcomnews.com/?eid=216594
辞書解析中(その2)(ANOTHER WILLCOM NEWS)
http://another.willcomnews.com/?eid=216736
辞書解析中(その3)(ANOTHER WILLCOM NEWS)
http://another.willcomnews.com/?eid=216754

他機種の辞書との互換性

[↑] [編集]
WX310K(京ぽん2)でW41Kの辞書が使えそうな件について(I live until I die. - by Kawasemi)
http://my.opera.com/kawasemi/blog/show.dml/223965?PHPSESSID=7f6a720fdcb861f3ac60a35b86bc0fc3
W41Kの実機をまた借りてきました。(I live until I die. - by Kawasemi)
http://my.opera.com/kawasemi/blog/show.dml/225025?PHPSESSID=d96796319c7cd5ba9ef83343b7514b09

W41Kユーザー辞書内容

[↑] [編集]
WX310K/300K AH-K3001V 京セラWILLCOM端末総合617
http://hobby7.2ch.net/test/read.cgi/keitai/1145579704/392
392 : ◆PUYO2v61AQ :2006/04/21(金) 22:43:53 ID:oJM9WDmX0
W41K形式の辞書ファイルフォーマット(解析判明分)です。 

・ヘッダ部(0x0000-0047) 
0x0000-0003 NJDC 
0x0005 02 (A-Wnnのバージョン?) 
0x000C-000F ヘッダ部を除いたサイズ 
0x0020-0023 辞書本体の開始アドレス 
0x0024-0027 辞書本体の登録単語数 
0x0028-002b 辞書本体の使用テーブル数 
0x0034-0035 辞書本体の登録単語数(0x0024-0027と同じ) 
0x0036-0037 辞書本体のテーブル番号の上限(0x0028-002bより1少ない) 
0x003C-003F インデックス1の開始アドレス 
0x0040-0044 インデックス2の開始アドレス 

・インデックス1 
2バイトずつ単語のテーブル番号が入っている。読み仮名のアスキー順にソート 

・インデックス2 
2バイトずつ単語のテーブル番号が入っている。変換後の単語のアスキー順にソート 

・辞書本体 
32バイトずつテーブルになっている。 
81 63 [読み仮名のバイト数] 32 [変換後の単語のバイト数 & 0x80] [読み仮名] [変換後の単語] 

こんな感じです。 

そしてA5502K形式では、いくつかの数字が異なる他、ヘッダ部の0x0038-0047とインデックス2がありません。 

WX310K形式は…サンプルが1個しかない現状ではこれ以上の解析は難しい気がしてます。

当Wiki内関連ページ

[↑] [編集]


一行コメント

[↑] [編集]