summaryrefslogtreecommitdiff
path: root/storage/mroonga/vendor/groonga/examples/dictionary/readme.txt
blob: 555706e0061171c1d9a3a75599c7e0fa878e0e6d (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
.. highlightlang:: none

辞書検索ツール
==============

名前
----

groonga辞書検索ツール

説明
----

様々な商用・非商用の辞書ファイルをインポートしてgroongaで検索できるようにします。

対応している辞書
++++++++++++++++

現状では下記の辞書に対応しています。

* EDICT

EDICTは、Monash大学Jim Breen教授が提供している和英辞書です。下記から入手できます。

http://ftp.monash.edu.au/pub/nihongo/edict.gz

* GENE95

GENE95は、Kurumiさん(NiftyID: GGD00145)が作成された英和辞書です。下記から入手できます。

http://www.namazu.org/~tsuchiya/sdic/data/gene95.tar.gz

* 英辞郎

英辞郎は、EDPという団体によって編纂されている英和・和英辞書です。

http://www.eijiro.jp/

書店やオンラインショップなどで購入できます。

データベースの初期化
++++++++++++++++++++

本ディレクトリで下記のように実行し、辞書データを格納するデータベースファイルを下記のようにして初期化します。

 ./init-db.sh データベースパス名

このようにして作成したデータベースについて、様々な辞書のデータをインポートすることができます。

インポートの方法
++++++++++++++++

* EDICT

edictディレクトリ配下で以下のように実行します。 edict.gzは自動でダウンロードします。

 ./edict-import.sh データベースパス名

* GENE95

gene95ディレクトリ配下で下記のように実行します。 gene95.tar.gzは自動でダウンロードします。

 ./gene-import.sh データベースパス名

* 英辞郎

英辞郎に付属のPDICツールを用いてCSVファイル形式に辞書をエクスポートします。(このとき「登録項目」ですべての項目を出力するようにします) eijiroディレクトリ配下で下記のように実行します。

 ./eijiro-import.sh データベースパス名 出力したCSVファイルのパス名

(英辞郎第四版で動作を確認しています)