Update README.md
Browse files
README.md
CHANGED
@@ -12,14 +12,28 @@
|
|
12 |
このコードを実行するには、以下のライブラリが必要です。
|
13 |
|
14 |
```bash
|
15 |
-
pip install
|
|
|
|
|
16 |
|
17 |
コードの説明
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
18 |
|
19 |
-
|
20 |
-
|
21 |
-
|
22 |
-
|
23 |
-
|
24 |
-
|
25 |
-
|
|
|
|
12 |
このコードを実行するには、以下のライブラリが必要です。
|
13 |
|
14 |
```bash
|
15 |
+
pip install -r requirements.txt
|
16 |
+
もしくは
|
17 |
+
pip install pyopenjtalk PyYAML jaconv janome
|
18 |
|
19 |
コードの説明
|
20 |
+
# pyopenjtalkを使用し、JSONLとLAB形式で出力、比較データも出力
|
21 |
+
python your_script_name.py \
|
22 |
+
--input_files input1.txt input2.txt \
|
23 |
+
--output_folder ./corpus_output \
|
24 |
+
--engine pyopenjtalk \
|
25 |
+
--output_format jsonl \
|
26 |
+
--output_lab \
|
27 |
+
--output_comparison \
|
28 |
+
--norm_rules normalization_rules.yaml \
|
29 |
+
# --jtalk_dic /path/to/open_jtalk_dic (必要なら)
|
30 |
+
# --jtalk_user_dic /path/to/user.dic (現在実験的)
|
31 |
|
32 |
+
# Janomeを使用し、TSV形式でひらがな読みを出力
|
33 |
+
python your_script_name.py \
|
34 |
+
--input_files data/*.txt \
|
35 |
+
--output_folder ./corpus_output_janome \
|
36 |
+
--engine janome \
|
37 |
+
--output_format tsv \
|
38 |
+
--reading_format hiragana \
|
39 |
+
# --janome_udic /path/to/janome_user.csv (必要なら)
|