Skip to content

KH Coder の分析対象言語 (現代語・古代語) について #1177

Discussion options

You must be logged in to vote

インストールしたそのままの状態では、日本語の古文も、古フランス語・中仏語も分析できません。

ですが古文用の形態素解析辞書「古文用UniDicS」をインストールして、MeCabとKH Coderの設定を行なうことで、日本語の古文を分析できるようになります。近世江戸口語、近世上方口語、近世文語、中世口語、中世文語、和歌、中古和文、上代語などの中から、ご自身のデータに適した辞書をお選びください。
https://clrd.ninjal.ac.jp/unidic/download_all.html#unidic_chj

ご覧いただいたFAQ項目で示しているのは、だいぶ古いバージョンの中古和文UniDicを使うよう設定した例です。新しいバージョンを使われる際は、品詞構成が変わっていないかといったことを確認しつつ、設定していただくのが確実です。

フランス語に関しては、こうした古文用の辞書、古文用UniDicSにあたるものが、存在するのかどうかも私はわかりません。存在しても、KH Coderで使用している形態素解析ソフトでその辞書を使えるのかどうかが問題になります。分析できないとお考えいただくのが確実かと思います。現代フランス語を分析する設定で、重要な一部の語を「強制抽出」で取り出しながらカウントするといった形がせいぜいではないかと思います。

なおGoogle検索をすると、古フランス語の形態素解析(lemmatization + pos tagging)を行なう試みはあるようです。ただ、成果が誰でも使える形になっているのかどうかよくわかりませんでした。
https://aclantho…

Replies: 1 comment 1 reply

Comment options

You must be logged in to vote
1 reply
@Daiki-Yoshitake
Comment options

Answer selected by ko-ichi-h
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
question Further information is requested Non-English Communication in Japanese language.
2 participants