本倉庫收集粵語 NLP 資源,倉庫內容:
- Facebook 政府新聞網 (govnews.hk) (Latest: 2020-01-07 20:22:31 PST, crawled with rugantio/fbcrawl).
名 Name | 大細 Size | 許可證 Licence | 連結 Link |
---|---|---|---|
香港粵語語料庫 Hong Kong Cantonese Corpus (HKCanCor) |
Hong Kong Cantonese Corpus (HKCanCor) 香港粵語語料庫 fcbond/hkcancor |
||
馬來西亞粵語語料庫 Malaysia Cantonese Corpus (MYCanCor) |
liesenf/MYCanCor | ||
Database of the 19th Century (1865-1894) Cantonese Christian Writings 十九世紀中後期(1865-1894)粵語基督教典籍資料庫 |
https://www.polyu.edu.hk/cbs/hkchristdb/ | ||
早期粵語口語文獻資料庫 | http://database.shss.ust.hk/Candbase/ | ||
早期粵語標註語料庫 | http://database.shss.ust.hk/Cantag/ | ||
早期粵語標註語料庫 | http://database.shss.ust.hk/Cantag/ | ||
香港二十世紀中期語料庫 | 《香港二十世紀中期語料庫》 《香港二十世紀中期語料庫》打包器 |
||
早期漢語方言文獻資料庫 Database of Early Chinese Dialects |
http://database.shss.ust.hk/5dialects/index.html | ||
早期粵語聖經資料庫 The Early Cantonese Bible Database |
https://corpus.eduhk.hk/cantobible/ | ||
LIHKG Scraper | ayaka14732/lihkg-scraper |
名 Name | 描述 Description | 許可證 License | 連結 Link |
---|---|---|---|
Cifu | A frequency lexicon for Hong Kong Cantonese | GPL-3.0 | gwinterstein/Cifu |
ToJyutping | 粵語拼音自動標註工具 Cantonese Pronunciation Automatic Labeling Tool | CC-BY-4.0 License | ToJyutping |
PyCantonese | Cantonese Linguistics and NLP in Python | MIT | jacksonlee/pycantonese |
名 Name | 描述 Description | 連結 Link |
---|---|---|
百度翻譯 API | 支援粵語 | https://fanyi-api.baidu.com/ |
- 粵文維基百科 Dump
- 粵語/廣東話參考資料 Reference Materials for Yue / Cantonese: wordshk/yue_references
- 粵語 NLP 討論谷:https://t.me/cantonesenlp