Skip to content
hankcs edited this page Dec 4, 2015 · 20 revisions

FAQ

常见问题


为什么修改了词典还是没有效果?

  • 修改了任何词典都必须删除缓存才能生效,请仔细阅读文档!
  • 基于统计模型的分词器不保证词典中的词语一定被切分出来。

为什么自定义词性“新词 SomeLabel 100”无法生效?

词性是enum类型,不是String,所以你需要往Nature enum类里面加自定义词性。enum类型的词性比String省内存,还可以方便地转成int参与矩阵运算,相对于损失的灵活度而言,无疑是值得的。

为什么加载我自己训练的CRF++模型失败了?

HanLP只兼容文本格式的CRF++模型,只有文本才是世界通用的,这是最初的设计宗旨之一。请阅读《CRF++模型格式说明》以了解如何训练文本格式的CRF++模型。