🤗 Hugging Face • 🤖 ModelScope
-
基于一系列开源大模型构建,在通用日文语料与轻小说/Galgame等领域的中日语料上进行继续预训练与微调,旨在提供性能接近GPT3.5且完全离线的Galgame/轻小说翻译大语言模型。
-
目前仍为实验版本,v0.9版本模型在文风、流畅度与准确性上均强于GPT-3.5,但词汇量略逊于GPT-3.5(主观评价).
-
同时提供了运行模型的API后端,适配OpenAI API格式。
-
新建了TG交流群,欢迎交流讨论。
对于其他适配本模型的项目如使用非本项目提供的prompt格式进行翻译,不保证会获得与README中的说明一致的质量!
如果使用模型翻译并发布,请在最显眼的位置标注机翻!!!!!开发者对于滥用本模型造成的一切后果不负任何责任。
对于模型翻译的人称代词问题(错用,乱加,主宾混淆,男女不分等)和上下文理解问题,如果有好的想法或建议,欢迎提issue!
TODO:见SakuraLLM#42
详见本仓库Wiki.
版本 | Transformers模型 | GGUF量化模型 | GPTQ 8bit量化 | GPTQ 4bit量化 | GPTQ 3bit量化 | AWQ量化 |
---|---|---|---|---|---|---|
20231026-v0.8 | 🤗 Sakura-13B-LNovel-v0.8 | 🤗 Sakura-13B-LNovel-v0_8-GGUF | 🤗 Sakura-13B-LNovel-v0_8-8bit | 🤗 Sakura-13B-LNovel-v0_8-4bit | 🤗 Sakura-13B-LNovel-v0_8-3bit | 🤗 Sakura-13B-LNovel-v0_8-AWQ |
20240111-v0.9 | 🤗 Sakura-13B-LNovel-v0.9 | 🤗 Sakura-13B-LNovel-v0.9b-GGUF | - | - | - | - |
p.s. 如果无法连接到HuggingFace服务器,可将链接中的huggingface.co
改成hf-mirror.com
,使用hf镜像站下载。
-
KurikoMoe为LunaTranslator支持了流式输出:release地址。注意:目前该模式下只能单独开启sakura翻译,不能同时开启其他翻译。
-
更新了0.9的正式版模型
v0.9b
。相比v0.9
删除了一个可能导致污染的数据集。清洗并增加了预训练与微调的数据量。更推荐使用正式版模型,它会比之前的pre版本更加稳定,质量更高。 -
增加了vllm模型后端的支持,详见#40
-
感谢Isotr0py提供运行模型的NoteBook仓库SakuraLLM-Notebooks,可在Colab(免费T4*1)与Kaggle(免费P100*1或T4*2)平台使用。已经更新Kaggle平台的使用教程,可以白嫖一定时间的T4*2。
-
Sakura API已经支持OpenAI格式,现在可以通过OpenAI库或者OpenAI API Reference上的请求形式与Server交互。 一个使用OpenAI库与Sakura模型交互的例子详见openai_example.py。
-
网站:轻小说机翻机器人已接入Sakura模型(v0.8-4bit),站内有大量模型翻译结果可供参考。你也可以自行部署模型并使用该网站生成机翻,目前已经支持v0.8与v0.9模型,且提供了llama.cpp一键包。
轻小说机翻机器人网站是一个自动生成轻小说机翻并分享的网站。你可以浏览日文网络小说,或者上传Epub/Txt文件,并生成机翻。
-
LunaTranslator已经支持Sakura API,可以通过本地部署API后端,并在LunaTranslator中配置Sakura API来使用Sakura模型进行Galgame实时翻译。
使用KurikoMoe的版本可以支持流式输出。LunaTranslator是一个Galgame翻译工具,支持剪贴板、OCR、HOOK,支持40余种翻译引擎。
-
GalTransl已经支持Sakura API,可以通过本地部署API后端,在GalTransl中配置使用Sakura模型来翻译Galgame,制作内嵌式翻译补丁。
GalTransl是一个galgame自动化翻译工具,用于制作内嵌式翻译补丁。一个使用GalTransl和Sakura模型翻译的示例
-
翻译Unity引擎游戏的工具SakuraTranslator。感谢fkiliver提供。
-
翻译RPGMaker引擎游戏的工具RPGMaker_LLaMA_Translator。感谢fkiliver提供。
-
AiNiee已经支持Sakura API,可以通过本地部署API后端,在AiNiee中使用Sakura模型进行翻译。
AiNiee是一款基于【mtool】或【Translator++】,chatgpt自动批量翻译工具,主要是用来翻译各种RPG游戏。
下面的表格显示了使用不同量化和不同格式的模型时显存占用的大小。如果你的显卡显存不满足上述需求,可以尝试同时使用CPU与GPU进行推理。
- llama.cpp GGUF模型(使用v0.9.0pre1模型进行测试,v0.8模型与其类似)
模型量化类型 | 模型大小 | 推荐显存大小 |
---|---|---|
fp16 | 26.3G | 超出游戏显卡显存范围 |
Q8_0 | 14G | 24G |
Q6_K | 11.4G | 20G |
Q5_K_M | 10.1G | 16G |
Q4_K_M | 8.8G | 16G |
Q3_K_M | 7.2G | 16G |
Q2_K | 6.1G | 12G |
- transformers autogptq模型(使用v0.8版本进行测试)
模型量化类型 | 推理显存(ctx约600) | 推理显存(ctx约1800) |
---|---|---|
全量 | 超出游戏显卡显存范围 | 超出游戏显卡显存范围 |
8bit | 21.1G | 23.4G |
4bit | 14.9G | 17.4G |
3bit | 13.7G | 15.5G |
- Finetuned by SakuraUmi
- Finetuned on Baichuan2-13B-Chat
- Finetuned on Qwen-14B-Chat
- Finetuned on Sakura-13B-Base-v0.9.0
- Languages: Chinese/Japanese
-
openai api messages格式:
- v0.9
使用代码处理如下:
input_text_list = ['a', 'bb', 'ccc', ...] # 一系列上下文文本,每个元素代表一行的文本 raw_text = "\n".join(input_text_list) messages=[ { "role": "system", "content": "你是一个轻小说翻译模型,可以流畅通顺地以日本轻小说的风格将日文翻译成简体中文,并联系上下文正确使用人称代词,不擅自添加原文中没有的代词。" }, { "role": "user", "content": "将下面的日文文本翻译成中文:" + raw_text } ]
- v0.9
使用代码处理如下:
-
prompt格式:
- v0.9
文本格式如下:
使用代码处理如下:
<|im_start|>system 你是一个轻小说翻译模型,可以流畅通顺地以日本轻小说的风格将日文翻译成简体中文,并联系上下文正确使用人称代词,不擅自添加原文中没有的代词。<|im_end|> <|im_start|>user 将下面的日文文本翻译成中文:日文第一行 日文第二行 日文第三行 ... 日文第n行<|im_end|> <|im_start|>assistant
input_text_list = ['a', 'bb', 'ccc', ...] # 一系列上下文文本,每个元素代表一行的文本 raw_text = "\n".join(input_text_list) prompt = "<|im_start|>system\n你是一个轻小说翻译模型,可以流畅通顺地以日本轻小说的风格将日文翻译成简体中文,并联系上下文正确使用人称代词,不擅自添加原文中没有的代词。<|im_end|>\n" \ # system prompt + "<|im_start|>user\n将下面的日文文本翻译成中文:" + raw_text + "<|im_end|>\n" \ # user prompt + "<|im_start|>assistant\n" # assistant prompt start
- v0.9
文本格式如下:
-
prompt构建:
-
v0.8
input_text = "" # 要翻译的日文 query = "将下面的日文文本翻译成中文:" + input_text prompt = "<reserved_106>" + query + "<reserved_107>"
-
v0.9
input_text = "" # 要翻译的日文 query = "将下面的日文文本翻译成中文:" + input_text prompt = "<|im_start|>system\n你是一个轻小说翻译模型,可以流畅通顺地以日本轻小说的风格将日文翻译成简体中文,并联系上下文正确使用人称代词,不擅自添加原文中没有的代词。<|im_end|>\n<|im_start|>user\n" + query + "<|im_end|>\n<|im_start|>assistant\n"
-
-
推理与解码参数:
参数 | 值 |
---|---|
temperature | 0.1 |
top p | 0.3 |
do sample | True |
beams number | 1 |
repetition penalty | 1 |
max new token | 512 |
min new token | 1 |
如出现退化(退化的例子可参见#35与#36),可增加frequency_penalty
参数,并设置为大于0的某值,一般设置0.1~0.2即可。
模型微调框架参考BELLE或LLaMA-Factory,prompt构造参考推理部分。
-
轻小说机翻机器人:轻小说翻译
-
LunaTranslator:Galgame在线翻译
-
GalTransl:Galgame离线翻译,制作补丁
-
AiNiee:RPG游戏翻译
v0.8版本模型的使用须遵守Apache 2.0和《Baichuan 2 模型社区许可协议》。
v0.9版本模型的使用须遵守Qwen模型许可协议。