Sakura-13B-Galgame

🤗 Hugging Face • 🤖 ModelScope

介绍

基于一系列开源大模型构建，在通用日文语料与轻小说/Galgame等领域的中日语料上进行继续预训练与微调，旨在提供性能接近GPT3.5且完全离线的Galgame/轻小说翻译大语言模型。
目前仍为实验版本，v0.9版本模型在文风、流畅度与准确性上均强于GPT-3.5，但词汇量略逊于GPT-3.5（主观评价）.
同时提供了运行模型的API后端，适配OpenAI API格式。
新建了TG交流群，欢迎交流讨论。

对于其他适配本模型的项目如使用非本项目提供的prompt格式进行翻译，不保证会获得与README中的说明一致的质量！

如果使用模型翻译并发布，请在最显眼的位置标注机翻！！！！！开发者对于滥用本模型造成的一切后果不负任何责任。

对于模型翻译的人称代词问题（错用，乱加，主宾混淆，男女不分等）和上下文理解问题，如果有好的想法或建议，欢迎提issue！

TODO：见SakuraLLM#42

快速开始

教程：

详见本仓库Wiki.

模型下载：

版本	Transformers模型	GGUF量化模型	GPTQ 8bit量化	GPTQ 4bit量化	GPTQ 3bit量化	AWQ量化
20231026-v0.8	🤗 Sakura-13B-LNovel-v0.8	🤗 Sakura-13B-LNovel-v0_8-GGUF	🤗 Sakura-13B-LNovel-v0_8-8bit	🤗 Sakura-13B-LNovel-v0_8-4bit	🤗 Sakura-13B-LNovel-v0_8-3bit	🤗 Sakura-13B-LNovel-v0_8-AWQ
20240111-v0.9	🤗 Sakura-13B-LNovel-v0.9	🤗 Sakura-13B-LNovel-v0.9b-GGUF	-	-	-	-

p.s. 如果无法连接到HuggingFace服务器，可将链接中的huggingface.co改成hf-mirror.com，使用hf镜像站下载。

News

KurikoMoe为LunaTranslator支持了流式输出：release地址。注意：目前该模式下只能单独开启sakura翻译，不能同时开启其他翻译。
更新了0.9的正式版模型v0.9b。相比v0.9删除了一个可能导致污染的数据集。清洗并增加了预训练与微调的数据量。更推荐使用正式版模型，它会比之前的pre版本更加稳定，质量更高。
增加了vllm模型后端的支持，详见#40
感谢Isotr0py提供运行模型的NoteBook仓库SakuraLLM-Notebooks，可在Colab(免费T4*1)与Kaggle(免费P100*1或T4*2)平台使用。已经更新Kaggle平台的使用教程，可以白嫖一定时间的T4*2。
Sakura API已经支持OpenAI格式，现在可以通过OpenAI库或者OpenAI API Reference上的请求形式与Server交互。 一个使用OpenAI库与Sakura模型交互的例子详见openai_example.py。

已经接入模型的工具

网站：轻小说机翻机器人已接入Sakura模型(v0.8-4bit)，站内有大量模型翻译结果可供参考。你也可以自行部署模型并使用该网站生成机翻，目前已经支持v0.8与v0.9模型，且提供了llama.cpp一键包。

轻小说机翻机器人网站是一个自动生成轻小说机翻并分享的网站。你可以浏览日文网络小说，或者上传Epub/Txt文件，并生成机翻。
LunaTranslator已经支持Sakura API，可以通过本地部署API后端，并在LunaTranslator中配置Sakura API来使用Sakura模型进行Galgame实时翻译。
使用KurikoMoe的版本可以支持流式输出。

LunaTranslator是一个Galgame翻译工具，支持剪贴板、OCR、HOOK，支持40余种翻译引擎。
GalTransl已经支持Sakura API，可以通过本地部署API后端，在GalTransl中配置使用Sakura模型来翻译Galgame，制作内嵌式翻译补丁。

GalTransl是一个galgame自动化翻译工具，用于制作内嵌式翻译补丁。一个使用GalTransl和Sakura模型翻译的示例
翻译Unity引擎游戏的工具SakuraTranslator。感谢fkiliver提供。
翻译RPGMaker引擎游戏的工具RPGMaker_LLaMA_Translator。感谢fkiliver提供。
AiNiee已经支持Sakura API，可以通过本地部署API后端，在AiNiee中使用Sakura模型进行翻译。

AiNiee是一款基于【mtool】或【Translator++】，chatgpt自动批量翻译工具，主要是用来翻译各种RPG游戏。

显存需求

下面的表格显示了使用不同量化和不同格式的模型时显存占用的大小。如果你的显卡显存不满足上述需求，可以尝试同时使用CPU与GPU进行推理。

llama.cpp GGUF模型（使用v0.9.0pre1模型进行测试，v0.8模型与其类似）

模型量化类型	模型大小	推荐显存大小
fp16	26.3G	超出游戏显卡显存范围
Q8_0	14G	24G
Q6_K	11.4G	20G
Q5_K_M	10.1G	16G
Q4_K_M	8.8G	16G
Q3_K_M	7.2G	16G
Q2_K	6.1G	12G

transformers autogptq模型（使用v0.8版本进行测试）

模型量化类型	推理显存(ctx约600)	推理显存(ctx约1800)
全量	超出游戏显卡显存范围	超出游戏显卡显存范围
8bit	21.1G	23.4G
4bit	14.9G	17.4G
3bit	13.7G	15.5G

模型详情

描述

Finetuned by SakuraUmi
Finetuned on Baichuan2-13B-Chat
Finetuned on Qwen-14B-Chat
Finetuned on Sakura-13B-Base-v0.9.0
Languages: Chinese/Japanese

效果

Galgame

一个例子
轻小说

网站：轻小说机翻机器人已接入Sakura模型(v0.8-4bit)，站内有大量模型翻译的轻小说可供参考。
PPL/BLEU/Human

TBD

推理

openai api messages格式：

v0.9 使用代码处理如下：

input_text_list = ['a', 'bb', 'ccc', ...] # 一系列上下文文本，每个元素代表一行的文本
raw_text = "\n".join(input_text_list)
messages=[
    {
        "role": "system",
        "content": "你是一个轻小说翻译模型，可以流畅通顺地以日本轻小说的风格将日文翻译成简体中文，并联系上下文正确使用人称代词，不擅自添加原文中没有的代词。"
    },
    {
        "role": "user",
        "content": "将下面的日文文本翻译成中文：" + raw_text
    }
]

prompt格式：

v0.9 文本格式如下：

<|im_start|>system
你是一个轻小说翻译模型，可以流畅通顺地以日本轻小说的风格将日文翻译成简体中文，并联系上下文正确使用人称代词，不擅自添加原文中没有的代词。<|im_end|>
<|im_start|>user
将下面的日文文本翻译成中文：日文第一行
日文第二行
日文第三行
...
日文第n行<|im_end|>
<|im_start|>assistant

使用代码处理如下：

input_text_list = ['a', 'bb', 'ccc', ...] # 一系列上下文文本，每个元素代表一行的文本
raw_text = "\n".join(input_text_list)
prompt = "<|im_start|>system\n你是一个轻小说翻译模型，可以流畅通顺地以日本轻小说的风格将日文翻译成简体中文，并联系上下文正确使用人称代词，不擅自添加原文中没有的代词。<|im_end|>\n" \ # system prompt
        + "<|im_start|>user\n将下面的日文文本翻译成中文：" + raw_text + "<|im_end|>\n" \ # user prompt
        + "<|im_start|>assistant\n" # assistant prompt start

prompt构建：

v0.8

input_text = "" # 要翻译的日文
query = "将下面的日文文本翻译成中文：" + input_text
prompt = "<reserved_106>" + query + "<reserved_107>"

v0.9

input_text = "" # 要翻译的日文
query = "将下面的日文文本翻译成中文：" + input_text
prompt = "<|im_start|>system\n你是一个轻小说翻译模型，可以流畅通顺地以日本轻小说的风格将日文翻译成简体中文，并联系上下文正确使用人称代词，不擅自添加原文中没有的代词。<|im_end|>\n<|im_start|>user\n" + query + "<|im_end|>\n<|im_start|>assistant\n"

推理与解码参数：

参数	值
temperature	0.1
top p	0.3
do sample	True
beams number	1
repetition penalty	1
max new token	512
min new token	1

如出现退化（退化的例子可参见#35与#36），可增加frequency_penalty参数，并设置为大于0的某值，一般设置0.1~0.2即可。

微调

模型微调框架参考BELLE或LLaMA-Factory，prompt构造参考推理部分。

致谢

Copyright Notice

v0.8版本模型的使用须遵守Apache 2.0和《Baichuan 2 模型社区许可协议》。

v0.9版本模型的使用须遵守Qwen模型许可协议。

Name		Name	Last commit message	Last commit date
Latest commit History 167 Commits
.github		.github
api		api
docker		docker
models		models
requirements		requirements
tests		tests
utils		utils
.dockerignore		.dockerignore
.gitignore		.gitignore
Dockerfile		Dockerfile
README.docker.md		README.docker.md
README.md		README.md
compose.example.yaml		compose.example.yaml
favicon.ico		favicon.ico
requirements.llamacpp.txt		requirements.llamacpp.txt
requirements.txt		requirements.txt
requirements.vllm.txt		requirements.vllm.txt
sampler_hijack.py		sampler_hijack.py
server.py		server.py
server.spec		server.spec
translate_epub.py		translate_epub.py
translate_novel.py		translate_novel.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Sakura-13B-Galgame

介绍

TODO：见SakuraLLM#42

快速开始

教程：

模型下载：

News

已经接入模型的工具

显存需求

模型详情

描述

效果

推理

微调

相关项目

致谢

Copyright Notice

About

Releases

Packages

Languages

NEKOparapa/Sakura-13B-Galgame

Folders and files

Latest commit

History

Repository files navigation

Sakura-13B-Galgame

介绍

TODO：见SakuraLLM#42

快速开始

教程：

模型下载：

News

已经接入模型的工具

显存需求

模型详情

描述

效果

推理

微调

相关项目

致谢

Copyright Notice

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages