- 安卓手机
- 推荐使用骁龙8系列及以上芯片的手机
在手机上下载并安装合适的Termux版本,推荐使用v0.118.1版本。
打开Termux应用,并运行以下命令以授予Termux存储权限:
termux-setup-storage
运行两次以确保生效。
cmake --version
如果出现以下提示,则说明未安装CMake:
cmake: command not found
如果CMake版本不符合要求,则安装CMake 3.17+;否则跳过此步骤。
# 下载安装包
sudo wget https://cmake.org/files/v3.23/cmake-3.23.0.tar.gz
# 解压安装包
sudo tar -zxvf cmake-3.23.0.tar.gz
# 配置安装环境
sudo ./configure
sudo make -j8
# 编译安装
sudo make install
# 查看安装后的版本
cmake --version
# 返回版本号则安装成功
# cmake version 3.23.0
python3 --version
如果Python版本低于3.8或者未安装,则运行以下命令;否则跳过此步骤。
pkg install python=3.8
再次测试Python版本,确保版本不低于3.8。
python3 --version
在Termux的根目录下获取PowerInfer代码,并安装依赖包。
cd ~
git clone https://github.com/SJTU-IPADS/PowerInfer
cd PowerInfer
pip install -r requirements.txt
cd ~
git clone https://huggingface.co/openbmb/MiniCPM-S-1B-sft-gguf/tree/main
-
PC端下载模型,ADB传到手机download
git clone https://huggingface.co/openbmb/MiniCPM-S-1B-sft-gguf/tree/main adb push /your/path/MiniCPM-S-1B-sft-gguf /sdcard/download
-
Termux操作
cd ~ cp /sdcard/download/MiniCPM-S-1B-sft-gguf .
在Termux环境下编译PowerInfer。
cd PowerInfer
cmake -S . -B build
cmake --build build --config Release
./build/bin/quantize ~/MiniCPM-S-1B-sft.gguf ~/minicpm_s_q4.gguf Q4_0
在PowerInfer目录下进行推理。
./build/bin/main -m ~/MiniCPM-S-1B-sft.gguf -n 2048 -t 8 -p '<用户>hello,tell me a story please.<AI>'
./build/bin/main -m ~/minicpm_s_q4.gguf -n 2048 -t 8 -p '<用户>hello,tell me a story please.<AI>'
手机型号 | 芯片 | 内存 |
---|---|---|
Redmi K50 Ultra | 骁龙8+ | 12GB |
模式 | 性能(token/s) |
---|---|
Prefill | 16.82 |
Decode | 17.06 |
现在您可以开始在安卓设备上使用PowerInfer进行高效推理了!