基于Mlc-llm端侧部署大模型

Mlc-llm是高性能的模型部署框架，支持在电脑、手机上运行大模型，使用这个平台可以轻松将主流的qwen、llama、phi等大模型部署到手机上。

Silver__Wolf · 2024-07-20 16:11:27 发布

Mlc-llm是高性能的模型部署框架，支持在电脑、手机上运行大模型，使用这个平台可以轻松将主流的qwen、llama、phi等大模型部署到手机上。

我的需求是在安卓上运行大模型，因此需要配置SDK、NDK等东西，需要有一定的基础：

这个框架其实还是比较麻烦配置的，这里强烈推荐按照官方文档走：Android SDK — mlc-llm 0.1.0 documentation

我实在Windows环境下配置的，如果有Linux系统需求，推荐MLC-LLM框架的安卓应用部署实战_mlc llm-CSDN博客。

1、下载模型；

2、编译需要的模型，将模型按层进行切割并生成运算单元；

3、交叉编译成apk文件；

4、加载模型文件做推理。

我使用的是2019年的安卓手机，运行效率如下：

笔者的手机性能较差，测试结果可能不太好，有过有高性能的手机可以测试看看效果，欢迎在评论区反馈一下。

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

深度拆解 Headroom：AI Agent 的「上下文压缩层」，Token 暴降 60-95% 的背后原理

接手项目后，我对 Claude Code 说的第一句话（附 Prompt 模板）

手机 deepseek 怎么导出？用 AI 导出鸭一键规整文档，轻松搞定各类内容导出难题

查看更多评论

已为社区贡献2条内容

温馨提示：您尚未绑定手机号