从ChatGPT发布后的一段时间,我们见证了大型语言模型(LLM)爆炸式增长,在来自四面八方的消息中,我们了解了大模型似乎在不断渗透到各行各业,改变着生产模式。但,在实际行业应用上还是很难跟上所有技术上已经取得的发展,数据安全以及大量的硬件资源需求等方面成了大模型应用落地过程中经常需要讨论的重要内容,本地运行开源LLM也成为了热门方案。

前排提示,文末有大模型AGI-CSDN独家资料包哦!

大模型参数的大小从一个层面反映了模型的能力,但是,实际应用真的必须用到那么大参数的大模型吗?

比较实在的思路是:用较少的资源,在本地搭建较小的模型,为某些场景提供大模型的某些方面的能力。这种方式可以根据需要选择适合场景的模型,同时也能够确保数据限制在自己的网络空间。

搭建本地大模型的关键内容:

(1)哪里下载开源大模型?

Huggine Face可以说是大模型的集中营。可以下载到各种开源模型库。

(2)如何部署大模型?

部署大模型的方式很多,其中一个比较简单的方式是使用一些框架工具,例如:LangChain、Ollama。其中Ollama是一个开源的大模型服务工具,使用起来非常简单,旨在为用户提供本地化的运行环境,满足个性化的需求。

其实,Ollama已经提供了许多流行的大模型可以选择。

而,Huggine Face目前拥有超过25万的大模型,最新、最全的开源大模型应该都在里面,选择性更多。

下面主要介绍如何利用Ollama从Huggine Face安装自定义模型。

以模型Llama3-8B-Chinese-Chat为例,步骤如下:

(1)下载安装Ollama,并确保您已安装Ollama并正在运行。

ollama的下载地址:

https://ollama.com/`br`

(2)去Huggingface网站下载模型的GGUF。

https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat-GGUF-8bit`br`

(3)创建一个模型描述文件,并输入必要的东西。

创建一个名为 Modelfile 的文件,并使用 FROM 指令,填写的模型的本地文件路径。Modelfile文件中还可以添加系统提示词以及各项参数:

\# ModelfileFROM "./Llama3-8B-Chinese-Chat-q8\_0-v2\_1.gguf"# set the temperature to 1 \[higher is more creative, lower is more coherent\]PARAMETER temperature 1#许多聊天模式需要提示模板才能正确回答。默认提示模板可以使用TEMPLATE中的Modelfile指令指定TEMPLATE "\[INST\] {{ .Prompt }} \[/INST\]"`br`

(4)从这个模型文件中创建一个模型,并在终端中本地运行它。

创建大模型:

ollama create llama3\_chinese example -f Modelfile`br`

运行大模型:

ollama run llama3\_chinese`br`

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐