小白友好：用 Ollama 在 Docker 中运行本地 LLM 实战指南-创客网

一、简介

Ollama 是一个开源的可以一键运行大语言模型的工具
跨平台支持，也支持在 Docker 容器内快速部署
可以运行多种量化模型，让普通电脑流畅运行 LLM 成为可能
开源地址参考：https://github.com/ollama/ollama
核心工作流程参考：

二、安装与下载模型（Docker方式）

1. 使用 docker-compose 安装 Ollama

提前安装好Docker、docker-compose软件环境
（可选）如果有GPU，需要安装好 NVIDIA 驱动程序、NVIDIA Container Toolkit
英伟达驱动安装参考文档： https://developer.nvidia.com/cuda-toolkit-archive
NVIDIA Container Toolkit安装参考文档：https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html
运行下面命令，如果输出显卡信息即Docker内可以正常使用GPU
```
docker run --rm --gpus all nvidia/cuda:12.5.0-runtime-ubuntu22.04 nvidia-smi
```

新建docker-compose.yml配置文件，参考下面内容：
CPU运行版本

services:
  ollama:
    image: ollama/ollama
    restart: always
    volumes:
      - ./ollama:/root/.ollama  #下载的模型及相关配置保存的目录
    environment:
      - OLLAMA_NUM_PARALLEL=2 #最大同时并发响应请求的数量，默认是1
      #- OLLAMA_KEEP_ALIVE=-1 #模型加载后多久不用就会自动卸载内存，默认5m（5分钟）
      #- OLLAMA_MAX_LOADED=2 #最大同时加载的模型数量，默认是1
    ports:
      - "11434:11434"

GPU运行版本

services:
  ollama:
    image: ollama/ollama
    restart: always    
    volumes:
      - ./ollama:/root/.ollama  #下载的模型及相关配置保存的目录
    environment:
      - OLLAMA_NUM_PARALLEL=2 #最大同时并发响应请求的数量，默认是1
      #- OLLAMA_KEEP_ALIVE=-1 #模型加载后多久不用就会自动卸载内存，默认5m（5分钟）
      #- OLLAMA_MAX_LOADED=2 #最大同时加载的模型数量，默认是1
    ports:
      - "11434:11434"
    deploy: #使用GPU主要增加这个配置
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all #使用所有GPU，可以指定数量和特定GPU
              capabilities: [gpu]

配置完，直接一键启动即可
```
docker-compose up -d
```

2.下载模型

Ollama 可以一键使用的官方模型参考：https://ollama.com/library
运行下面命令可以直接下载官方模型镜像
其中qwen2.5vl:latest是通义千问的多模态模型，参考：https://ollama.com/library/qwen2.5vl
```
//运行下面命令，模型会下载到/root/.ollama目录下
docker-compose exec ollama ollama pull qwen2.5vl:latest
```
罗列出所有已经下载的模型
```
docker-compose exec ollama ollama list
```

三、使用

1. 在Cherry Studio大模型对话客户端中使用

Cherry Studio安装包下载地址：https://www.cherry-ai.com/
配置启动 ollama 模型服务
在对话界面，选择本地ollama模型，并进行对话

2. 使用 ollama 提供的对话API

可以参考官方API文档，地址：https://github.com/ollama/ollama/blob/main/docs/api.md
文本对话API，适合通用问题回答
图片对话API，适合OCR，图片描述场景
上面启动的qwen2.5vl:latest是多模态模型，可以进行图片对话，输入下面手写文本图片

postman请求示例截图如下：

四、总结

ollama是个非常强大大语言模型启动工具，让普通电脑也能快速运行大语言模型
操作使用简单，官方文档齐全，开发者友好，多平台支持，而且模型库更新和社区活跃
可以ollama启动本地大模型，询问一下私密问题、搭建本地AI笔记、搭建本地AI数据库应用、识别自己的图片内容

温馨提示： 本文最后更新于2025-09-30 16:05:34，某些文章具有时效性，若有错误或已失效，请在下方留言或联系在线客服。

文章版权声明 1 本网站名称： 创客网
2 本站永久网址：https://new.ie310.com
1 本文采用非商业性使用-相同方式共享 4.0 国际许可协议[CC BY-NC-SA]进行授权
2 本站所有内容仅供参考，分享出来是为了可以给大家提供新的思路。
3 互联网转载资源会有一些其他联系方式，请大家不要盲目相信，被骗本站概不负责！
4 本网站只做项目揭秘，无法一对一教学指导，每篇文章内都含项目全套的教程讲解，请仔细阅读。
5 本站分享的所有平台仅供展示，本站不对平台真实性负责，站长建议大家自己根据项目关键词自己选择平台。
6 因为文章发布时间和您阅读文章时间存在时间差，所以有些项目红利期可能已经过了，能不能赚钱需要自己判断。
7 本网站仅做资源分享，不做任何收益保障，创业公司上收费几百上千的项目我免费分享出来的，希望大家可以认真学习。
8 本站所有资料均来自互联网公开分享，并不代表本站立场，如不慎侵犯到您的版权利益，请联系79283999@qq.com删除。

本站资料仅供学习交流使用请勿商业运营，严禁从事违法，侵权等任何非法活动，否则后果自负！

THE END

创业经验项目思路

文字广告位招租中	文字广告位招租中	文字广告位招租中	文字广告位招租中	文字广告位招租中
文字广告位招租中	文字广告位招租中	文字广告位招租中	文字广告位招租中	文字广告位招租中
文字广告位招租中	文字广告位招租中	文字广告位招租中	文字广告位招租中	文字广告位招租中

1解决Alpine Python环境中apk安装包路径与版本不匹配问题

2基于浏览器指纹识别实现同一设备跨浏览器通信的教程

314:21 维达山茶花湿厕纸 80片 4包便携装7片 6包 35.9 安全不刺激，用

4KimiAI使用指南，全方位AI指令合集，帮助你轻松提升创作效率

521:27 plus111-11，200-20，按需卡士（CLASSY.KISS）双

618:04 霸王防脱控油去屑洗发露80ml 防脱洗发水（旅行装），0.9

热门广告位

小白友好：用 Ollama 在 Docker 中运行本地 LLM 实战指南

一、简介

二、安装与下载模型（Docker方式）

1. 使用 docker-compose 安装 Ollama

2.下载模型

三、使用

1. 在Cherry Studio大模型对话客户端中使用

2. 使用 ollama 提供的对话API

四、总结

请登录后发表评论

1解决Alpine Python环境中apk安装包路径与版本不匹配问题

2基于浏览器指纹识别实现同一设备跨浏览器通信的教程

314:21 维达山茶花湿厕纸 80片 4包 便携装7片 6包 35.9 安全不刺激，用

4KimiAI使用指南，全方位AI指令合集，帮助你轻松提升创作效率

521:27 plus111-11，200-20，按需 卡士（CLASSY.KISS）双

618:04 霸王防脱控油去屑洗发露80ml 防脱洗发水（旅行装），0.9

热门广告位

小白友好：用 Ollama 在 Docker 中运行本地 LLM 实战指南

一、简介

二、安装与下载模型（Docker方式）

1. 使用 docker-compose 安装 Ollama

2.下载模型

三、使用

1. 在Cherry Studio大模型对话客户端中使用

2. 使用 ollama 提供的对话API

四、总结

请登录后发表评论

314:21 维达山茶花湿厕纸 80片 4包便携装7片 6包 35.9 安全不刺激，用

521:27 plus111-11，200-20，按需卡士（CLASSY.KISS）双