前言

捣鼓一下Ollama

使用须知

缺点

  1. 部分机器下载模型速度较慢
  2. 装了通义的qwen2.5-coder:32b,回答吐字很慢,应该还是性能不够
  3. 每天凌晨会强制自动关机
    • ngrok临时穿透的地址会变
    • 不过ngrok可以绑定自定义域名,这样就不会频繁更换了
    • 但是每天手动点开机确实麻烦,后续可探索自动化脚本解决方案

优点

  1. 白嫖
  2. 小模型无压力,自带的llama3回复吐字很快
  3. 或许可以小模型配合沉浸式翻译,实现自由?

运行环境

  1. Tencent Cloud Studio
  2. Ollama
  3. Ngrok (或其他内网穿透工具)
  4. OpenWebUI (可选)

详细步骤

1. 安装Ollama环境

1.1 进入网站并登录

https://ide.cloud.tencent.com/

1.2 创建Ollama

2285626184.png 208182857.png

1.3 新建终端

1168759010.png

1.4 验证安装

输入以下命令:

ollama

2864110763.png

ollama list

291907451.png 可以看到,已经预装好了,并且自带了Llama 3

1.5 启动服务

终端输入:

ollama serve

1768635256.png 可以看到6399端口被占用了,现在就不用管了

1.6 基础使用测试

ollama list
ollama run llama3:latest

2213100713.png

2. 安装ngrok

2.1 注册账号

不赘述了

2.2 进入配置页面

https://dashboard.ngrok.com/get-started/setup/linux

2.3 执行安装命令

按照页面提示执行相关命令: 3900461783.webp

2.4 完成安装

这个时候终端应该是这样的,请记住红框里面的地址: 1900092064.webp

3. 安装OpenWebUI(可选)

这个就不赘述了,佬友们应该都装过了的

4. 配置OpenWebUI

3040697053.webp

4.1 获取模型

2159330906.webp

4.2 测试运行

1033562995.webp

补充说明

5.1 其他开源模型

访问模型库: https://ollama.com/library

5.2 安装方法

使用 ollama pull 命令安装对应模型ID
例如:

ollama run qwen2.5-coder

会自动下载安装: 3500046453.webp