Ollama使用方法

Ollama 是一个用于在本地运行、管理和部署大型语言模型（LLM）的工具，支持多种开源模型（如 LLaMA、Mistral、Gemma 等）。以下是详细的使用方法：

  curl -fsSL https://ollama.com/install.sh | sh

ollama pull <模型名>

常用模型：

示例：

ollama pull llama3

ollama run <模型名>

运行后会进入交互式聊天界面，直接输入问题即可。

ollama list

ollama delete <模型名>

创建 Modelfile 文件，例如：

dockerfile

FROM llama3
SYSTEM "你是一个擅长翻译的助手，专门将中文翻译成英文。"

   ollama create <自定义模型名> -f Modelfile

   ollama run <自定义模型名>

Ollama 默认在 11434 端口提供 REST API：

curl http://localhost:11434/api/generate -d '{
  "model": "llama3",
  "prompt": "为什么天空是蓝色的？"
}'

docker run -d -p 11434:11434 --name ollama ollama/ollama
docker exec ollama ollama pull llama3

GPU 加速：

安装后会自动启用 GPU（需 NVIDIA 驱动和 CUDA），可通过 ollama serve 查看日志确认。
离线使用：

首次 pull 需联网，后续运行无需网络。
模型存储位置：
- Linux/macOS：~/.ollama/models
- Windows：C:\Users\<用户名>\.ollama\models

ollama run llama3 "将以下句子翻译成英文：深度学习是人工智能的重要分支。"

ollama run mistral "用 Python 写一个快速排序函数。"

通过以上步骤，你可以快速上手 Ollama。更多功能参考官方文档或运行 ollama --help。

results matching ""