当前位置:首页 » 《关于电脑》 » 正文

ollama+ollama-webu在windos上部署的教程

0 人参与  2024年10月23日 16:02  分类 : 《关于电脑》  评论

点击全文阅读


ollama+ollama-webu在windos上部署的教程

一、需要准备的环境和代码二、开始部署1. 修改系统变量: 常见问题
在这里插入图片描述

首先介绍一下ollama:
Ollama 是一种为快速大规模语言模型推理所设计的框架和平台。它旨在帮助用户通过高效的方式运行和管理大型语言模型,支持在不同硬件环境中进行优化计算。Ollama 可以利用各种硬件加速器(如 GPU 和 TPU),并通过分布式计算框架实现快速的推理和训练。
其主要特点包括:

高效推理:Ollama 通过专门的优化算法和分布式架构,能够大幅度提升大规模语言模型的推理效率,减少计算资源的使用,同时提供实时推理的能力。硬件兼容性:支持多种硬件加速器,如 NVIDIA GPU 和 Google TPU,以最大化模型运行时的性能。模型管理:为用户提供了便捷的模型管理功能,可以轻松加载、部署和切换不同的模型。可扩展性:允许用户根据需求调整资源配置,支持多个节点的分布式计算,以处理大型模型或数据集。用户友好性:提供了简单易用的 API 和命令行工具,方便开发者和研究人员在不同的环境中快速启动和运行。

一、需要准备的环境和代码

ollama.exe下载:https://ollama.com/
在这里插入图片描述

ollamawebui代码下载:git clone https://github.com/ollama-webui/ollama-webui-lite

二、开始部署

下载并安装 Node.js 工具:https://nodejs.org/zh-cn下载ollama-webui工程代码:git clone https://github.com/ollama-webui/ollama-webui-lite ollama-webui切换ollama-webui代码的目录:cd ollama-webui设置 Node.js 工具包镜像源(下载提速):npm config set registry http://mirrors.cloud.tencent.com/npm/初始化npm:npm init -f安装 Node.js 依赖的工具包:npm install最后,启动 Web 可视化界面:npm run dev
到这里就会出现几个网站:
在这里插入图片描述
打开http://localhost:4000/
就可以进行使用了,

1. 修改系统变量:

打开cmd,设置模型下载的位置,ollama的接收端口,设置完以下后都要重启一下ollama,或者重启电脑在这里插入图片描述

 # 永久指定setx OLLAMA_MODELS "D:\Ollama\Models"# 临时指定set OLLAMA_MODELS="D:\Ollama\Models"setx OLLAMA_HOST "0.0.0.0"setx OLLAMA_ORIGINS "*"# 查看环境变量echo %OLLAMA_ORIGINS%

○ OLLAMA_MODELS:可以定义Ollama下载模型的位置

ollama常用的设置环境变量

OLLAMA_MODELS:模型文件存放目录,默认目录为当前用户目录(Windows 目录:C:\Users%username%.ollama\models,MacOS 目录:~/.ollama/models,Linux 目录:/usr/share/ollama/.ollama/models),如果是 Windows 系统建议修改(如:D:),避免 C 盘空间吃紧OLLAMA_HOST:Ollama 服务监听的网络地址,默认为127.0.0.1,如果允许其他电脑访问 Ollama(如:局域网中的其他电脑),建议设置成0.0.0.0,从而允许其他网络访问OLLAMA_PORT:Ollama 服务监听的默认端口,默认为11434,如果端口有冲突,可以修改设置成其他端口(如:8080等)OLLAMA_ORIGINS:HTTP 客户端请求来源,半角逗号分隔列表,若本地使用无严格要求,可以设置成星号,代表不受限制OLLAMA_KEEP_ALIVE:大模型加载到内存中后的存活时间,默认为5m即 5 分钟(如:纯数字如 300 代表 300 秒,0 代表处理请求响应后立即卸载模型,任何负数则表示一直存活);我们可设置成24h,即模型在内存中保持 24 小时,提高访问速度OLLAMA_NUM_PARALLEL:请求处理并发数量,默认为1,即单并发串行处理请求,可根据实际情况进行调整OLLAMA_MAX_QUEUE:请求队列长度,默认值为512,可以根据情况设置,超过队列长度请求被抛弃OLLAMA_DEBUG:输出 Debug 日志标识,应用研发阶段可以设置成1,即输出详细日志信息,便于排查问题OLLAMA_MAX_LOADED_MODELS:最多同时加载到内存中模型的数量,默认为1,即只能有 1 个模型在内存中

常见问题

Windows系统,提示错误 Error:Could not connect to ollama app, is it running
说明没有正确启动,1. 重新启动电脑,再次尝试。2. 关闭ollama程序,以管理员身份重新启动ollama


点击全文阅读


本文链接:http://m.zhangshiyu.com/post/176270.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

最新文章

  • 林语熙周晏京(离婚后,老公天天跪求复合全集阅读)最新章节免费在线阅读_《离婚后,老公天天跪求复合全集阅读》最新热门小说 -
  • 顾绫雪嬴政《被始皇读心后,文武百官卷疯了!完结版阅读》完整版免费在线阅读_(顾绫雪嬴政)全集免费阅读 -
  • 情深意长皆成空完整版阅读(沈卿林砚辞)抖音热文_《情深意长皆成空完整版阅读》最新章节免费在线阅读 -
  • 姐姐为暴富重伤傅家金孙后火葬场了全集阅读小说(傅延江瑶)全文免费阅读无弹窗大结局_(姐姐为暴富重伤傅家金孙后火葬场了全集阅读免费阅读全文大结局)最新章节列表_笔趣阁(姐姐为暴富重伤傅家金孙后火葬场了全集阅读) -
  • 乔以诺萧瑾淮(不是你好是我好全集阅读)精彩试读_《不是你好是我好全集阅读》全本阅读 -
  • 白月光双双《重生后我成全老公和白月光,他却急了全集》全文免费阅读无弹窗大结局_(白月光双双)最新章节免费在线阅读 -
  • 苏小枫苏末小说免费笔趣阁_苏小枫苏末小说全章完本大结局
  • 死遁后他疯了最新小说全文阅读_最新免费小说沈轻洲林梦江之雪_完本小说(死遁后他疯了)
  • 免费小说《顾里宋婷婷小岳欧颖倩》已完结(顾里宋婷婷小岳欧颖倩)热门小说大结局全文阅读笔趣阁
  • 侄子为求富贵,变性后全家后悔最新小说_免费小说全文阅读(苏小枫苏末)_侄子为求富贵,变性后全家后悔苏小枫苏末小说推荐完结
  • 最新《沈轻洲林梦江之雪》小说(全集完整新上小说大结局(沈轻洲林梦江之雪))全文阅读笔趣阁
  • 拒绝嫁给姐夫后,我在八零年代暴富了(陈小棠沈正韩)阅读 -

    关于我们 | 我要投稿 | 免责申明

    Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1