免费打造个人专属的高颜值本地大模型AI助手,无限量使用 Ollama+LobeChat开源工具,在本地运行AI大模型,安全的和AI对话。

慈云数据 2024-04-23 技术支持 67 0

文章目录

    • 1、安装ollama
    • 2、下载模型
    • 3、安装lobechat
    • 4、卸载Ollama

      1、安装ollama

      第一步,首先安装ollama,选择对应系统的安装包

      ollama官网地址:https://ollama.com/

      在这里插入图片描述

      在这里插入图片描述

      本问是lunix系统上安装ollama:

      curl -fsSL https://ollama.com/install.sh | sh
      

      在这里插入图片描述

      在这里插入图片描述

      如果机子没有GPU显卡的话,ollama会提示只通过cpu模式运行。

      测试ollama命令:

      ollama --help
      

      在这里插入图片描述

      想要流畅运行,推荐配置:

      • 4b的模型:8GB内存。

      • 7b的模型:16GB内存。

      • 13b模型: 32GB内存。

      • 70b模型:64GB内存,32也能跑,太卡。

        在这里插入图片描述

        2、下载模型

        ollama支持的LLM模型很多:

        https://ollama.com/library

        第二步,下载model,本文选择下载阿里的通义千问模型:

        在这里插入图片描述

        在这里插入图片描述

        这里选择4b参数的模型:

        在这里插入图片描述

        ollama run qwen:4b
        

        在这里插入图片描述

        ollama会自动帮我们下载模型和启动模型。

        模型下载完成后,可以发送一条消息测试:

        在这里插入图片描述

        修改ollama环境变量

        #找到服务的单元文件:
        #/etc/systemd/system/目录下
        sudo vi /etc/systemd/system/ollama.service
         
        #添加环境变量:
        [Service]
        Environment="OLLAMA_HOST=0.0.0.0:11434"
        #如果已经有
        Environment="PATH=xxx:/root/bin" "OLLAMA_HOST=0.0.0.0:11434"
         
        #为了使更改生效,您需要重新加载systemd的配置。使用以下命令:
        sudo systemctl daemon-reload
         
         
        #最后,重启服务以应用更改:
        sudo systemctl restart ollama
         
        

        使用命令行操作不太方便,使用下面的lobe chat进行界面化操作。

        3、安装lobechat

        Lobe Chat:现代化设计的开源 ChatGPT/LLMs 聊天应用与开发框架,支持语音合成、多模态、可扩展的(function call)插件系统,一键免费拥有你自己的 ChatGPT/Gemini/Claude/Ollama 应用。

        lobe chat参考地址:https://github.com/lobehub/lobe-chat/blob/main/README.zh-CN.md

        使用docker方式进行安装:

        docker run -d -p 3210:3210 -e OLLAMA_PROXY_URL=http://host.docker.internal:11434/v1 lobehub/lobe-chat
        
        #你在自己的私有设备上部署 LobeChat 服务。使用以下命令即可使用一键启动 LobeChat 服务:
        $ docker run -d -p 3210:3210 \
          -e OPENAI_API_KEY=sk-xxxx \
          -e ACCESS_CODE=lobe66 \
          --name lobe-chat \
          lobehub/lobe-chat
        

        在这里插入图片描述

        开通3210端口,进行访问测试:

        在这里插入图片描述

        配置lobe chat:

        首先将模型切换到我们下载好的qwen 4b模型:

        点击设置—选择语言模型

        在这里插入图片描述

        在这里插入图片描述

        ollama完全兼容openai的接口,在接口代理地址中输入我们的ollama地址。

        http://host.docker.internal:11434/v1

        • 如果是docker的话,用 http://host.docker.internal:11434/v1
        • 手动的话,就用 http://localhost:11434/v1 或者 http://127.0.0.1:11434/v1

          如果是跑4b,7b等小模型,普通电脑就可以了,如果要跑32b比较大的,最好是有GPU,还要显存比较大

          硬盘没啥要求,比如4b的模型,才2.3GB而已,30b的也就30GB左右,完全不用担心磁盘.

          4、卸载Ollama

          如果您决定不再使用Ollama,可以通过以下步骤将其完全从系统中移除:

          停止并禁用服务:

          sudo systemctl stop ollama
          sudo systemctl disable ollama
          

          删除服务文件和Ollama二进制文件:

          sudo rm /etc/systemd/system/ollama.service 
          sudo rm $(which ollama)
          

          清理Ollama用户和组:

          sudo rm -r /usr/share/ollama
          sudo userdel ollama
          sudo groupdel ollama
          

          在这里插入图片描述


          每一次的跌倒,都是对未来的一次深情拥抱。


微信扫一扫加客服

微信扫一扫加客服

点击启动AI问答
Draggable Icon