开启open-webui:一键集成ollama,打造革命性GPT体验

zhouhui
2 Mar 202409:39

Summary

TLDR本期视频介绍了ollama的Web版——open Web UI,它支持多种功能,包括聊天、文档上传、网页浏览、语音输入等。视频详细演示了如何安装配置ollama和open Web UI。此外还展示了它们的一些功能,比如文档分析、CSV转换、多模态处理等。open Web UI相比其他类似工具,提供了更多实用功能。

Takeaways

  • 😃ollama Web版本支持多种功能:聊天、文档上传、网页浏览、语音输入等
  • 👍提供了Windows安装包,安装和使用都十分便捷
  • 📝支持与本地RAG引擎集成,可以增强文档理解能力
  • 🔌可以连接外部Ollama服务器,支持反向代理
  • 😎同时支持多个AI模型进行智能对话
  • ✨支持OpenAI API接口集成
  • 🖥️基于Pinokio软件可以方便安装open Web UI
  • 🎨支持AI绘画功能,例如Stable Diffusion
  • 🔊提供了语音合成功能
  • 👀支持上传图片并生成描述,具有视觉理解能力

Q & A

  • ollama web版本支持哪些功能?

    -ollama web版本支持多模态,可以上传文档,集成本地RAG,浏览网页,支持语音输入,AI绘画,与多个模型对话,集成OpenAI API,连接外部Ollama服务器,支持后端反向代理等功能。

  • open Web UI的安装方式有哪些?

    -open Web UI提供docker安装方式。另外也可以通过Pinokio这个软件进行安装部署。

  • open Web UI相比Chatbox有哪些优势?

    -open Web UI支持文档,多模态等更多功能,总体上比Chatbox功能更加强大。

  • 安装open Web UI需要哪些前置条件?

    -安装open Web UI前需要先安装conda、git、zip、python、vs studio等软件。Pinokio会自动安装这些前置软件。

  • open Web UI生成的CSV文件质量如何?

    -open Web UI可以根据提示词生成CSV文件,但是代码行质量还有一定随机性,与后端连接的模型也有关系。

  • ollama的多模态模型有哪些功能?

    -ollama的多模态模型可以分析图片内容并用语音进行回答。

  • open Web UI还支持哪些其他功能?

    -open Web UI还支持自动图像生成,语音识别与合成(TTS)等功能。

  • ollama 和 open Web UI的关系是?

    -ollama是语言模型软件,而open Web UI是一个web界面,可以连接ollama使用其语言功能。

  • 安装open Web UI的主要难点在哪里?

    -open Web UI涉及前后端,相对复杂。主要难点在于docker和环境配置。Pinokio工具可以简化安装。

  • open Web UI适合什么人群使用?

    -喜欢折腾的技术人群。对语言模型感兴趣并想通过web界面试用的人群。

Outlines

00:00

😊 ollama Web版本介绍

本段介绍了ollama Web版本的功能,包括支持多模态、文档处理、网页浏览、语音输入、AI绘画、多个模型对话、OpenAI API集成、外部服务器连接、后端反向代理等。还介绍了ollama的安装方法。

05:01

😃 open Web UI项目安装

本段介绍了open Web UI项目的安装方法,包括通过docker方式和使用Pinokio工具安装。详细演示了利用Pinokio工具安装open Web UI的过程,并展示了安装完成后可与ollama集成使用的效果,支持文档上传和多模态功能。

Mindmap

Keywords

💡ollama

ollama是一个基于OpenAI API搭建的聊天机器人软件。视频中多次提到ollama软件的安装和使用,它支持连接OpenAI的各种语言模型,实现聊天、问答等人机交互功能。

💡open Web UI

open Web UI是一个开源的网页前端,可以连接各种聊天机器人后端服务,如ollama等。视频详细介绍了如何安装配置open Web UI,连接ollama后端,实现网页版的聊天机器人。

💡多模态

多模态指语音、图像、文字等多种模式的输入和输出。视频中展示了ollama的多模态模型,可以对图像内容进行理解和描述。open Web UI也支持多模态交互。

💡RAG

RAG指基于检索增强生成(Retrieve and Refine)的模型。视频中提到open Web UI支持RAG。这可以利用检索相关信息,增强聊天机器人的回答质量。

💡文档

open Web UI支持上传和解析文档,视频中演示了它可以解析文档,生成指定格式的输出。这增强了其Handling的能力。

💡Pinokio

Pinokio是一个帮助安装各种开源项目的软件工具。视频使用Pinokio来安装配置open Web UI。

💡gemma

gemma是谷歌开源的对话模型,视频中使用gemma作为ollama的后端模型,与open Web UI前端连接。

💡CSV

CSV是一种简单的文件格式,用于存储表格数据。视频展示open Web UI可以解析文档,生成CSV格式的输出。

💡镜像

这里指AI模型的docker镜像。视频中提到ollama使用docker来分发AI模型。

💡网页浏览

open Web UI作为网页应用,支持直接在浏览器中使用,视频中演示了其网页界面和交互。

Highlights

ollama Web 版本支持多模态,如文档、本地 RAG 集成等

支持网页浏览、语音输入、AI 绘画、多个模型对话等功能

集成了 OpenAI API,支持外部 Ollama 服务器连接

有后端反向代理支持,整体功能强大

介绍 open Web UI 项目,它实现聊天、附件上传等功能

open Web UI 使用 Docker 安装,分前后端实现

使用 Pinokio 工具安装 open Web UI 项目

Pinokio 会先安装必要的软件环境,然后克隆 GitHub 项目

启动 open Web UI 后需要同时运行 ollama 后端

open Web UI 支持文档解析和 CSV 导出等功能

下载多模态模型,可以分析图像内容

支持 AUTOMATIC1111 进行 AI 绘画

有 TTS 语音合成功能

open Web UI 功能强大,比 ChatBox 等客户端更优

视频分享内容结束

Transcripts

play00:00

ollama web版本支持多模态

play00:03

支持文档 、本地 RAG 集成、网页浏览功能

play00:06

语音输入支持、AI绘画、多个模型对话

play00:11

OpenAI API 集成

play00:12

外部 Ollama 服务器连接

play00:14

后端反向代理支持

play00:16

基多功能一体的

play00:17

chatgptweb客户端软件来了

play00:20

今天给大家介绍一个项目

play00:21

是ollama的Web版

play00:23

它的早期项目叫ollama-Web UI

play00:26

现在项目更名为open Web UI

play00:29

它主要实现哪些功能呢

play00:30

可以实现聊天

play00:32

实现附件

play00:33

包括我们现在的多模态的附件

play00:36

就是聊天和附附件功能

play00:38

然后也支持RAG的一个增强

play00:40

那么下面给大家介绍下

play00:42

这个项目怎么去用的

play00:43

那我们首先回到上期视频当中

play00:46

我们用到了一个 ollama

play00:47

这个ollama的这个安装地址

play00:49

在这个位置

play00:50

目前他已经升到V0.1.28版本

play00:52

我们找到一个Windows版

play00:54

点击这个下载

play00:56

因为我提前已经下载完成了

play00:58

下载完成之后

play00:59

这里面有一个这个地方

play01:00

我们检查双击

play01:01

因为现在目前的话

play01:03

这个软件安装的时候

play01:04

可能会认为是一个病毒

play01:06

我们首先把杀毒软件给关闭掉

play01:10

然后把360的也去掉

play01:12

退出然后这时候我们进行点击安装

play01:16

点下一步

play01:17

它默认会装在c盘的document APP date

play01:21

这个目录下面去

play01:22

然后我们找一下安装目录

play01:27

程序安装是在这个目录下面

play01:29

然后大概是有100多兆

play01:33

哦 385M

play01:35

然后接下来

play01:35

我们就可以启动桌面板的CMD命令

play01:40

然后我们测一下

play01:45

好这个版本是0.1.28木

play01:47

已经安装好了

play01:49

接下来我们就启动这个

play01:51

ollama

play01:51

我们还是以上期的谷歌的gemma为例

play01:54

我们下载这个模型

play01:57

我们复制这个命令然后

play02:01

啊这时候我已经那个启起来了

play02:04

因为之前我在电脑上

play02:06

已经装过gemma:7b模型

play02:08

所以它直接可以启起来

play02:10

默认的情况下他没有模型的话

play02:12

可以有一个下载过程

play02:13

这个大家就稍等一下

play02:14

这个就是我们的模型的地址

play02:17

跟那个我们之前的docker文件差不多

play02:22

然后它这里面有一堆文件

play02:24

看就是这个

play02:25

大家看到了

play02:26

这就是相当于镜像

play02:28

而且模型镜像做成一个docker模式

play02:31

刚才ollama已经给大家安装过了

play02:33

接下来

play02:33

我们看一下这个open webui的安装

play02:36

open UI的项目地址是在github这个位置

play02:38

然后

play02:39

然后它的安装

play02:40

官方安装是由docker

play02:42

来方式来进行安装的

play02:44

因为它分前端和后端

play02:45

前端是nodejs

play02:47

后端是Python实现的

play02:48

然后因为我本地电脑上docker Desktop

play02:51

这个有点问题

play02:52

所以我这边就没有安装成功

play02:54

接下来我们给大家使用一个叫

play02:56

Pinokio来给大家进行安装这个东西

play03:00

给大家演示一下Pinokio这个软件

play03:02

安装这个项目

play03:03

在github的这个这个项目的这个地址

play03:06

然后我们点开这个官网

play03:08

查官网网站打开之后

play03:11

这里面有相关的说明

play03:14

比如说这是一个油管的一个视频

play03:16

然后下面呢是集成了

play03:18

就是像open Web UI Lobo CHAT就是这些主流的

play03:23

这这个github的一个项目

play03:25

我们打开这个dowload

play03:30

然后这里面会有Windows Mac

play03:33

嗯然后Linux我们选Windows

play03:36

然后点击下载

play03:37

然后按照这个路步骤

play03:39

就是安装就可以了

play03:41

我这里面已经提前安装好了

play03:43

这就不给大家演示

play03:44

安装完成之后我们桌面上会有

play03:46

打开软件之后

play03:47

这里面有一个访问这个网站

play03:51

然后这样的话

play03:52

他一个就我们看到刚才网站上

play03:56

Web,Web UI

play03:59

lobe chat这里面都有相关的这些

play04:01

我们只要在这里面安装好就行

play04:03

包括ollama

play04:05

对吧我们接下来我们下载

play04:08

呃就先选这个吧

play04:10

选中它之后

play04:11

然后这里面是先下载dowload

play04:14

这一块的话

play04:14

首先它会把目前的conda,git

play04:17

z i p

play04:18

还有py还有vs等

play04:20

这些软件先提前先安装

play04:22

安装完之后

play04:23

然后再来我们接下来看一下这个

play04:25

点开这个

play04:26

好了我们看窗口这边已经弹出来

play04:28

就是第一个已安装完了

play04:30

conda安装完

play04:31

第二个是装 git

play04:34

然后稍等片刻

play04:35

我们看到这个已经安装vs了

play04:38

然后这个弹出一个vs studio的

play04:42

应该安装这个界面

play04:43

这个稍等它一遍

play04:44

下载安装

play04:46

安装完成之后

play04:47

这里面有一个安装complete click OK

play04:50

我们点确定

play04:52

好这时候就已经完成了

play04:57

我们打开Pinokio

play04:58

然后这里面进入一个

play05:00

Pinokio的这些项目的这个地址

play05:03

这个各种网站的地址

play05:04

然后我们打开这个Web UI

play05:08

然后这里面我们点击download下载

play05:11

这时候它会保存save as 这个Web UI GT

play05:14

然后下载下来这个

play05:16

稍等片刻

play05:19

好这个是已经下载完成了

play05:22

然后它会进入到一个叫open Web UI的GT

play05:25

这个项目

play05:26

然后我们点开这个项目子模块

play05:29

这里面有一个install

play05:30

我们点开它

play05:34

然后接下来就是对那个Pinokio

play05:37

然后在github里面

play05:39

下Web open UI的这个项目

play05:41

然后只剩一个NPU的编译打包

play05:44

我们稍等片刻

play05:50

啊这一步就是安装完成

play05:52

运行完成之后

play05:53

我们点击start

play05:56

然后这时候他们需要提示我装

play05:59

安装啦ollama

play06:00

这时候我们这边已经启起来了

play06:02

我们点开这个

play06:07

这个ollama

play06:07

这个页面就已经打开了

play06:09

我们注册一下

play06:11

然后填入名字

play06:24

我们确保这边的ollama模型启动

play06:27

然后输入127.0.0.1:8000

play06:30

这时候启起来

play06:32

然后我们下拉选项

play06:33

这里面有一个那个刚才的gemma

play06:37

7b模型

play06:38

然后我们可以聊天

play06:50

好这个他已经写出来了

play06:52

然后接下来我们再可以测一下这个

play06:55

webui

play06:58

它可以支持那种附件和文档上传

play07:01

我们测一下

play07:02

我们试一下这个项目经理清单

play07:06

然后给它一个提示词比如说

play07:10

请分析一下项目

play07:11

进行清单

play07:12

并将这个文件格式输出

play07:13

CSV文件格式

play07:15

把生成出来的CSV文件

play07:16

格式与代码行输出

play07:18

我们看下效果

play07:23

好这时候他就按照我们刚才的要求

play07:25

把这边这个文档解析出来了

play07:29

然后生成姓名年龄所有代

play07:31

然后是否有PMP

play07:32

然后这是他的代码

play07:34

这个代码我个人觉得他生成的

play07:37

可能有点随机性

play07:38

但是至少他能读懂

play07:40

可能跟我们后端的那个gemma

play07:41

模型是有关系的

play07:44

这个webui还支持多模态

play07:46

我们接下来在这官方上下载这个模型

play07:49

这个是多模态的模型

play07:51

我们点开它

play07:54

然后找一个简单的1.6的这个模型吧

play07:57

我们把这个装一下

play08:02

然后我们开CMD窗口

play08:03

这个我们下一下模型

play08:04

稍等一下

play08:06

好了这个模型已经下载完成了

play08:09

我们看一下这

play08:15

play08:17

这时候就有一个ollama

play08:19

llava的多模态模型

play08:21

我们测一下

play08:21

我们选择一张照片

play08:35

我们问请这张照片的内容是什么

play08:37

让他回答一下

play08:42

好他已经回答出来

play08:43

这张照片是一个关于长发的脸部表情

play08:45

一个男姓

play08:46

正是对面一种视觉的圆

play08:48

这个就是这个Olama

play08:51

它还支持一些其他的一些功能

play08:54

比如说我们现在看到的声音

play08:56

然后它的图像

play08:57

图像可以直接AUTOMATIC1111

play09:00

因为这个时间关键就不给大家演示了

play09:02

然后声音这块我们给大家听一下

play09:06

这面有个TTS

play09:07

这张照片的内容

play09:09

play09:09

一张关于长发和脸部表情的男性画像

play09:13

他正视镜头

play09:15

给人以一种啊

play09:16

总之这个这个Web就是open Web UI

play09:21

这个项目功能还是非常强大的

play09:23

它支持一些RAG

play09:25

然后文档

play09:26

然后多模态等功能

play09:28

比之前我们说的那个Chatbox

play09:29

可能功能更强大一些啊

play09:32

本期的分享就到这里

play09:33

全部结束了

play09:35

谢谢大家的观看