谷歌最强AI模型Gemini完全免费使用,比GPT-4还强?随意创建API key使用,文本图像任务轻松处理

向北
23 Dec 202312:06

Summary

TLDR本期视频详细介绍了Google最新发布的人工智能大模型Gemini,包括Gemini的三个级别Ultra、Pro和Nano,其中Gemini Pro是免费开放使用的。视频详细讲解了如何获取Gemini Pro的API密钥,以及通过API或在官网直接使用Gemini Pro处理文本和图像的操作。Gemini Pro是一个强大的语言模型,可以回答各类问题、生成文本等,视频中通过多个示例展示了它的各项功能。视频内容丰富全面,值得关注Gemini的用户学习参考。

Takeaways

  • 👨‍💻 介绍了Google最新发布的AI大模型Gemini的免费使用
  • 🆕 Gemini定位于和OpenAI的GPT-4抗衡
  • 🔑 Gemini有3个级别:Ultra、Pro和Nano
  • 💲 Gemini Pro是免费的,每分钟限制60次查询
  • 🔑 Gemini Pro需要获取API key才能被第三方应用调用
  • 📷 Gemini Pro vision可处理图像任务
  • 🤖 可以直接和Gemini对话提问
  • 🖼️ Gemini可根据图片创作诗歌等
  • ✔️ Gemini的回复可以给正反馈帮助改进
  • 📲 Gemini可用于Google手机 App上使用

Q & A

  • Gemini与ChatGPT有何不同?

    -Gemini是Google最新推出的AI模型,定位于和OpenAI的GPT-4竞争;而ChatGPT是OpenAI推出的对话式AI。两者均可进行对话式交互。

  • Gemini的三个级别有何区别?

    -Gemini Ultra是最强大的模型,将于2024年初推出;Gemini Pro是免费的性能最优模型;Gemini Nano是专为设备上使用而设计的可以离线使用的模型。

  • 如何获取Gemini的API key?

    -在Gemini的官方网站上创建账号并登录后,可以点击“Get API key”来获取key,用于第三方应用调用Gemini。

  • Gemini Pro和Gemini Pro vision的区别是什么?

    -Gemini Pro主要处理文本类任务,而Gemini Pro vision主要处理图像类任务。

  • Gemini的使用有什么限制吗?

    -免费版的Gemini Pro有每分钟60次查询次数的限制。

  • 如何上传图片给Gemini处理?

    -在Gemini的界面上,可以点击“Upload”按钮上传本地图片,也可以直接选择Google云端的图片。

  • Gemini可以做什么事情?

    -Gemini可以回答问题,生成文本,翻译语言,撰写故事,创作诗歌等,功能强大。

  • 给Gemini的回复反馈有什么用?

    -给Gemini回复正反馈可以帮助改进这个AI产品。

  • Gemini可以在哪些设备上使用?

    -Gemini Nano版本可以在Google手机等设备上离线使用。

  • 如何开始使用Gemini?

    -可以直接在Gemini官网创建账号并登录后即可开始使用和交互。

Outlines

00:00

📺介绍Gemini的三个级别和要点

首先介绍Gemini有Gemini Ultra、Gemini Pro和Gemini Nano三个级别。Gemini Ultra是适用于大规模高复杂度任务的最强大模型,将于2024年初推出。Gemini Pro是性能最佳的模型,适用于各种文本和图像任务,最重要的是它是免费使用的。Gemini Nano是为设备优化的可以离线使用的模型。

05:03

💡演示获取Gemini API密钥和与插件集成使用

点击Get API key可以获取Gemini API密钥,可以复制密钥。以翻译插件为例,可以在设置中选择Gemini作为翻译服务,粘贴密钥进行验证,然后就可以通过该插件调用Gemini API了。这样其他应用也可以集成Gemini提供服务。

10:07

👨‍💻演示Gemini Pro和Gemini Pro Vision的直接使用

如果不需要调用API,也可以直接在AI Studio中使用Gemini。Gemini Pro可直接输入文本与其交互。Gemini Pro Vision可上传图片,生成描述或创作。可以根据自己需求与之交互,探索更多玩法。

Mindmap

Keywords

💡Gemini

Gemini是谷歌最近发布的人工智能语言模型,被定位为与OpenAI的GPT-4抗衡的产品。视频介绍了Gemini的不同版本以及免费使用Gemini的方法。

💡API

API(应用程序接口)是软件系统之间进行交互和通信的接口。视频演示了如何获取Gemini的API密钥,并通过集成到其他应用中调用Gemini的功能。

💡语言模型

语言模型是能够预测句子结构和语义的人工智能系统。视频中的Gemini就是一个大规模语言模型,可以用来生成文本、回答问题等。

💡文本推理

文本推理是语言模型理解文本语义的关键能力。视频中提到Gemini可以进行各种文本推理任务,如问答、写作等。

💡图像推理

图像推理是语言模型理解图像内容的关键能力。视频演示了Gemini Pro vision可以分析图像内容并据此生成相应的文本。

💡生成式模型

生成式模型可以主动预测和生成新内容,而不是被动地做分类判断,Gemini作为生成模型可以自动生成文本、诗歌等。

💡机器学习

机器学习是让计算机系统自动改进性能的关键技术。视频中提到Gemini会利用用户的反馈持续优化模型。

💡语音识别

语音识别是让计算机听懂语音的技术。视频中作为语言模型的Gemini具备语音识别的潜力。

💡聊天机器人

聊天机器人可以与人进行交互对话。视频演示了可以通过问答的方式与Gemini进行交互。

💡自动翻译

自动翻译是让计算机完成不同语言之间转换的技术。视频中演示了如何通过Gemini提供机器翻译服务。

Highlights

Google 最新推出了AI大模型 Gemini,与 OpenAI 的 GPT-4 相抗衡

Gemini 有 3 个模型级别:Ultra、Pro 和 Nano,目前 Pro 版本免费开放使用

Gemini Pro 每分钟限制请求数为 60 次,对普通用户足够

可以获取 Gemini API 密钥,用于第三方应用调用 Gemini 服务

可以直接在 Gemini Studio 网站界面使用 Gemini Pro 文本模型

Gemini Pro 视觉模型可以处理图像,如识别物体、根据图片生成文本

Gemini视觉模型支持上传自己的图片进行处理

Gemini Pro文本模型可以进行问答、对话等

Gemini Pro视觉模型可以根据图片创作诗歌等

可以让Gemini Pro帮助完成各种任务

Gemini Pro可以翻译语言、回答问题、生成文本等

Gemini模型可以提问探索与训练

欢迎订阅加入学习使用Gemini

Gemini值得期待,能力强大,免费使用

Gemini发布具有里程碑意义,代表了AI发展的新方向

Transcripts

play00:00

大家好

play00:01

今天我们来和大家分享

play00:03

Google最新发布的AI大模型

play00:05

Gemini的免费使用

play00:07

它是被定位于

play00:09

和OpenAI的GPT-4所抗衡的产品

play00:13

首先呢我们可以通过这个

play00:19

那么这个链接呢

play00:20

我会贴到本期影片的下方

play00:23

我们可以看到这里的英文啊

play00:26

build with Gemini

play00:28

使用Gemini来构建

play00:30

我们可以体验Google最大最强的AI模型

play00:35

啊如果说

play00:36

你觉得这个英文用起来不方便的话

play00:38

你可以用你浏览器上面的

play00:40

这个翻译插件

play00:42

把它翻译成中文啊

play00:43

你可能觉得它会方便一些

play00:46

好那么我们下面给大家先介绍一下

play00:48

我们再来使用

play00:50

那么Gemini目前它是有三个级别

play00:53

分别为Gemini Ultra

play00:55

还有Gemini Pro以及Gemini Nano

play00:58

首先Gemini Ultra呢它是

play01:01

适用于大规模

play01:03

高复杂度的文本和图像推理任务的

play01:06

最强大的模型

play01:08

那么它会将于2024年初推出

play01:13

那Gemini Pro呢

play01:14

是性能最佳的模型

play01:17

它具有适用于各种

play01:19

文本和图像推理任务

play01:21

功能

play01:22

最重要的是Gemini Pro呢

play01:24

它是可以免费使用的

play01:26

还有就是Gemini Nano

play01:29

那么这个

play01:30

它是专为设备上面的体验

play01:33

而构建的模型

play01:34

它可以离线使用

play01:36

比如说在Google手机上面的使用

play01:40

那么下面呢

play01:40

我们再来点击这个pricing(价格)来看一下

play01:45

好那么我们可以看到Gemini Pro呢

play01:48

它是对每一个人都是免费的

play01:51

可以看到这里free for everyone

play01:53

每个人都可以免费使用

play01:55

我们可以

play01:56

看到

play01:56

不管你是输入的内容还是输出的内容

play01:59

都是免费啊

play02:01

看到这里

play02:04

不管你是输入还是输出的这个数据呢

play02:07

也会被用于提升这个产品啊

play02:09

在这里呢你也是要知道的

play02:11

还有就是这个免费的Gemini Pro

play02:15

它是有每分钟60次的

play02:17

一个查询次数的限制的

play02:19

不过

play02:20

这个对于我们大部分的普通用户来说

play02:23

完全是够用的

play02:24

那么现在呢

play02:25

我们就要来使用

play02:34

登录你的Google账号就可以

play02:38

好登录进来以后呢

play02:39

我们给这里来打勾啊

play02:42

打勾然后呢

play02:43

下面这两项呢

play02:44

是用来接收Google AI的一些资讯啊

play02:47

就是他会给你发邮件

play02:49

如果你有这个接收资讯的需求

play02:51

你就打上勾啊

play02:53

或者是呢

play02:53

你不打勾也可以

play02:54

这个都无所谓的

play02:55

只要第一个打勾就可以

play02:57

然后呢我们点击continue啊

play03:02

好那么现在呢

play03:04

我们就进入到了这个Google AI studio啊

play03:07

那么现在呢

play03:08

我们有两种使用方法

play03:10

就是要么你使用这个Gemini的API啊

play03:14

就是你其他的一些第三方的程序啊

play03:16

或者应用想要调用这个Gemini

play03:19

或者说呢

play03:20

你直接在这里面来使用

play03:21

我们先来看第一种啊

play03:23

get api keyey点击它

play03:26

然后我们来点击这里的

play03:31

我们来点击啊

play03:32

这个时候呢

play03:33

我们稍等一下

play03:34

它会生成一个API keyey

play03:36

也就是一个密钥

play03:38

好那么现在呢

play03:39

我们这里就生成了一个keyey

play03:42

大家看一下

play03:42

这 就是一个密钥

play03:44

那么我们可以直接点击这个copy啊

play03:46

来把它复制

play03:47

你可以存到一个记事本里面

play03:49

或者存到一个文本里面啊

play03:51

如果说

play03:52

你把这个刚才那个小窗口关掉了

play03:55

想要再次找到这个keyey

play03:57

就点击这里

play03:58

大家看一下

play03:59

哎又出来了

play03:59

你拷贝他就可以

play04:02

那么我们在这里呢

play04:03

可以创建多个API keyey

play04:06

比如说我再去创建一个

play04:09

看这里呢

play04:09

又创建了一个啊

play04:11

然后我这里有两个了

play04:13

可以创建多个啊

play04:15

至于他能创建多少个

play04:16

我没有测试过

play04:18

你感兴趣的话可以自己去测试一下

play04:20

那么这个keyey我们怎么去用呢

play04:23

就是你比如说你其他的一些应用

play04:26

或者说程序啊

play04:27

插件要调用它

play04:29

你把这个keyey复制一下

play04:31

然后呢我在这里给大家举个例子啊

play04:34

比如说我现在用的一个翻译插件

play04:37

就是这个沉浸式翻译啊

play04:39

这个插件呢

play04:40

也推荐大家使用啊

play04:41

挺好用的

play04:42

那么我点击它

play04:44

然后呢我点击这个设置OK

play04:48

那么大家看一下

play04:49

我现在使用的这个

play04:51

沉浸式翻译的这个插件

play04:53

它使用的服务是谷歌翻译

play04:56

除了谷歌翻译呢

play04:57

它支持微软翻译啊

play04:59

也支持

play04:59

以及我们现在正在要使用的Gemini

play05:03

还有下面这么多的这个服务

play05:05

你都可以选择啊

play05:07

但是相应的服务呢

play05:08

都是需要调用他们的API的

play05:10

那现在呢

play05:11

我就点击这个Gemini

play05:13

然后呢

play05:14

我们把刚才复制的key给它粘贴到这里

play05:18

啊给它粘贴到这里

play05:20

OK那么粘贴到这里以后呢

play05:22

我们可以测试一下能不能用啊

play05:25

点击测试服务

play05:30

OK验证成功

play05:32

那么说明

play05:33

我们这个key是正常可以使用的

play05:35

那么后面

play05:35

比如说我们要使用这个沉浸式翻译

play05:38

来翻译一个网页

play05:39

它就调用的是这个Gemini的这个API啊

play05:42

就是这个应该给大家说的很清楚了

play05:44

那么我们来测试一下啊

play05:46

现在这个沉浸式翻译

play05:47

我来打开一个啊网站

play05:52

好那比如说我打开了这个TED啊

play05:55

这个很著名的一个演讲网站

play05:58

然后呢

play05:59

我们现在使用这个沉浸式翻译

play06:01

来把它这个网页的英文翻译一下

play06:03

来试一下啊

play06:05

好我们点击翻译OK

play06:06

大家看一下

play06:07

当前的翻译服务就使用的是Gemini

play06:09

好我们点击

play06:15

好大家看到啊

play06:16

那么现在这个英文的网站

play06:19

我们就翻译成了有中文的对照啊

play06:22

这样这个我们就已经成功的使用了

play06:25

这个Gemini这个服务了

play06:28

大家看一下

play06:29

这个英文都是有这个中文的对照的啊

play06:33

好那么更多的我就不再演示了

play06:35

如果你有其他的应用

play06:36

或者说其他的程序啊

play06:38

插件想要调用这个Gemini啊

play06:41

就你在这里来创建一个这个API key

play06:46

就OK了好

play06:48

那么有的朋友呢说哎

play06:50

我不使用这些也没关系啊

play06:52

这些东西你都是可以删掉的啊

play06:54

删掉就OK了

play06:56

那么说

play06:57

如果你没有这个调用API的需求

play06:59

你想直接使用这个Gemini也是可以的

play07:03

我们直接在这里点击这个create new

play07:06

然后点击这里

play07:09

好那么在这里呢

play07:09

我们就可以直接使用了

play07:12

在这里呢

play07:12

它是有两个模型可以选择的

play07:14

看一下Gemini Pro

play07:17

还有Gemini Pro vision

play07:19

Gemini Pro呢

play07:20

主要是用来处理一些

play07:21

文本类的一些任务的

play07:24

那么Gemini Pro vision

play07:25

它是来处理一些啊图像类的任务的

play07:29

我们先来体验一下这个Gemini Pro啊

play07:31

点击它

play07:32

然后呢你就可以在这里直接输入

play07:35

比如说我们来输入

play07:36

请介绍自己能做什么

play07:41

哎然后呢

play07:43

我们点击下面的这个run

play07:51

好看一下他的介绍

play07:53

我是一个大型语言模型

play07:56

经过谷歌训练可以执行各种语言任务

play07:59

我可以生成文本

play08:01

翻译语言

play08:01

回答问题

play08:02

撰写故事

play08:03

甚至写诗

play08:05

我还可以提供信息

play08:06

并帮助你完成各种任务

play08:09

以下呢就是我擅长的一些事情啊

play08:12

大家感兴趣的话可以了解一下啊

play08:15

那么这个呢

play08:16

你就可以继续的和他对话

play08:19

然后呢我们可以再提出一个问题啊

play08:21

那么在这里呢

play08:22

大家就根据自己的想象了

play08:25

他既然是一个人工智能大模型

play08:28

那么你就根据自己的需求

play08:29

想象来提问题了

play08:31

我就再随便提一个问题啊

play08:32

给大家演示一下啊

play08:34

比如说我问一下你和ChatGPT谁更强大

play08:44

play08:45

那么我们点击这个run

play08:55

play08:56

那么这个Gemini Pro的这个演示呢

play08:59

大家就了解到这里啊

play09:01

那更多玩法

play09:02

你自己想提更多的问题啊

play09:05

根据自己的想象力

play09:06

你天马行空的去提问题

play09:08

或让他帮你去做一些内容都是OK的

play09:11

那么下面呢

play09:11

我们再来啊

play09:13

使用这个Gemini pro vision来体验一下

play09:17

好我们选择这个Gemini pro vision

play09:21

然后呢

play09:21

我们可以把刚才的这些内容给它删掉

play09:23

可以给它删掉

play09:25

好现在呢

play09:26

大家看一下

play09:26

确认一下

play09:27

我们的模型选择的是Gemini pro vision

play09:30

好那现在

play09:31

我们就可以通过Gemini pro vision

play09:33

来进行图像的处理了

play09:36

首先呢我们来点击这里啊

play09:39

大家可以看到这里呢

play09:40

是我当前Google云盘里面的一些图片啊

play09:44

你可以选择你Google云盘里面的图片

play09:47

或者点击这里来查看全部的图片

play09:50

下面这些呢

play09:51

是他给的一些示例的图片

play09:53

那我们就用他示例的图片来测试一下

play09:56

我们随便来选择一张啊

play09:57

比如说我们来选择这个

play09:59

然后点击右下角的添加

play10:01

那么我们来问他图片中是什么

play10:06

OK然后我们点击

play10:12

可以看到它识别到图片中是一只猫啊

play10:16

这个识别没有问题

play10:17

那么如果你觉得它识别的对

play10:19

可以给它打一个对号啊

play10:21

也是帮助他们提升这个产品

play10:24

那么我们再测试一下啊

play10:26

比如说我们再找一张照片

play10:29

好我们找这个好

play10:32

点击右下角的添加

play10:34

然后呢我们来给他说啊

play10:37

请根据图片帮我做一首诗

play10:43

好那么我们来测试一下

play10:52

好我们可以看到他根据这个图片

play10:55

帮我们做了一首名为沙漠的一首诗

play11:01

内容还是挺多的啊

play11:03

那更多的玩法呢

play11:05

你可以自己去探索

play11:07

天马行空的去探索

play11:08

那如果说你要上传自己的图片呢

play11:11

你点击这里

play11:12

然后点击这个upload

play11:15

然后点击这里

play11:16

就可以上传你自己本地的一些图片

play11:20

来进行图像的处理了

play11:23

OK那么以上呢

play11:24

就是我们今天给大家分享的这个Gemini

play11:28

它的API的这个获取和使用

play11:31

以及呢你想直接使用就在这里来使

play11:34

用啊那以上呢

play11:36

就是我们今天分享的全部内容了

play11:38

如果说你喜欢我的分享

play11:40

别忘了点赞评论订阅我的频道

play11:42

那么我们下期更有意思的视频再见