谷歌最强AI模型Gemini完全免费使用,比GPT-4还强?随意创建API key使用,文本图像任务轻松处理

向北
23 Dec 202312:06

Summary

TLDRThis video introduces Google's new AI model Gemini and demonstrates how to access and use the free Gemini Pro version. It highlights Gemini's capabilities for text and image inference, and provides instructions on obtaining an API key to integrate Gemini into other apps as well as testing it directly in the Google AI Studio.

Takeaways

  • Gemini is Google's latest AI model positioned to compete with OpenAI's GPT-4.
  • Gemini Pro is the high-performance model available for free use by anyone.
  • Gemini Pro has a limit of 60 queries per minute.
  • An API key can be generated to integrate Gemini into other apps and services.
  • Gemini Pro handles text tasks while Gemini Pro Vision handles image tasks.
  • The Google AI Studio provides an interface to test Gemini Pro directly.
  • Gemini can generate text, translate languages, answer questions and even write poetry.
  • Gemini Pro Vision can recognize objects in images and generate text like poems based on image inputs.

Q & A

  • What is Gemini and how does it compare to other AI models?

    -Gemini is Google's latest AI model aiming to compete with OpenAI's GPT-4. It comes in three versions - Gemini Ultra, Gemini Pro, and Gemini Nano.

  • Is Gemini free to use for everyone?

    -The Gemini Pro version is free for anyone to use, with a limit of 60 queries per minute.

  • How can Gemini be integrated into other applications?

    -An API key can be generated to allow other apps and services to call the Gemini models.

  • What tasks can Gemini perform?

    -Gemini can generate text, translate text, answer questions, summarize content, and even write poetry and short stories.

  • Can Gemini understand images?

    -The Gemini Pro Vision model can recognize objects in images and generate text like poems based on the image content.

Outlines

00:00

介绍Gemini的免费使用方法

介绍了Google最新发布的AI大型语言模型Gemini,它定位于与OpenAI的GPT-4抗衡。Gemini目前有三个等级,Gemini Ultra、Gemini Pro和Gemini Nano,其中Gemini Pro是免费开放使用的。可以通过提供的网站链接使用Gemini Pro,也可以通过获取API密钥在其他应用中调用Gemini API。

05:03

演示获取Gemini API密钥的方法

演示了如何在Google AI Studio网站上获取Gemini的API密钥,并将密钥配置到翻译插件中,实现用Gemini提供翻译服务。说明了API密钥可以用于其他应用调用Gemini API,每个密钥有限定的每分钟查询次数。

10:07

演示Gemini Pro的使用

演示了直接在Google AI Studio网站上使用Gemini Pro进行问答的流程。可以与Gemini Pro进行自然语言对话,提出各种问题进行互动。还可以使用Gemini Pro Vision处理图像,进行图像识别、图像描述等功能。

Mindmap

Keywords

💡Google Gemini 模型

谷歌推出的最新的 AI 大模型,定位是与 OpenAI 的 GPT-4 抗衡。视频介绍了 Gemini 的三个版本:Ultra、Pro和 Nano。其中 Gemini Pro 当前是免费可用的。

💡API 密钥

用于访问 Gemini API 的一个独特密钥。视频演示了如何生成 API 密钥并将其用于其他应用程序或插件调用 Gemini 的方法。

Highlights

Google 最新发布的 AI 大模型 Gemini 的免费使用,被定位于和 OpenAI 的 GPT-4 所抗衡的产品

Gemini Pro 是性能最佳的模型,适用于各种文本和图像推理任务,最重要的是 Gemini Pro 是可以免费使用的

Gemini Pro 对每一个人都是免费的,可以看到 here free for everyone,每个人都可以免费使用

免费的 Gemini Pro 有每分钟 60 次的查询次数限制,对于大部分普通用户来说,完全够用

登录 Google 账号就可以使用 Gemini,点击 continue 就进入了 Google AI studio

获取 Gemini 的 API key 后,可以集成到第三方应用、程序、插件中调用 Gemini

也可以不使用 API 直接在 Google AI studio 中使用 Gemini,有 Gemini Pro 和 Gemini Pro vision 两个模型

Gemini Pro 可处理文本类任务, Gemini Pro vision 可处理图像类任务

Gemini Pro 可以生成文本、翻译语言、回答问题、撰写故事等

Gemini Pro vision 可以识别图像中的内容,并根据图像生成文本

Gemini Pro vision 可以上传本地图片或选择 Google 云端图片进行处理

可以通过提问和 Gemini 进行自然对话,探索其功能

可以给 Gemini 的回复打分,帮助提升产品性能

Gemini 是 Google 最新推出的强大 AI 模型,提供免费使用,值得关注

Gemini 被视为可以与 OpenAI 的 GPT-4 抗衡,代表了业界最 advanced 的 AI 技术

Transcripts

play00:00

大家好

play00:01

今天我们来和大家分享

play00:03

Google最新发布的AI大模型

play00:05

Gemini的免费使用

play00:07

它是被定位于

play00:09

和OpenAI的GPT-4所抗衡的产品

play00:13

首先呢我们可以通过这个

play00:19

那么这个链接呢

play00:20

我会贴到本期影片的下方

play00:23

我们可以看到这里的英文啊

play00:26

build with Gemini

play00:28

使用Gemini来构建

play00:30

我们可以体验Google最大最强的AI模型

play00:35

啊如果说

play00:36

你觉得这个英文用起来不方便的话

play00:38

你可以用你浏览器上面的

play00:40

这个翻译插件

play00:42

把它翻译成中文啊

play00:43

你可能觉得它会方便一些

play00:46

好那么我们下面给大家先介绍一下

play00:48

我们再来使用

play00:50

那么Gemini目前它是有三个级别

play00:53

分别为Gemini Ultra

play00:55

还有Gemini Pro以及Gemini Nano

play00:58

首先Gemini Ultra呢它是

play01:01

适用于大规模

play01:03

高复杂度的文本和图像推理任务的

play01:06

最强大的模型

play01:08

那么它会将于2024年初推出

play01:13

那Gemini Pro呢

play01:14

是性能最佳的模型

play01:17

它具有适用于各种

play01:19

文本和图像推理任务

play01:21

功能

play01:22

最重要的是Gemini Pro呢

play01:24

它是可以免费使用的

play01:26

还有就是Gemini Nano

play01:29

那么这个

play01:30

它是专为设备上面的体验

play01:33

而构建的模型

play01:34

它可以离线使用

play01:36

比如说在Google手机上面的使用

play01:40

那么下面呢

play01:40

我们再来点击这个pricing(价格)来看一下

play01:45

好那么我们可以看到Gemini Pro呢

play01:48

它是对每一个人都是免费的

play01:51

可以看到这里free for everyone

play01:53

每个人都可以免费使用

play01:55

我们可以

play01:56

看到

play01:56

不管你是输入的内容还是输出的内容

play01:59

都是免费啊

play02:01

看到这里

play02:04

不管你是输入还是输出的这个数据呢

play02:07

也会被用于提升这个产品啊

play02:09

在这里呢你也是要知道的

play02:11

还有就是这个免费的Gemini Pro

play02:15

它是有每分钟60次的

play02:17

一个查询次数的限制的

play02:19

不过

play02:20

这个对于我们大部分的普通用户来说

play02:23

完全是够用的

play02:24

那么现在呢

play02:25

我们就要来使用

play02:34

登录你的Google账号就可以

play02:38

好登录进来以后呢

play02:39

我们给这里来打勾啊

play02:42

打勾然后呢

play02:43

下面这两项呢

play02:44

是用来接收Google AI的一些资讯啊

play02:47

就是他会给你发邮件

play02:49

如果你有这个接收资讯的需求

play02:51

你就打上勾啊

play02:53

或者是呢

play02:53

你不打勾也可以

play02:54

这个都无所谓的

play02:55

只要第一个打勾就可以

play02:57

然后呢我们点击continue啊

play03:02

好那么现在呢

play03:04

我们就进入到了这个Google AI studio啊

play03:07

那么现在呢

play03:08

我们有两种使用方法

play03:10

就是要么你使用这个Gemini的API啊

play03:14

就是你其他的一些第三方的程序啊

play03:16

或者应用想要调用这个Gemini

play03:19

或者说呢

play03:20

你直接在这里面来使用

play03:21

我们先来看第一种啊

play03:23

get api keyey点击它

play03:26

然后我们来点击这里的

play03:31

我们来点击啊

play03:32

这个时候呢

play03:33

我们稍等一下

play03:34

它会生成一个API keyey

play03:36

也就是一个密钥

play03:38

好那么现在呢

play03:39

我们这里就生成了一个keyey

play03:42

大家看一下

play03:42

这 就是一个密钥

play03:44

那么我们可以直接点击这个copy啊

play03:46

来把它复制

play03:47

你可以存到一个记事本里面

play03:49

或者存到一个文本里面啊

play03:51

如果说

play03:52

你把这个刚才那个小窗口关掉了

play03:55

想要再次找到这个keyey

play03:57

就点击这里

play03:58

大家看一下

play03:59

哎又出来了

play03:59

你拷贝他就可以

play04:02

那么我们在这里呢

play04:03

可以创建多个API keyey

play04:06

比如说我再去创建一个

play04:09

看这里呢

play04:09

又创建了一个啊

play04:11

然后我这里有两个了

play04:13

可以创建多个啊

play04:15

至于他能创建多少个

play04:16

我没有测试过

play04:18

你感兴趣的话可以自己去测试一下

play04:20

那么这个keyey我们怎么去用呢

play04:23

就是你比如说你其他的一些应用

play04:26

或者说程序啊

play04:27

插件要调用它

play04:29

你把这个keyey复制一下

play04:31

然后呢我在这里给大家举个例子啊

play04:34

比如说我现在用的一个翻译插件

play04:37

就是这个沉浸式翻译啊

play04:39

这个插件呢

play04:40

也推荐大家使用啊

play04:41

挺好用的

play04:42

那么我点击它

play04:44

然后呢我点击这个设置OK

play04:48

那么大家看一下

play04:49

我现在使用的这个

play04:51

沉浸式翻译的这个插件

play04:53

它使用的服务是谷歌翻译

play04:56

除了谷歌翻译呢

play04:57

它支持微软翻译啊

play04:59

也支持

play04:59

以及我们现在正在要使用的Gemini

play05:03

还有下面这么多的这个服务

play05:05

你都可以选择啊

play05:07

但是相应的服务呢

play05:08

都是需要调用他们的API的

play05:10

那现在呢

play05:11

我就点击这个Gemini

play05:13

然后呢

play05:14

我们把刚才复制的key给它粘贴到这里

play05:18

啊给它粘贴到这里

play05:20

OK那么粘贴到这里以后呢

play05:22

我们可以测试一下能不能用啊

play05:25

点击测试服务

play05:30

OK验证成功

play05:32

那么说明

play05:33

我们这个key是正常可以使用的

play05:35

那么后面

play05:35

比如说我们要使用这个沉浸式翻译

play05:38

来翻译一个网页

play05:39

它就调用的是这个Gemini的这个API啊

play05:42

就是这个应该给大家说的很清楚了

play05:44

那么我们来测试一下啊

play05:46

现在这个沉浸式翻译

play05:47

我来打开一个啊网站

play05:52

好那比如说我打开了这个TED啊

play05:55

这个很著名的一个演讲网站

play05:58

然后呢

play05:59

我们现在使用这个沉浸式翻译

play06:01

来把它这个网页的英文翻译一下

play06:03

来试一下啊

play06:05

好我们点击翻译OK

play06:06

大家看一下

play06:07

当前的翻译服务就使用的是Gemini

play06:09

好我们点击

play06:15

好大家看到啊

play06:16

那么现在这个英文的网站

play06:19

我们就翻译成了有中文的对照啊

play06:22

这样这个我们就已经成功的使用了

play06:25

这个Gemini这个服务了

play06:28

大家看一下

play06:29

这个英文都是有这个中文的对照的啊

play06:33

好那么更多的我就不再演示了

play06:35

如果你有其他的应用

play06:36

或者说其他的程序啊

play06:38

插件想要调用这个Gemini啊

play06:41

就你在这里来创建一个这个API key

play06:46

就OK了好

play06:48

那么有的朋友呢说哎

play06:50

我不使用这些也没关系啊

play06:52

这些东西你都是可以删掉的啊

play06:54

删掉就OK了

play06:56

那么说

play06:57

如果你没有这个调用API的需求

play06:59

你想直接使用这个Gemini也是可以的

play07:03

我们直接在这里点击这个create new

play07:06

然后点击这里

play07:09

好那么在这里呢

play07:09

我们就可以直接使用了

play07:12

在这里呢

play07:12

它是有两个模型可以选择的

play07:14

看一下Gemini Pro

play07:17

还有Gemini Pro vision

play07:19

Gemini Pro呢

play07:20

主要是用来处理一些

play07:21

文本类的一些任务的

play07:24

那么Gemini Pro vision

play07:25

它是来处理一些啊图像类的任务的

play07:29

我们先来体验一下这个Gemini Pro啊

play07:31

点击它

play07:32

然后呢你就可以在这里直接输入

play07:35

比如说我们来输入

play07:36

请介绍自己能做什么

play07:41

哎然后呢

play07:43

我们点击下面的这个run

play07:51

好看一下他的介绍

play07:53

我是一个大型语言模型

play07:56

经过谷歌训练可以执行各种语言任务

play07:59

我可以生成文本

play08:01

翻译语言

play08:01

回答问题

play08:02

撰写故事

play08:03

甚至写诗

play08:05

我还可以提供信息

play08:06

并帮助你完成各种任务

play08:09

以下呢就是我擅长的一些事情啊

play08:12

大家感兴趣的话可以了解一下啊

play08:15

那么这个呢

play08:16

你就可以继续的和他对话

play08:19

然后呢我们可以再提出一个问题啊

play08:21

那么在这里呢

play08:22

大家就根据自己的想象了

play08:25

他既然是一个人工智能大模型

play08:28

那么你就根据自己的需求

play08:29

想象来提问题了

play08:31

我就再随便提一个问题啊

play08:32

给大家演示一下啊

play08:34

比如说我问一下你和ChatGPT谁更强大

play08:44

play08:45

那么我们点击这个run

play08:55

play08:56

那么这个Gemini Pro的这个演示呢

play08:59

大家就了解到这里啊

play09:01

那更多玩法

play09:02

你自己想提更多的问题啊

play09:05

根据自己的想象力

play09:06

你天马行空的去提问题

play09:08

或让他帮你去做一些内容都是OK的

play09:11

那么下面呢

play09:11

我们再来啊

play09:13

使用这个Gemini pro vision来体验一下

play09:17

好我们选择这个Gemini pro vision

play09:21

然后呢

play09:21

我们可以把刚才的这些内容给它删掉

play09:23

可以给它删掉

play09:25

好现在呢

play09:26

大家看一下

play09:26

确认一下

play09:27

我们的模型选择的是Gemini pro vision

play09:30

好那现在

play09:31

我们就可以通过Gemini pro vision

play09:33

来进行图像的处理了

play09:36

首先呢我们来点击这里啊

play09:39

大家可以看到这里呢

play09:40

是我当前Google云盘里面的一些图片啊

play09:44

你可以选择你Google云盘里面的图片

play09:47

或者点击这里来查看全部的图片

play09:50

下面这些呢

play09:51

是他给的一些示例的图片

play09:53

那我们就用他示例的图片来测试一下

play09:56

我们随便来选择一张啊

play09:57

比如说我们来选择这个

play09:59

然后点击右下角的添加

play10:01

那么我们来问他图片中是什么

play10:06

OK然后我们点击

play10:12

可以看到它识别到图片中是一只猫啊

play10:16

这个识别没有问题

play10:17

那么如果你觉得它识别的对

play10:19

可以给它打一个对号啊

play10:21

也是帮助他们提升这个产品

play10:24

那么我们再测试一下啊

play10:26

比如说我们再找一张照片

play10:29

好我们找这个好

play10:32

点击右下角的添加

play10:34

然后呢我们来给他说啊

play10:37

请根据图片帮我做一首诗

play10:43

好那么我们来测试一下

play10:52

好我们可以看到他根据这个图片

play10:55

帮我们做了一首名为沙漠的一首诗

play11:01

内容还是挺多的啊

play11:03

那更多的玩法呢

play11:05

你可以自己去探索

play11:07

天马行空的去探索

play11:08

那如果说你要上传自己的图片呢

play11:11

你点击这里

play11:12

然后点击这个upload

play11:15

然后点击这里

play11:16

就可以上传你自己本地的一些图片

play11:20

来进行图像的处理了

play11:23

OK那么以上呢

play11:24

就是我们今天给大家分享的这个Gemini

play11:28

它的API的这个获取和使用

play11:31

以及呢你想直接使用就在这里来使

play11:34

用啊那以上呢

play11:36

就是我们今天分享的全部内容了

play11:38

如果说你喜欢我的分享

play11:40

别忘了点赞评论订阅我的频道

play11:42

那么我们下期更有意思的视频再见