谷歌最强AI模型Gemini完全免费使用,比GPT-4还强?随意创建API key使用,文本图像任务轻松处理
Summary
TLDR本期视频详细介绍了Google最新发布的人工智能大模型Gemini,包括Gemini的三个级别Ultra、Pro和Nano,其中Gemini Pro是免费开放使用的。视频详细讲解了如何获取Gemini Pro的API密钥,以及通过API或在官网直接使用Gemini Pro处理文本和图像的操作。Gemini Pro是一个强大的语言模型,可以回答各类问题、生成文本等,视频中通过多个示例展示了它的各项功能。视频内容丰富全面,值得关注Gemini的用户学习参考。
Takeaways
- 👨💻 介绍了Google最新发布的AI大模型Gemini的免费使用
- 🆕 Gemini定位于和OpenAI的GPT-4抗衡
- 🔑 Gemini有3个级别:Ultra、Pro和Nano
- 💲 Gemini Pro是免费的,每分钟限制60次查询
- 🔑 Gemini Pro需要获取API key才能被第三方应用调用
- 📷 Gemini Pro vision可处理图像任务
- 🤖 可以直接和Gemini对话提问
- 🖼️ Gemini可根据图片创作诗歌等
- ✔️ Gemini的回复可以给正反馈帮助改进
- 📲 Gemini可用于Google手机 App上使用
Q & A
Gemini与ChatGPT有何不同?
-Gemini是Google最新推出的AI模型,定位于和OpenAI的GPT-4竞争;而ChatGPT是OpenAI推出的对话式AI。两者均可进行对话式交互。
Gemini的三个级别有何区别?
-Gemini Ultra是最强大的模型,将于2024年初推出;Gemini Pro是免费的性能最优模型;Gemini Nano是专为设备上使用而设计的可以离线使用的模型。
如何获取Gemini的API key?
-在Gemini的官方网站上创建账号并登录后,可以点击“Get API key”来获取key,用于第三方应用调用Gemini。
Gemini Pro和Gemini Pro vision的区别是什么?
-Gemini Pro主要处理文本类任务,而Gemini Pro vision主要处理图像类任务。
Gemini的使用有什么限制吗?
-免费版的Gemini Pro有每分钟60次查询次数的限制。
如何上传图片给Gemini处理?
-在Gemini的界面上,可以点击“Upload”按钮上传本地图片,也可以直接选择Google云端的图片。
Gemini可以做什么事情?
-Gemini可以回答问题,生成文本,翻译语言,撰写故事,创作诗歌等,功能强大。
给Gemini的回复反馈有什么用?
-给Gemini回复正反馈可以帮助改进这个AI产品。
Gemini可以在哪些设备上使用?
-Gemini Nano版本可以在Google手机等设备上离线使用。
如何开始使用Gemini?
-可以直接在Gemini官网创建账号并登录后即可开始使用和交互。
Outlines
📺介绍Gemini的三个级别和要点
首先介绍Gemini有Gemini Ultra、Gemini Pro和Gemini Nano三个级别。Gemini Ultra是适用于大规模高复杂度任务的最强大模型,将于2024年初推出。Gemini Pro是性能最佳的模型,适用于各种文本和图像任务,最重要的是它是免费使用的。Gemini Nano是为设备优化的可以离线使用的模型。
💡演示获取Gemini API密钥和与插件集成使用
点击Get API key可以获取Gemini API密钥,可以复制密钥。以翻译插件为例,可以在设置中选择Gemini作为翻译服务,粘贴密钥进行验证,然后就可以通过该插件调用Gemini API了。这样其他应用也可以集成Gemini提供服务。
👨💻演示Gemini Pro和Gemini Pro Vision的直接使用
如果不需要调用API,也可以直接在AI Studio中使用Gemini。Gemini Pro可直接输入文本与其交互。Gemini Pro Vision可上传图片,生成描述或创作。可以根据自己需求与之交互,探索更多玩法。
Mindmap
Keywords
💡Gemini
💡API
💡语言模型
💡文本推理
💡图像推理
💡生成式模型
💡机器学习
💡语音识别
💡聊天机器人
💡自动翻译
Highlights
Google 最新推出了AI大模型 Gemini,与 OpenAI 的 GPT-4 相抗衡
Gemini 有 3 个模型级别:Ultra、Pro 和 Nano,目前 Pro 版本免费开放使用
Gemini Pro 每分钟限制请求数为 60 次,对普通用户足够
可以获取 Gemini API 密钥,用于第三方应用调用 Gemini 服务
可以直接在 Gemini Studio 网站界面使用 Gemini Pro 文本模型
Gemini Pro 视觉模型可以处理图像,如识别物体、根据图片生成文本
Gemini视觉模型支持上传自己的图片进行处理
Gemini Pro文本模型可以进行问答、对话等
Gemini Pro视觉模型可以根据图片创作诗歌等
可以让Gemini Pro帮助完成各种任务
Gemini Pro可以翻译语言、回答问题、生成文本等
Gemini模型可以提问探索与训练
欢迎订阅加入学习使用Gemini
Gemini值得期待,能力强大,免费使用
Gemini发布具有里程碑意义,代表了AI发展的新方向
Transcripts
大家好
今天我们来和大家分享
Google最新发布的AI大模型
Gemini的免费使用
它是被定位于
和OpenAI的GPT-4所抗衡的产品
首先呢我们可以通过这个
那么这个链接呢
我会贴到本期影片的下方
我们可以看到这里的英文啊
build with Gemini
使用Gemini来构建
我们可以体验Google最大最强的AI模型
啊如果说
你觉得这个英文用起来不方便的话
你可以用你浏览器上面的
这个翻译插件
把它翻译成中文啊
你可能觉得它会方便一些
好那么我们下面给大家先介绍一下
我们再来使用
那么Gemini目前它是有三个级别
分别为Gemini Ultra
还有Gemini Pro以及Gemini Nano
首先Gemini Ultra呢它是
适用于大规模
高复杂度的文本和图像推理任务的
最强大的模型
那么它会将于2024年初推出
那Gemini Pro呢
是性能最佳的模型
它具有适用于各种
文本和图像推理任务
功能
最重要的是Gemini Pro呢
它是可以免费使用的
还有就是Gemini Nano
那么这个
它是专为设备上面的体验
而构建的模型
它可以离线使用
比如说在Google手机上面的使用
那么下面呢
我们再来点击这个pricing(价格)来看一下
好那么我们可以看到Gemini Pro呢
它是对每一个人都是免费的
可以看到这里free for everyone
每个人都可以免费使用
我们可以
看到
不管你是输入的内容还是输出的内容
都是免费啊
看到这里
不管你是输入还是输出的这个数据呢
也会被用于提升这个产品啊
在这里呢你也是要知道的
还有就是这个免费的Gemini Pro
它是有每分钟60次的
一个查询次数的限制的
不过
这个对于我们大部分的普通用户来说
完全是够用的
那么现在呢
我们就要来使用
登录你的Google账号就可以
好登录进来以后呢
我们给这里来打勾啊
打勾然后呢
下面这两项呢
是用来接收Google AI的一些资讯啊
就是他会给你发邮件
如果你有这个接收资讯的需求
你就打上勾啊
或者是呢
你不打勾也可以
这个都无所谓的
只要第一个打勾就可以
然后呢我们点击continue啊
好那么现在呢
我们就进入到了这个Google AI studio啊
那么现在呢
我们有两种使用方法
就是要么你使用这个Gemini的API啊
就是你其他的一些第三方的程序啊
或者应用想要调用这个Gemini
或者说呢
你直接在这里面来使用
我们先来看第一种啊
get api keyey点击它
然后我们来点击这里的
我们来点击啊
这个时候呢
我们稍等一下
它会生成一个API keyey
也就是一个密钥
好那么现在呢
我们这里就生成了一个keyey
大家看一下
这 就是一个密钥
那么我们可以直接点击这个copy啊
来把它复制
你可以存到一个记事本里面
或者存到一个文本里面啊
如果说
你把这个刚才那个小窗口关掉了
想要再次找到这个keyey
就点击这里
大家看一下
哎又出来了
你拷贝他就可以
那么我们在这里呢
可以创建多个API keyey
比如说我再去创建一个
看这里呢
又创建了一个啊
然后我这里有两个了
可以创建多个啊
至于他能创建多少个
我没有测试过
你感兴趣的话可以自己去测试一下
那么这个keyey我们怎么去用呢
就是你比如说你其他的一些应用
或者说程序啊
插件要调用它
你把这个keyey复制一下
然后呢我在这里给大家举个例子啊
比如说我现在用的一个翻译插件
就是这个沉浸式翻译啊
这个插件呢
也推荐大家使用啊
挺好用的
那么我点击它
然后呢我点击这个设置OK
那么大家看一下
我现在使用的这个
沉浸式翻译的这个插件
它使用的服务是谷歌翻译
除了谷歌翻译呢
它支持微软翻译啊
也支持
以及我们现在正在要使用的Gemini
还有下面这么多的这个服务
你都可以选择啊
但是相应的服务呢
都是需要调用他们的API的
那现在呢
我就点击这个Gemini
然后呢
我们把刚才复制的key给它粘贴到这里
啊给它粘贴到这里
OK那么粘贴到这里以后呢
我们可以测试一下能不能用啊
点击测试服务
OK验证成功
那么说明
我们这个key是正常可以使用的
那么后面
比如说我们要使用这个沉浸式翻译
来翻译一个网页
它就调用的是这个Gemini的这个API啊
就是这个应该给大家说的很清楚了
那么我们来测试一下啊
现在这个沉浸式翻译
我来打开一个啊网站
好那比如说我打开了这个TED啊
这个很著名的一个演讲网站
然后呢
我们现在使用这个沉浸式翻译
来把它这个网页的英文翻译一下
来试一下啊
好我们点击翻译OK
大家看一下
当前的翻译服务就使用的是Gemini
好我们点击
好大家看到啊
那么现在这个英文的网站
我们就翻译成了有中文的对照啊
这样这个我们就已经成功的使用了
这个Gemini这个服务了
大家看一下
这个英文都是有这个中文的对照的啊
好那么更多的我就不再演示了
如果你有其他的应用
或者说其他的程序啊
插件想要调用这个Gemini啊
就你在这里来创建一个这个API key
就OK了好
那么有的朋友呢说哎
我不使用这些也没关系啊
这些东西你都是可以删掉的啊
删掉就OK了
那么说
如果你没有这个调用API的需求
你想直接使用这个Gemini也是可以的
我们直接在这里点击这个create new
然后点击这里
好那么在这里呢
我们就可以直接使用了
在这里呢
它是有两个模型可以选择的
看一下Gemini Pro
还有Gemini Pro vision
Gemini Pro呢
主要是用来处理一些
文本类的一些任务的
那么Gemini Pro vision
它是来处理一些啊图像类的任务的
我们先来体验一下这个Gemini Pro啊
点击它
然后呢你就可以在这里直接输入
比如说我们来输入
请介绍自己能做什么
哎然后呢
我们点击下面的这个run
好看一下他的介绍
我是一个大型语言模型
经过谷歌训练可以执行各种语言任务
我可以生成文本
翻译语言
回答问题
撰写故事
甚至写诗
我还可以提供信息
并帮助你完成各种任务
以下呢就是我擅长的一些事情啊
大家感兴趣的话可以了解一下啊
那么这个呢
你就可以继续的和他对话
然后呢我们可以再提出一个问题啊
那么在这里呢
大家就根据自己的想象了
他既然是一个人工智能大模型
那么你就根据自己的需求
想象来提问题了
我就再随便提一个问题啊
给大家演示一下啊
比如说我问一下你和ChatGPT谁更强大
好
那么我们点击这个run
好
那么这个Gemini Pro的这个演示呢
大家就了解到这里啊
那更多玩法
你自己想提更多的问题啊
根据自己的想象力
你天马行空的去提问题
或让他帮你去做一些内容都是OK的
那么下面呢
我们再来啊
使用这个Gemini pro vision来体验一下
好我们选择这个Gemini pro vision
然后呢
我们可以把刚才的这些内容给它删掉
可以给它删掉
好现在呢
大家看一下
确认一下
我们的模型选择的是Gemini pro vision
好那现在
我们就可以通过Gemini pro vision
来进行图像的处理了
首先呢我们来点击这里啊
大家可以看到这里呢
是我当前Google云盘里面的一些图片啊
你可以选择你Google云盘里面的图片
或者点击这里来查看全部的图片
下面这些呢
是他给的一些示例的图片
那我们就用他示例的图片来测试一下
我们随便来选择一张啊
比如说我们来选择这个
然后点击右下角的添加
那么我们来问他图片中是什么
OK然后我们点击
可以看到它识别到图片中是一只猫啊
这个识别没有问题
那么如果你觉得它识别的对
可以给它打一个对号啊
也是帮助他们提升这个产品
那么我们再测试一下啊
比如说我们再找一张照片
好我们找这个好
点击右下角的添加
然后呢我们来给他说啊
请根据图片帮我做一首诗
好那么我们来测试一下
好我们可以看到他根据这个图片
帮我们做了一首名为沙漠的一首诗
内容还是挺多的啊
那更多的玩法呢
你可以自己去探索
天马行空的去探索
那如果说你要上传自己的图片呢
你点击这里
然后点击这个upload
然后点击这里
就可以上传你自己本地的一些图片
来进行图像的处理了
OK那么以上呢
就是我们今天给大家分享的这个Gemini
它的API的这个获取和使用
以及呢你想直接使用就在这里来使
用啊那以上呢
就是我们今天分享的全部内容了
如果说你喜欢我的分享
别忘了点赞评论订阅我的频道
那么我们下期更有意思的视频再见
浏览更多相关视频
我用谷歌最强人工智能Gemini翻译网页 翻译质量达到人工翻译水平 中英文对照翻译显示比OpenAI ChatGPT更强 沉浸式翻译让我的英语水平突飞猛进看世界各地外文新闻杂志获取第一手的最新可靠资讯
震撼升级!Claude3横空出世,性能超越GPT4,抢先体验Claude3 Opus,谁是真正的AI王者?
Google IO 2024: The Gemini Era!
一键部署Google开源大模型Gemma,性能远超Mistral、LLama2 | 本地大模型部署,ollama助您轻松完成!
別浪費錢買用不到的 AI,Claude 3、ChatGPT 4、Google Gemini advanced 使用心得與選購指南|泛科學院
Googles GEMINI 1.5 Just Surprised EVERYONE! (GPT-4 Beaten Again) Finally RELEASED!
[ML News] Jamba, CMD-R+, and other new models (yes, I know this is like a week behind 🙃)
5.0 / 5 (0 votes)