GPT-4o 사용법 총정리 - 무료 사용량, 신기능 활용

tilnote - AI, 테크
19 May 202412:18

Summary

TLDRThe video script introduces GPT-4o, a state-of-the-art AI model available at chatgpt.com. It highlights the model's capabilities, including web browsing, image recognition, and data analysis using Python. The script explains the usage limits for free and paid users, with GPT-4o leading in user rankings as of May 13, 2024. It also mentions upcoming features like improved voice mode and image generation, emphasizing the model's innovative and user-friendly aspects. The summary encourages users to make the most of the free version while acknowledging the strategic limitations to promote paid subscriptions.

Takeaways

  • 🌐 The GPT-4o model can be accessed at chatgpt.com, which is the new main domain for usage.
  • 🆓 For free users, the choice is 'chatgpt', while 'GPT-4o' is selected for paid users.
  • 🏆 GPT-4o is recognized as the top model as of May 13, 2024, according to the lmsys chatbot arena leaderboard.
  • 📈 Understanding the usage quota is crucial; free users can use about 16 prompts in 3 hours based on OpenAI Help Center standards.
  • 🔧 Usage quotas can be adjusted based on traffic, and certain actions like image generation may consume the quota faster.
  • 🌐 A key feature is web browsing, allowing GPT-4o to search the web and answer questions based on the content found.
  • 👀 The vision feature allows image recognition; users can upload images and ask questions about the content.
  • 📸 Image capture and questioning is a frequently used feature, with shortcuts provided for Windows and MacBook to capture screenshots.
  • 🔍 Enhanced OCR capabilities are now available for Korean (한글), which was not possible in previous versions.
  • 🔎 Web search functionality allows GPT-4o to provide more accurate answers by searching the web for information.
  • 📊 Data analysis is facilitated through a Python execution environment, enabling analysis of various file types like CSV and Excel.
  • 📚 File upload support includes PDFs, text files, spreadsheets, presentations, and documents, with a limit of 20 files and a total size of 512MB.
  • 🎙️ The improved voice mode, which is more conversational and natural, is still in development and will be available to PLUS users first.
  • 🖌️ An image generation model is under development, with a demo showing capabilities like handwriting, which was not possible in previous versions.

Q & A

  • What is the new main domain for using GPT-4o?

    -The new main domain for using GPT-4o is chatgpt.com.

  • How can I start using GPT-4o after accessing the website?

    -Once you access chatgpt.com, a pop-up window will appear, and you should click on 'Try Now' to start using GPT-4o.

  • What is the difference between the free and paid versions of GPT-4o?

    -The free version allows you to choose 'chatgpt', while the paid version offers the selection of 'GPT-4o'.

  • What is the lmsys chatbot arena leaderboard?

    -The lmsys chatbot arena leaderboard is a platform where users can view the ranking of large language models (LLMs) based on their subjective evaluations.

  • As of May 13, 2024, which version of GPT-4o is ranked first on the lmsys leaderboard?

    -The version of GPT-4o as of May 13, 2024, is ranked first on the lmsys leaderboard.

  • What is the estimated number of uses for free users in a 3-hour period according to the OpenAI Help Center's standards?

    -Free users can estimate to use the service about 16 times in a 3-hour period, which is 1/5 of the usage allowed for Plus users.

  • How does the usage of GPT-4o vary with different tasks?

    -Usage can vary depending on the task; for example, generating images may consume usage more quickly than other tasks.

  • What is one of the main features of GPT-4o that allows users to interact with web content?

    -One of the main features is web browsing, where users can ask questions about the content of a provided link, and GPT-4o can summarize and verify the information.

  • How does GPT-4o's vision feature work?

    -The vision feature allows users to upload image files through the chat window and ask questions about the image content, including text recognition within the images.

  • What keyboard shortcuts can be used to capture screenshots on Windows and MacBook for image recognition?

    -On Windows, you can use Shift-Window-S to capture a screenshot, and on a MacBook, you can use Command-Shift-4 for partial screen capture.

  • What is the new OCR capability introduced in GPT-4o that was not available in previous versions?

    -The new OCR capability in GPT-4o allows for Korean (Hangul) text recognition, which was not available in the previous versions.

  • How can users perform web searches using GPT-4o to get more accurate answers?

    -Users can use the web search feature to have GPT-4o search the web and base its answers on the information found, reducing hallucination and increasing accuracy.

  • What is the data analysis feature in GPT-4o and how is it utilized?

    -The data analysis feature allows users to execute Python code and analyze data, such as loading and analyzing CSV files, using various Python modules within the chat environment.

  • What file types does GPT-4o support for upload and analysis?

    -GPT-4o supports a variety of file types for upload, including PDFs, text files, spreadsheets, presentations, and documents.

  • What is the current status of GPTs usage for free users according to the video script?

    -As of the video script, free users are expected to have access to GPTs, but it seems that this feature has not yet been implemented, as it currently requires ChatGPT PLUS.

  • What improvements are expected in the enhanced voice mode of GPT-4o?

    -The enhanced voice mode is expected to provide a more natural conversation experience, similar to the movie 'Her'. It is currently not released but will be available first to PLUS users.

  • What is the current status of the image generation model in GPT-4o?

    -The image generation model is still in development, with only demo images currently available. It is expected to offer features like handwriting recognition, which was not possible in the previous version.

  • What is the file upload limit when using GPT-4o's data analysis feature?

    -The file upload limit for the data analysis feature is not explicitly stated, but it is mentioned that there is a file upload cap, which can be reached quickly during extensive use.

  • What is the maximum number of files and total size that can be uploaded at once in GPT-4o?

    -Users can upload up to 20 files at once, with a combined size limit of 512MB. For text and documents, one token represents 200,000 tokens, and images can be uploaded up to 20MB each.

  • What is the reaction time of the current voice mode in GPT-4o?

    -The current voice mode in GPT-4o has a reaction time of about 2-3 seconds.

  • What is the strategic reason behind offering a free version of GPT-4o with limited usage?

    -Offering a free version with limited usage could be a strategic move to attract more users and potentially convert them into paying customers, while also managing resource allocation.

Outlines

00:00

🤖 Introduction to GPT-4o Usage and Features

The script introduces GPT-4o, a new model available for use at chatgpt.com, replacing the main domain. It explains the selection process between free and paid versions, with GPT-4o being the premium choice. The script highlights GPT-4o's top ranking on the lmsys chatbot arena leaderboard as of May 13, 2024. It discusses the importance of understanding usage limits, which are set based on the OpenAI Help Center's guidelines, with Plus users receiving 80 uses over 3 hours compared to free users' estimated 16 uses. The script also covers the increased consumption of usage when generating images and mentions that usage can be adjusted based on traffic. It provides a walkthrough of GPT-4o's web browsing and vision features, demonstrating how users can ask questions about web content and images, and how the model can analyze images and text within them, including OCR capabilities for Korean text.

05:04

🔍 Enhanced Features of GPT-4o: Web Search and Data Analysis

This paragraph delves into the enhanced features of GPT-4o, such as the ability to perform web searches to provide more accurate answers and reduce hallucination. It also introduces the model's data analysis capabilities, which allow for Python code execution and analysis of various file types like CSV and Excel. The script mentions a limitation on file upload capacity, which was reached during the demonstration, indicating that there is a cap on usage. It also covers the model's ability to analyze PDFs and other documents, highlighting the support for multiple file uploads up to 512MB and the analysis of documents up to 2 million tokens or images up to 20MB. The paragraph concludes with a mention of GPTs, which are expected to be available for free users but currently require ChatGPT PLUS.

10:05

🎙️ Upcoming Features and Strategic Considerations for GPT-4o

The final paragraph discusses upcoming features for GPT-4o, including an enhanced voice mode that promises more natural conversations, similar to the movie 'Her'. It mentions that this feature is still pre-release and will initially be available to PLUS users. The script also addresses the current voice mode's reaction time and hints at improvements with the new model. Additionally, it touches on the image generation model, which is still in development with only demo images available, showcasing capabilities like handwriting recognition that were not possible in previous versions. The paragraph concludes by reflecting on the strategic decision to offer a high-performance model like GPT-4o for free, suggesting it as a bold move to attract more premium users, while acknowledging potential resource constraints.

Mindmap

Keywords

💡GPT-4o

GPT-4o refers to an advanced version of a language model AI, likely an iteration of OpenAI's GPT (Generative Pre-trained Transformer) series. In the video's context, GPT-4o represents a state-of-the-art model that has been released and is available for use on chatgpt.com. It is highlighted as the top model as of May 13, 2024, according to the lmsys chatbot arena leaderboard, indicating its superior performance compared to other AI models.

💡chatgpt.com

chatgpt.com is the website mentioned in the script where users can access and use the GPT-4o model. It serves as the main domain for interacting with the AI, and the script suggests that it has become the new address for accessing the service, indicating a shift from any previous URLs to this one.

💡Free vs. Paid

The script discusses the options available to users when choosing to use the AI service: a free version and a paid version named GPT-4o. The free version, 'chatgpt', is suggested for users who do not wish to pay, while the paid version offers additional features and capabilities, presumably including access to the advanced GPT-4o model.

💡Usage Limits

Usage limits refer to the constraints on the number of queries or interactions a user can have with the AI within a certain timeframe. In the video, it is mentioned that for free users, the limit is approximately 16 queries in 3 hours, compared to 80 for Plus users, indicating a tiered system where more usage is allowed for those who pay for the service.

💡Web Browsing

Web browsing is one of the features of the GPT-4o model that allows it to search the internet for information to answer user queries. The script illustrates this by showing how the AI can provide a summary of content from a given link, demonstrating its ability to integrate online information into its responses.

💡Vision Features

Vision features pertain to the AI's capability to process and analyze images. The script describes how users can upload image files and ask questions about their content. The AI is shown to be able to analyze the images, including text recognition within them, which is a significant upgrade from previous versions that did not support Korean language OCR (Optical Character Recognition).

💡Data Analysis

Data analysis is a functionality that allows the AI to process and analyze data, often leveraging Python's execution environment. The script gives an example of analyzing a CSV file containing information about superheroes, demonstrating how the AI can load and process data to provide insights, such as generating bar graphs to visualize hero tendencies.

💡File Upload Limit

The file upload limit is a restriction on the number and size of files that users can upload for the AI to process. The script mentions that there is a limit to the file upload, which the presenter encountered while making the video, suggesting that users need to be mindful of these constraints when interacting with the AI.

💡GPTs

GPTs likely refers to a set of advanced features or models that are part of the GPT family. In the script, it is mentioned that these features are not yet available to free users but are expected to be accessible in the future, indicating ongoing development and potential future enhancements to the service.

💡Voice Mode

Voice mode is a feature that allows for interactive voice communication with the AI, aiming to provide a more natural conversational experience. The script mentions an enhanced voice mode that is yet to be released, which will be initially available to Plus users, suggesting an improvement over the current model with a more immediate and fluid interaction.

💡Image Generation

Image generation refers to the AI's ability to create images, which is mentioned as a work in progress. The script notes that a demo image has been released, showcasing capabilities such as handwriting, which was not possible in previous versions. This indicates an expansion of the AI's creative abilities and a move towards more sophisticated visual output.

Highlights

GPT-4o can be accessed at chatgpt.com, which is the new main domain.

Users can choose between free and paid versions, with GPT-4o being the premium option.

GPT-4o is currently ranked first on the lmsys chatbot arena leaderboard as of May 13, 2024.

Usage limits are based on the OpenAI Help Center, with Plus users getting 80 uses in 3 hours compared to free users' 16.

Usage rates can be adjusted based on traffic, and certain actions like image generation consume usage faster.

Enterprise versions like Team Workspaces offer higher usage limits.

A key feature is web browsing, allowing GPT-4o to search the web and answer questions based on content.

Vision capabilities enable image recognition, where users can upload images and ask questions about them.

GPT-4o can analyze text within images, including OCR for Korean, a feature not available in previous versions.

Users can capture images and paste them into GPT-4o for analysis, with shortcuts provided for Windows and Mac.

Web search functionality allows GPT-4o to provide more accurate answers by searching the internet for information.

Source verification is enhanced, with the ability to click through to the original source of information.

Data analysis is possible through Python execution, useful for tasks like calculating and analyzing datasets.

File upload limits have been reached, indicating a cap on the amount of data that can be uploaded for analysis.

Supported file types for upload include PDFs, text files, spreadsheets, presentations, and documents.

GPTs, a feature allowing users to use GPT models, is mentioned but not yet available for free users.

An enhanced voice mode is under development, promising more natural conversations similar to the movie 'Her'.

Image generation capabilities are in the works, with a demo showing handwriting recognition not possible in previous versions.

GPT-4o's performance is considered groundbreaking, despite the free version having some limitations to encourage paid upgrades.

Transcripts

play00:00

GPT-4o를 어떻게 사용하는지 한번 간단하게 알아보도록 하겠습니다

play00:06

일단은 주소는 chatgpt.com 에서 사용을 할 수가 있습니다

play00:11

이제 메인 도메인을 chatgpt.com 으로 이제 바꿨죠

play00:15

이렇게 팝업창이 나오면은 지금 사용해보기를 클릭을 하면 됩니다

play00:21

그래서 그 다음은 이제 선택하기 인데요

play00:24

일단 무료의 경우에는 chatgpt 를 선택을 하면 됩니다

play00:29

그리고 유료의 경우에는 GPT-4o를 선택을 하면 되죠

play00:34

그래서 지금 이제 GPT-4가 있는데 지금 가장 뛰어난 모델은 GPT-4o 입니다

play00:40

그래서 이제 lmsys chatbot arena 리더보드 라는게 있는데요

play00:44

여기에서 사용자들이 주관적으로 평가한 llm 의 순위를 볼 수가 있습니다

play00:50

그래서 지금 보면은 GPT-4o 2024년 5월 13일 버전이 1위로 올라간 것을 볼 수가 있죠

play00:57

네 그래서 가장 먼저

play00:59

이해해야 되는 것은 사용량 인데요

play01:02

이 사용량은 이제 오픈 AI 헬프센터 기준으로 플러스 사용자는 3시간에 80개를 사용할 수가 있습니다

play01:10

여기서 무료의 경우에는 5분의 1이기 때문에 3시간에 한 16개 정도로 추정이 됩니다

play01:18

사용량은 트래픽에 따라서 조정이 될 수 있다라고 하거든요

play01:23

그리고 이 16개 같은 경우도 예를 들어 달리 이미지를 생성을 한다거나

play01:29

이러면 조금 더 빨리 소모가 되는 경향이 있습니다

play01:33

그래서 이거를 이해를 하고 사용해 주시면 됩니다

play01:36

팀 워크스페이스나 이제 엔터프라이즈 같은 경우에는 더 많은 사용량을 가진다 라고 하거든요

play01:43

그래서 우리가 이제 무료 버전으로 한번 사용을 한번 해보겠습니다

play01:47

대표 기능 중에 하나인 웹 브라우징을 한번 사용을 한번 해보겠습니다

play01:52

링크를 주고 이 링크의 내용에 대해서 한번 질문을 한번 해보겠습니다

play01:59

이렇게 웹을 검색을 해서 이 안에 있는 내용을 간략하게 이야기해 주는 것을 알 수가 있죠

play02:06

이제 출처도 확인을 해 볼 수가 있구요

play02:11

그래서 이렇게 전형적으로 웹을 검색을 한 다음에 대답을 해주는 기능이 탑재가 된 것을 확인할 수가 있습니다

play02:19

그리고 두 번째는 비전 기능입니다

play02:22

비전은 이미지 인식 기능이죠

play02:25

채팅창에서 파일 클립 아이콘을 눌러서

play02:29

이미지 파일을 올리고 질문할 수 있습니다

play02:32

그래서 이렇게 이미지를 올리고 이미지 내용에 대해서 질문을 한번 해보겠습니다

play02:41

네 이렇게 했을 때 이미지의 내용을 분석을 해 주고

play02:45

그 안에 있는 글씨까지 같이 분석을 해 주는 것을 확인할 수가 있죠

play02:52

그래서 이미지를 이렇게 텍스트로 인식을 해 갖고

play02:56

이거를 바탕으로 이제 질문을 할 수 있게 됩니다

play02:59

이 이미지 기능을 활용할 때 정말 많이 사용하는 기능이

play03:04

이미지를 캡쳐한 후 질문을 하는 건데요

play03:07

윈도우 경우에는 Shift-Window-S를 누르면은 화면을 캡쳐할 수 있습니다

play03:15

이렇게 해서 사각형 캡쳐로 내용을 캡쳐해서

play03:24

이거를 ChatGPT에서 Ctrl-V를 눌러서

play03:28

붙여넣은 다음에 질문을 하면 됩니다

play03:31

맥북의 경우에는 Command-Shift-4로 부분 캡쳐를 할 수가 있죠

play03:38

표에 대해서 한번 질문을 해 보겠습니다

play03:47

이런 식으로 이미지의 내용을 분석을 해서 알려주는 것을 볼 수가 있죠

play03:52

그리고 이 이미지 인식 능력을 활용을 해서 한글 OCR을 할 수가 있는데요

play03:56

성능이 좋습니다

play03:58

예전 버전에서는 한글 OCR을 할 수가 없었는데

play04:01

이번 버전에서는 할 수 있게 되었습니다

play04:04

프롬프트는 그냥 다음 이미지 OCR 이렇게 입력하면 되거든요

play04:08

이런 식으로 이제 어느 정도 변형이 된 텍스트도 한글로 잘 번역을 해서

play04:14

인식을 하는 것을 볼 수가 있습니다

play04:16

프롬프트는 "다음 이미지 OCR" 또는 "다음 이미지에서 텍스트 추출"과 같이 입력을 하면 됩니다

play04:24

그 다음에는 웹 검색을 한번 사용해 보겠습니다

play04:27

웹 검색을 사용을 하면 모델 자체에서 대답을 하는 게 아니라

play04:32

웹을 검색해서 바탕으로 대답을 하게 되죠

play04:35

그래서 Hallucination을 줄이게 될 수 있고

play04:38

좀 더 정확한 대답을 얻게 됩니다

play04:41

예를 들어서 제가 ASR이라는 용어를 처음 접했고

play04:45

이거에 대해서 궁금한 상황이라고 한번 생각을 해 봅시다

play04:49

ASR은 Automatic Speech Recognition의 줄임말이거든요

play04:57

웹을 검색을 해서 한번 알아보겠습니다

play05:04

이런 식으로 사이트를 검색을 해서 이거를 바탕으로 대답을 해 주는 걸 알 수가 있죠

play05:11

여기 출처를 표시해 주는 기능도 많이 늘어난 기능이죠

play05:13

출처를 눌러서 한번 확인해 보겠습니다

play05:18

이런 식으로 출처도 확인할 수가 있습니다

play05:22

네 그리고 이제 웹을 검색할 수 있게 되면

play05:26

리서치 같은 것도 할 수 있게 되거든요

play05:30

예를 들면 크리에이티브 이코노미의 전망에 대해서

play05:33

웹 검색을 통해서 리서치를 하고

play05:36

관련 링크도 같이

play05:37

표시해달라고

play05:38

리서치 프롬프트를 한번 사용해 보겠습니다

play05:47

이런 식으로 사이트들을 조합을 해서

play05:49

리서치를 해서 브리핑을

play05:52

해주는 것을 볼 수가 있죠

play05:53

그 다음에 소개해 드릴 것은

play05:56

데이터 분석인데요

play05:57

이거는 사실 파이썬 실행

play06:00

환경을 실행시킬 수 있는

play06:02

기능입니다. 예를 들어서

play06:03

어떤 수학을 계산을 할 때

play06:05

파이썬을 통해서 돌리거나

play06:07

아니면 파일을

play06:09

파이썬으로 올려서 분석을 할 때

play06:11

편리합니다. 이 파이썬에서

play06:13

사용할 수 있는 모듈을 사용할 수가 있거든요

play06:15

그래서 다양한 분야에

play06:18

적용을 할 수가 있습니다

play06:20

그 중에서도 데이터 분석에서

play06:22

좀 많이 활용을 하기 때문에

play06:24

데이터 분석이라고 부르고 있습니다

play06:26

그래서 이 슈퍼히어로 데이터셋의 CSV 파일이 있는데

play06:31

이거를 통해서 한번 분석을 한번 해 보겠습니다

play06:34

csv 파일도 되고

play06:35

엑셀 파일도 됩니다

play06:37

파일 업로드 한도에 도달했다고 나오거든요

play06:42

그래서 지금 이 사용법 영상을 찍느라

play06:47

어느 정도 이제 업로드를 했더니

play06:49

금방 사용량 제한에 도달했네요

play06:52

그래서 이 파일 업로드 한도도 따로 있는 것 같습니다.

play06:56

지금 채팅은 되거든요

play06:58

그래서 데이터 분석 기능을 한번 사용해 보겠습니다

play07:05

네 이렇게 히어로 인포메이션 csv 파일을 올려봤고요

play07:12

여기에서 보시면은

play07:14

각 히어로의 어떤 특성들에 대해서

play07:17

정리를 해 놓은 파일입니다

play07:21

히어로의 성향도 있고요

play07:24

735개 정도 되는 데이터예요

play07:30

이걸 한번 분석을 한번 해 보겠습니다

play07:45

이런 식으로 파일을 읽어서 분석을 하는 걸 알 수가 있죠

play07:50

여기 보시면은 이렇게 파이썬 실행 환경을 실행을 시켜서

play07:56

이 파일을 로드를 해서 분석을 하는 거를 볼 수가 있습니다

play08:02

이거를 이제 그래프를 좀 활용을 해서

play08:04

정리를 한번 해 보겠습니다

play08:15

이런 식으로 히어로의 성향에 대해서

play08:19

이렇게 막대 그래프로 표현을 해 준 거를 볼 수가 있죠

play08:22

실행 환경을 보면은

play08:26

matplotlib 이라는 모듈을 임포트를 해서

play08:30

막대 그래프를 그린 거를 볼 수가 있습니다

play08:33

그래서 좀 유명한 파이썬 모듈들은 다 임포트를 해서

play08:37

사용할 수 있다라고 보면 되거든요

play08:39

다양하게 활용할 수가 있습니다

play08:43

네 그리고 이제 파일을 업로드하고 질문을 할 수가 있거든요

play08:48

올릴 수 있는 파일은 pdf, 텍스트 파일, 스프레드 시트, 프레젠테이션, 문서 등

play08:55

대부분의 파일을 지원을 합니다.

play08:57

그래서 저는 pdf를 올려서 한번 질문을 해 보겠습니다

play09:02

네 이런 식으로 pdf의 하이라이트를 정리해서 알려 달라고 했을 때

play09:07

이렇게 pdf를 분석을 해서 정리를 해 주는 걸 볼 수가 있죠

play09:12

그리고 여기를 보면은 관련 pdf도 표시를 해 주고요

play09:18

파일은 하나만 올릴 수 있는 게 아니고

play09:21

최대한 20개까지 업로드가 가능하거든요

play09:24

모든 파일을 합쳐 가지고 512MB까지 올릴 수가 있고요

play09:31

텍스트나 문서는 200만 토큰이 한 개이고

play09:35

이미지는 20MB까지 올릴 수가 있습니다

play09:39

네 그렇게 해서 이 파일 업로드까지 한번 알아봤습니다

play09:43

네 그리고 GPTs 사용하기 인데요

play09:47

이 무료 사용자는 이 GPTs를 사용할 수가 있거든요

play09:54

네 지금 이렇게 보면은

play09:55

아직 ChatGPT PLUS가 필요하다고 나오거든요

play09:57

그래서 아직 반영은 안 된 것 같고요

play10:00

발표를 했을 때는 무료 사용자가 사용할 수 있다

play10:05

이렇게 발표를 했었고

play10:06

만들기만 안 된다 이렇게 이야기가 됐었습니다

play10:10

그래서 적용이 되면 GPTs를 활용할 수가 있을 것으로 보입니다

play10:16

그리고 이제 가장 이슈가 됐던 향상된 보이스 모드이죠

play10:21

마치 영화의 Her처럼 자연스러운 대화가 되는

play10:25

보이스 모드인데요

play10:27

이 샘 알트만에 따르면 아직 출시 전이라고 합니다

play10:30

그리고 PLUS 유저들한테 먼저 제공이 된다고 합니다

play10:34

그래서 지금 기존의 보이스 모드는 2-3초 정도의 반응시간이 있거든요

play10:40

그래서 지금 사용하는 건 예전 모델이라고 보면 되고요

play10:46

최신 모델은 이렇게 왼쪽 하단에 카메라가 위치해 있습니다

play10:50

이렇게 카메라가 적용이 되면은 새로운 보이스 모드가

play10:55

사용이 된다라고 보시면 될 것 같습니다

play11:00

그리고 이미지 생성 모델도 아직 그 작업 중이라고 하거든요

play11:04

출시하려고 그래서 지금 이제 데모 이미지만 공개된 상황인데요

play11:10

이 데모 이미지에서 보면은

play11:12

필기체 글씨를 구현을 하는 걸 볼 수가 있죠

play11:16

그래서 기존의 달리3에서는 안 됐던 부분인데

play11:20

이런 부분들이 가능하게 됩니다

play11:23

그리고 성능 또한

play11:25

달리3보다 좋다 라고 지금 알려져 있거든요

play11:28

그래서 곧 공개가 되면은 확인할 수가 있을 것 같습니다

play11:32

네 이렇게 해서 여기까지 GPT-4o에 대해서 알아봤고요

play11:38

물론 무료 사용량이 있어서 조금 불편한 것은 사실입니다

play11:44

근데 이것도 어느 정도 유료 사용자를 늘리기 위한

play11:47

전략적인 부분도 좀 있지 않나 싶어요

play11:50

물론 자원적인 것 때문에 어쩔 수 없는 선택인 것도 있지만요

play11:55

그럼에도 불구하고

play11:56

이렇게 좋은 성능의 모델을 무료로 공개했다라는 거는

play12:01

굉장히 파격적인 선택이라고 생각이 됩니다

play12:05

그래서 우리가 이거를 잘 활용을 했으면 좋겠습니다

play12:10

감사합니다

Rate This

5.0 / 5 (0 votes)

Related Tags
GPT-4oWeb BrowsingImage RecognitionData AnalysisVoice ModeAI FeaturesChatbot ArenaFile UploadPython CodingOCR Technology