Is Elon’s Grok 3 the new AI king?

Fireship

18 Feb 202504:05

Summary

TLDR本视频介绍了全新发布的深度思维大语言模型——Grock 3，它不仅超越现有的基准测试，还成为LM Marina排行榜的第一名。该模型具有强大的生成能力，能够生成许多被其他模型阻止的内容，甚至在政治正确方面非常直言不讳。Grock 3的独特之处在于其背后使用了Twitter和XAI的数据，并通过全球最大的AI超级计算机之一——Memphis的Colossus计算机进行训练。此外，预计Super Gro将推出，并以更具竞争力的定价挑战市场。尽管面临一些争议，Grock 3在数学、科学和编程等领域展现出了强大的实力。

Takeaways

😀 Grock 3 是一款新发布的大型语言模型，打破了现有的基准，登上了 LM Marina 排行榜的榜首。
😀 Grock 3 不仅智能，且几乎不受审查，能够生成许多在多个国家/地区被认为是非法的内容。
😀 Grock 3 配备了深度思考模式，类似于 Deep C Car 1，还可以进行文本到视频的生成，并将推出一个付费订阅版 Super Grock。
😀 Grock 3 使用 Twitter 和 XAI 的数据流来优化，旨在最大化追求真理，即使这可能会牺牲政治正确性。
😀 与其他语言模型相比，Grock 3 的独特之处在于它能够生成令人震惊且带有强烈偏见的内容，某些国家发布此类内容可能会面临监禁。
😀 当前，Grock 3 在多个基准测试中领先，超越了 Gemini、Claude、Deep Seek 和 GPT-4 等其他模型，特别是在数学、科学和编程领域。
😀 然而，Grock 3 并未在某些测试（如 Open AI 03 和 Codeforces）中表现出色，这可能意味着某些基准数据存在偏差。
😀 Grock 3 的训练是在位于田纳西州孟菲斯的 Colossus 超级计算机上进行的，该计算机目前被认为是世界上最大的 AI 超级计算机。
😀 Colossus 超级计算机由超过 20 万块 Nvidia H100 GPU 组成，并计划扩展到 100 万个 GPU，以支持未来的 Super Gro。
😀 Grock 3 预计将以每月 30 美元的价格推出 Super Gro，作为对比，ChatGPT Pro 的费用为每月 200 美元，具有更具竞争力的定价。
😀 Grock 3 的推出进一步推动了 AI 竞争，尤其是在开发者和代码质量方面，许多开发者表示即使使用最先进的工具，他们的代码质量却变得更差。

Q & A

Gro模型是什么，为什么它如此特别？
-Gro模型是一种最新的深度学习大语言模型（LLM），因其突破性表现而获得广泛关注。它不仅能够处理复杂的思维任务，还能生成违反很多国家法律的内容，尤其因其较少的审查而著名。Gro模型在Elon Musk的支持下，通过Twitter和XAI的数据，进行针对性优化，以实现最大程度的真理追求，即使这意味着牺牲政治正确性。
Gro3与其他LLM相比，有什么不同？
-Gro3具有一个重要特征，即它几乎不受审查，可以生成在许多国家被认为是非法的内容。它还包括一个名为'深度思考模式'的功能，类似于Deep C Car 1。此外，它在技术上支持文本到视频的生成，并且计划推出名为Super Gro的付费订阅功能，进一步提升模型能力。
Gro模型的训练数据来源是什么？
-Gro模型的训练数据源包括Twitter和XAI的实时数据流，这使得它能以独特的方式进行优化，旨在提供不受政治正确性约束的‘真理’，即使这些信息在某些国家是违法的。
Gro3目前的性能如何，是否真的是世界上最强的LLM？
-Gro3目前在LM Marina排行榜中名列第一，这意味着它在某些评测中表现优异，特别是在数学、科学和编码方面超越了包括Gemini、Claude和GPT-4在内的其他LLM。然而，当OpenAI的GPT-3被加入比较时，Gro3的表现有所不同，这表明不同的基准测试会影响模型的评价。
Gro的训练是如何进行的？
-Gro模型是在位于孟菲斯的Colossus超级计算机上进行训练的，该超级计算机是目前已知世界上最大的AI超级计算机。它由超过200,000个Nvidia H100 GPU构成，且计划扩展至100万个GPU，使用如此庞大的计算资源，以支撑未来更强大的模型，如Super Gro的推出。
Super Gro将会是什么样的功能，并且预计会如何定价？
-Super Gro是Gro模型的增强版，预计将在未来推出，具备更强大的功能，并且会通过订阅服务提供。其订阅价格预计为每月30美元，相比之下，比OpenAI的ChatGPT Pro（每月200美元）具有更具竞争力的定价。
Gro的表现如何与其他LLM进行比较？
-Gro在一些性能基准测试中表现突出，尤其在数学、科学和编程方面超过了其他主流的LLM如Gemini、Claude和GPT-4。尽管如此，这些基准测试并不总能全面反映模型的全部能力，尤其在特定应用场景下，Gro的表现可能与其他先进模型相当。
Gro为何会在一些国家存在法律风险？
-Gro的设计理念是最大程度地追求‘真理’，即使这意味着生成带有攻击性、违法或者不符合社会规范的内容。由于其较少的审查，Gro能够生成在一些国家可能会被视为违法的内容，尤其是涉及到种族、性别或其他敏感话题的内容，这使得它在这些国家面临法律风险。
Gro模型如何影响当前AI行业竞争格局？
-Gro模型的出现打破了AI领域的竞争格局，特别是通过其不受审查和突破性的技术。它不仅挑战了OpenAI的GPT系列，也在定价和功能方面给其他竞争对手带来了压力。Elon Musk与OpenAI的竞争，以及Mark Zuckerberg因数据盗用问题的失误，都让AI行业的竞争变得更加激烈。
Gro与其他AI模型如Claude和Gemini相比，是否有优势？
-Gro在一些特定领域，如数学、科学和编程方面，已经超越了Claude和Gemini等其他AI模型。然而，Gro的优势也受到它的训练数据和目标定位的影响，在某些应用场景下，它可能并不总是最佳选择。通过对比不同的基准测试，可以看到Gro在部分方面表现优异，但整体性能的评估仍然依赖于具体应用和需求。