2月18日中午, 马斯克旗下XAI举行Grok 3发布会,跨越100万东说念主在线不雅看,马斯克赞美其为“地球上最忠良的东说念主工智能”。
发布会演示夸耀,在数学推理、科学逻辑推理等多方面的性能阐扬上,Grok3和Grok-3 mini齐跨越或忘形Gemini、DeepSeek和ChatGPT等敌手,此外xAI还推出功能更为强劲的Grok3 Thinking推理形态。
除了设计才能方面,介意会力和创造力方面,Grok3阐扬相似出色。演示包括及时责罚复杂的物理问题,举例绘画行星际轨迹,构想视频游戏......
更惊喜的是,马斯克露出,Grok-3最好体验“大致一周之后”,语音交互功能还在劝诱中,一周后用户就不错领有对话体验。
马斯克在发布会中暗意,X上的Premium Plus用户启动,将是首批取得造访权限的群体,同期用户也不错通过Super Grok单独订阅工作。
此外,为了援助Grok3磨练,xAI在短短三个月将数据中心磨练集群翻倍20万块GPU,况兼xAI与戴尔达成50亿好意思元条约,戴尔或将本年向xAI寄托搭载GB200芯片的工作器。
“地球上最忠良的AI”
据先容,在数学推理、科学逻辑推理和代码写稿等才能阐扬方面,Grok-3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效劳。据悉,刻下Grok 3仍是在xAI里面运行了2周。
xAI工程师先容,固然Grok起步较晚,但在MMLU得分上以超快地速率追上了ChatGPT。
马斯克过火团队暗意,Grok 3也将具有雷同DeepSeek R1和OpenAI o3 Mini的推理才能。
马斯克团队指出,大致一个月前,Grok 3的预磨练仍是完成,从当时起其一直在戮力将推理才能融入Grok 3模子中。Grok 3推理迷你版的磨练本事更长,阐扬略优于Grok 3推理模子,这标明Grok 3推理模子具有广泛的后劲。
从各项方针来看grok 3一举卓绝统统模子,名次宇宙第一,有推理形态,有deep research功能。上周,马斯克在迪拜宇宙政府峰会的视频通话中书记了 Grok 3 的推出,并称该聊天机器东说念主具有“相配强劲的推理才能”况兼是“地球上最忠良的东说念主工智能”。
Grok 3比 Grok 2 快十倍,在Grok3中大范畴装配更多设计才能使其能够在更短的本事内运行大数据集,同期提供更高的准确性。
具体演示来看,Grok3现场为天际辐照生成动画3D图,展现了其意会复杂物理学问的才能。
马斯克团队输入领导条件条件Grok-3现场生成代码,运行代码后画面上夸耀出了飞船在地球和火星间来去的动画。
另一段演示中,迪士尼彩乐园Gork-3制作一款雷同于俄罗斯方块和对持迷阵的游戏,展现了其出色的创造力。
马斯克还露出称,咱们将在xAI 推出一个东说念主工智能游戏使命室。如若你有兴味加入咱们并劝诱东说念主工智能驱动的游戏,请加入咱们。
xAI通过修改 Grok3的磨练经过(而不单是是硬件创新)为Grok3达成了更好的功能。更新后的模子达成了合成数据集、自我矫正和强化学习,以擢升其性能。
订阅试用方面,马斯克暗意,Grok3 测试版现已面向X Premium 用户洞开,况兼推出 SuperGrok订阅工作。
此外,xAI沟通在最新版块完全老练后立即开源其Grok 模子的先前版块,马斯克瞻望Grok-3的过渡将在几个月内完成。
xAI与戴尔达成50亿好意思元条约,三个月将数据中心容量翻倍
值得一提的是,xAI沟通与戴尔达成50亿好意思元条约,为Grok 3提供AI工作器援助。xAI行将与戴尔科技达成条约收购价值跨越50亿好意思元的配备英伟达GB200芯片的AI优化工作器,这次收购旨在闲散Grok 3和其他AI欺诈才能日益增长的设计需求。
见闻此前著述指出,知情者称,若达成走动,戴尔将本年向xAI寄托搭载英伟达GB200芯片的工作器,用于优化AI使命。
在发布会上,马斯克团队还露出,xAI在短短三个月将数据中心容量翻倍,使用了20万个英伟达H100 GPU打造出最好AI。
马斯克团队暗意,旧年4月马斯克决定xAI要想取得手利并打造出最好 AI,独一的看法便是创建我方的数据中心。咱们花了122天的本事才让第一批10万个GPU启动并运行。咱们很快结实到要构建咱们想象的 AI,需要将集群范畴扩大一倍。因此启动了另一个阶段,咱们在短短92天内就将容量翻了一番。
在卖人方面,斯洛特对现有阵容满意。22岁的莫顿虽然可能再次引起关注,但2000万英镑的要价和引援前提使转会难度较大。
——圣诞节我最想做什么?与家人共度时光。你知道,有雪的圣诞节是最棒的。
网友热评:有史以来第一个冲突1400分的模子、性价比超Gemini
网友们关于Gork-3的发布也满怀欣忭,AI大佬Andrej Karpathy试用后赞美说,Grok3+Thinking八成和 OpenAI 最强的模子(比如 o1-pro,月费 200 好意思元)相配,比 DeepSeek-R1和 Gemini 2.0 Flash Thinking 略好一些。
还有网友夸赞称,Grok-3是有史以来第一个Chatbot Arena冲突1400分的模子,其性能优于 OpenAI 和 Google 的最好公开推理模子。而xAI 教学于 Deepmind晚13年,比OpenAI晚8年,刻下开始于两者。
有网友则对AI信心统统,Grok3似乎相配强劲,这很好地解析了缩放定律骨子上并莫得戒指,相配看好东说念主工智能的异日。
也有网友指出了其污点,Grok3 不擅长编码。
此外,更有网友测度,这会不会激起一轮大模子价钱战呢?