Grok-1 – 马斯克旗下xAI开源的大模型，参数量3140亿

AI工具1年前 (2024)更新 niko

48 0 0

Grok-1概览

Grok-1是由xAI公司开发的先进语言模型，它是一项创新的混合专家（MoE）模型，具有高达3140亿的参数量，是目前开源语言模型中参数数量最多的。这一模型的开发遵循了开源的精神，其架构和权重已经对外公布，并且基于Apache 2.0许可，这使得个人和企业能够自由使用、修改和分发Grok-1，无论是出于个人兴趣还是商业目的。

官方资源链接

官方文章：Grok-1官方介绍
GitHub：Grok-1 GitHub项目
Hugging Face：Grok-1 Hugging Face模型库
模型权重下载：通过磁力链接可下载模型权重

Grok-1模型特点

根据xAI官方提供的模型卡片，以下是Grok-1的关键信息摘要：

模型细节：Grok-1基于Transformer架构，是一个自回归模型，预训练用于预测下一个token。经过人类反馈和早期Grok-0模型的微调，具备处理8192个token的上下文长度。
预期用途：设计用于自然语言处理任务，如问答、信息检索、创意写作和编码辅助等，是Grok聊天机器人的核心引擎。
局限性：尽管在信息处理方面表现出色，但需要人工审查以确保结果的准确性。Grok-1无法独立搜索网络，依赖于搜索工具和数据库来增强其事实性。
训练数据：使用了截至2023年第三季度之前的数据，包括互联网数据和xAI的AI训练人员提供的数据。
评估：在推理基准任务和特定的数学考试问题上进行了评估，目前正在通过Grok早期访问计划扩大测试范围。