AI工具箱 AI工具箱 AI工具箱 AI工具箱
  • 热门推荐
  • AI写作工具
    • AI写作助手
    • AI写论文
    • AI写公文
    • AI写标书
    • AI内容检测
    • 降AIGC
    • AI写文案(小红书)
    • AI写小说
    • AI文献阅读
  • AI PPT生成
  • AI图片工具
    • AI图片生成
    • AI商品图
    • AI一键抠图
    • AI图片变清晰
    • AI图片物体抹除
    • AI图片修复
    • AI图片背景移除
    • AI图片插画
  • AI视频工具
    • AI视频生成
    • AI数字人
    • 视频剪辑
    • 短视频创作
    • 视频翻译
  • AI编程工具
    • AI编程助手
    • AI编程IDE
    • AI无代码编程
    • AI开发框架
  • AI音频工具
    • AI配音
    • AI音乐生成
    • AI语音识别
    • AI语音降噪
  • AI办公套件
    • AI办公助手
    • AI表格处理
    • AI思维导图
    • AI文档助手
    • AI数据分析
    • AI总结摘要
    • AI搜索
  • AI设计工具
    • AI设计神器
    • AI logo设计
    • AI海报设计
    • AI字体设计
    • AI 3D设计
  • AI趣味玩法
    • AI写歌
    • AI女友
    • AI游戏
    • AI角色扮演
    • AI占卜
    • AI元宇宙
  • AI求职招聘
    • AI简历生成
    • AI面试助手
    • AI招聘助手
  • AI翻译工具
    • AI翻译助手
    • AI图片翻译
    • AI字幕翻译
    • AI同声传译
    • AI语音翻译
  • AI学习资源
    • AI学习课程
    • AI学习网站
    • AI开发框架
  • AI营销
  • AI电商助手
  • AI智能助手
  • AI大模型
  • AI金融工具
  • AI法律助手
  • AI流量工具
  • AI SEO
  • AI浏览器插件
AI工具箱 AI工具箱
  • AI资讯
  • 关于我们
  • AI工具提交收录

AI大模型评测

MMLU
MMLU

MMLU助力大模型语言理解能力评测,提供全面精准评估。

HELM
HELM

HELM是一款全面评估语言模型的工具,具有多维度评估等功能和全面专业等特色,应用于研究与企业场景。

SuperCLUE
SuperCLUE

SuperCLUE是中文通用大模型综合性测评基准,能多维度测试模型能力,为模型研发和选型提供参考。

LLMEval3
LLMEval3

LLMEval3是专注于AI大模型评测的工具,提供精准高效评测服务。

C-Eval
C-Eval

C-Eval是评估大模型能力的平台,提供多模型多科目测试结果,助您选模型与研究模型性能。

H2O EvalGPT
H2O EvalGPT

H2O EvalGPT助力实现AI模型精准评估、对比与调优,提升模型可靠性与性能。

OpenCompass
OpenCompass

OpenCompass是专业大模型评测平台,提供多维度评测和对比等功能,适用于研究机构和企业等。

FlagEval
FlagEval

FlagEval是专业的AI大模型评测平台,提供多维度评测和模型对比等功能。

MMBench
MMBench

MMBench是用于多模态大模型评测的平台,具有广泛模型覆盖和专业评估体系,为模型研发和选择提供支持。

AG1-Eval
AG1-Eval

AG1-Eval是专业的AI大模型评测平台,提供权威榜单、支持人机评测、拥有多样评测集等。

AI工具箱 AI工具箱
AI工具箱,全方位AI资源聚合平台,精选全球3000+优质免费AI应用,涵盖AI写作、AI编程、AI绘画、AI设计、AI论文、AI生成PPT、AI视频、AI配音、AI音乐、AI金融等多个领域领域的AI工具软件。致力于让AI技术触手可及,助力用户高效工作,加速技术创新与产业应用落地,推动智能生活与工作方式革新。

AI写作 AI设计 AI配音 AI音乐 网站地图 商务合作 关于我们

扫码加微信AI工具箱

扫码加微信
鄂ICP备2024044990号-2  
常用
工具
社区
生活
    热门推荐: