AI快讯
艾伦AI所推Tülu 3 405B开源模型 性能超DeepSeek v3且训练方法独特
美国艾伦人工智能研究所推出新一代开源模型Tülu 3 405B,在多项基准测试中超越DeepSeek v3。其采用可验证奖励强化学习等全新后训练框架,开源多项内容,标志...
AI时代,如何助力长辈跨越数字鸿沟
探讨AI在帮助长辈融入数字生活中的应用与挑战。从多模态AI助力日常,到手机端侧AI降低使用门槛,同时面对AI生成谣言难题,分享辨别技巧,强调技术人性化及情...
Qwen2.5-Max登榜Chatbot Arena ,国产大模型竞争激烈
2月4日凌晨,阿里云Qwen2.5-Max在Chatbot Arena LLM Leaderboard榜单中表现出色,凭借升级后的MoE架构加入大模型竞赛。国产模型通过开源、降价等方式降低使用...
OpenAI推深度研究功能,多步骤研究助力知识工作与创新
OpenAI举行直播推出深度研究功能,能多步骤研究、整合推理信息,由o3模型驱动,在评估中创高分,引发开源竞争讨论。
DeepSeek创新三重门:小天才、军团协同与原创思想
探索DeepSeek的创新密码,解析其创新三重门,包括小天才式创新、华为式军团平推及原创哲学思想,涵盖MLA、DeepSeekMoE、GRPO等关键算法。
DeepSeek模型引发韩国人工智能发展新动向
彭博社报道,韩国代理总统称DeepSeek最新人工智能模型或重塑产业格局。韩国民众上月第四周使用生成型AI应用,ChatGPT居首,DeepSeek第二。韩国计划投资支持高...
DeepSeek百万年薪招聘,不限专业经验,年轻团队与创新机制引关注
DeepSeek登上招聘热搜,开出高薪,不限专业经验。团队年轻,有创新算法,计算资源丰富,其独特理念与模式备受关注。
DeepSeek-R1大模型引发港股AI投资热潮,公募基金提前布局
春节假期后,港股AI概念股受DeepSeek利好强势上涨,多只股票创历史新高。幻方量化旗下DeepSeek公司推出的DeepSeek-R1大模型,以低成本实现卓越性能,引发市场...
DeepSeek:崛起的大语言模型引领中国AI创新浪潮
春节期间,杭州科技公司DeepSeek凭借大语言模型震惊全球。其推出的DeepSeek-R1、Janus-Pro-7B等模型性能出色,计算成本低。中国重视AI人才培养助力企业发展。
DeepSeek崛起:日活破2000万,多领域发展与广泛接入的AI新势力
蛇年春节假期,DeepSeek成为热门AI应用,上线20天日活破2000万。其推出高性价比的DeepSeekV2,开源R1推理模型成绩优异。还积极招聘人才,吸引众多云厂商接入...