AI快讯
推理大模型的欠思考问题及应对策略
研究发现推理大模型存在Underthinking现象,如DeepSeek-R1和Qwen QwQ在复杂任务中频繁切换思路致效率低。团队开发评估框架,提出量化指标,还给出思路切换惩...
DeepSeek发布创新模型,改写AI竞争格局
2025年初,深度求索推出的DeepSeek推理模型R1和DeepSeek千亿参数模型V3,以彻底开源、低成本训练等优势引发行业震动,推动AI自主进化,带来开源冲击波。
DeepSeek:以低成本创新颠覆AI格局,重新定义算力需求
探索DeepSeek的创新之路,其R1模型以低成本实现高性能,凭借独特架构和数据蒸馏技术颠覆传统。Scaling Law面临挑战,AI产业转向效率追求。同时,了解算力建设...
2025年AI行业发展新动向:硬件、软件与小众前沿领域全面开花
2025年春节复工后AI热度高涨。“AI界拼多多”DeepSeek引发关注,扭秧歌机器人走红。AI硬件如眼镜、陪伴玩具受关注,软件方面AI Agent发展迅猛,同时人形机器人...
金刚石半导体:从实验室走向工业现实的全球角逐
探索金刚石半导体的前沿发展,了解其作为终极功率材料在通信卫星、核电等领域的应用。聚焦日本、美国、欧洲和中国在该领域的研究、制造与产业化进展,见证其...
DeepSeek百万年薪招聘,不看经验只看能力,背后底气何在?
探索DeepSeek招聘奥秘,本科应届生可拿百万年薪,实习生高薪。其采用新型注意力MLA、GRPO算法,计算资源丰富,GPU投资巨大,不看经验重能力,引领行业新方向。
AI浪潮下,如何助力长辈跨越数字鸿沟
探索AI在帮助长辈使用电子设备、识别谣言等方面的应用。多模态图像识别与AI Agent功能带来新体验,生成式AI助力长辈融入数字生活,同时警惕AI谣言。
DeepSeek如何以低成本实现大模型性能突破
探索DeepSeek的创新之路,其凭借独特的MLA和MOE架构、数据蒸馏技术,以低成本达到世界一流模型性能,改变AI研发路径与行业格局。
Hugging Face推开放深度研究工具 剑指OpenAI
Hugging Face构建OpenAI深度研究工具的“开放”版本,结合o1模型与代理框架,推出文本浏览器和文本检查器,自主检索网络信息,源代码已公开,能否抗衡OpenAI备...
澳大利亚禁DeepSeek,多国关注其数据处理,中澳科技争端再引关注
澳大利亚政府全面禁止DeepSeek在政府设备上使用,因其对国家安全有风险。该程序由中国初创公司开发,功能强大引多国关注,也引发对数据处理的担忧,同时中澳...