近期AI界大事件：多款模型发布与应用突破

AI快讯1年前 (2025)发布 niko

OpenAI多项举措推动AI发展 。OpenAI推出gpt-image-1图像生成APi，开发者能轻松将其融入各类应用。该功能自上线吸引大量用户，生成超7亿张图片。它支持多样图像风格，内置安全防护，且定价合理，开发者可低成本生成高质量图像。此外，OpenAI预计到2029年营收达1250亿美元，AI代理服务和渠道收入是主要驱动力。

Google Gemini用户规模增长。Google的AI聊天机器人Gemini过去一年用户增长显著，月活跃用户达3.5亿，日活从900万增至3500万，但仍落后于 chatgpt的6亿月活。Google与三星的合作及产品整合推动了Gemini的快速发展。

新模型为AI艺术创作带来变革。Ostris团队发布Flex.2-preview，这一8亿参数的文本到图像扩散模型优化了ComfyUI工作流程。它在图像生成控制方面表现出色，支持图像修复和深度控制等功能，开源后获AI艺术创作社区关注。

NVIDIA模型促进多模态AI研究 。NVIDIA的Describe Anything3B（DAM-3B）模型在多模态学习领域受关注。它能根据用户指定的图像或视频区域生成详细描述，开源代码和数据集为开发者提供资源，在教育、医疗和内容创作等领域前景广阔。

工具简化AI开发流程 。Nano AI的MCP UniversalToolbox简化了模型上下文协议的复杂配置，预配置超100个MCP服务和18个常用API密钥，支持多模态生成，提高开发者效率。

腾讯云升级代码助手。4月24日，腾讯云发布CodeBuddy升级版，引入Craft软件开发代理。它将ai编程提升到项目交付层面，支持主流IDE，还支持MCP协议，方便代码测试、构建和部署，与腾讯生态兼容，利于团队协作。

昆仑万维开源模型提升推理能力。4月24日，昆仑万维发布多模态推理模型Skywork-R1V2.0，视觉和文本推理能力显著提升，在权威基准测试中创下开源SOTA记录，为全球开发者和研究者提供工具。

智谱降低大模型产品价格。4月24日，智谱大模型开放平台对多款大模型产品大幅降价，GLM-4-Plus降价达90%，降低了使用门槛，推动大模型技术广泛应用。

ChatGPT工具解锁图像创作新维度 。JSON Visuals forChatGPT发布，用户可用超50种美学代码和随机器生成个性化视觉内容，支持高分辨率输出，适用于多个领域。

中国成AI专利最大持有国。国家知识产权局局长申长雨宣布，中国成为全球AI专利最大持有国，占全球总数60%，国家知识产权局积极推动相关知识产权系统创新。

小米发布智能音箱 。小米新智能音箱售价199元，虽硬件配置简化，但引入AI大模型提升智能交互体验，支持连续对话和语音控制，还增加远程汽车准备功能。

# AI快讯

文章版权归作者所有，未经允许请勿转载。