近期AI界大事件:多款模型发布与应用突破

AI快讯1个月前发布 niko
17 0
AiPPT - 一键生成ppt

OpenAI多项举措推动AI发展 。OpenAI推出gpt-image-1图像生成APi,开发者能轻松将其融入各类应用。该功能自上线吸引大量用户,生成超7亿张图片。它支持多样图像风格,内置安全防护,且定价合理,开发者可低成本生成高质量图像。此外,OpenAI预计到2029年营收达1250亿美元,AI代理服务和渠道收入是主要驱动力。

Google Gemini用户规模增长。Google的AI聊天机器人Gemini过去一年用户增长显著,月活跃用户达3.5亿,日活从900万增至3500万,但仍落后于chatgpt的6亿月活。Google与三星的合作及产品整合推动了Gemini的快速发展。

新模型为AI艺术创作带来变革。Ostris团队发布Flex.2-preview,这一8亿参数的文本到图像扩散模型优化了ComfyUI工作流程。它在图像生成控制方面表现出色,支持图像修复和深度控制等功能,开源后获AI艺术创作社区关注。

NVIDIA模型促进多模态AI研究 。NVIDIA的Describe Anything3B(DAM-3B)模型在多模态学习领域受关注。它能根据用户指定的图像或视频区域生成详细描述,开源代码和数据集为开发者提供资源,在教育、医疗和内容创作等领域前景广阔。

工具简化AI开发流程 。Nano AI的MCP UniversalToolbox简化了模型上下文协议的复杂配置,预配置超100个MCP服务和18个常用API密钥,支持多模态生成,提高开发者效率。

腾讯云升级代码助手。4月24日,腾讯云发布CodeBuddy升级版,引入Craft软件开发代理。它将ai编程提升到项目交付层面,支持主流IDE,还支持MCP协议,方便代码测试、构建和部署,与腾讯生态兼容,利于团队协作。

昆仑万维开源模型提升推理能力。4月24日,昆仑万维发布多模态推理模型Skywork-R1V2.0,视觉和文本推理能力显著提升,在权威基准测试中创下开源SOTA记录,为全球开发者和研究者提供工具。

智谱降低大模型产品价格。4月24日,智谱大模型开放平台对多款大模型产品大幅降价,GLM-4-Plus降价达90%,降低了使用门槛,推动大模型技术广泛应用。

ChatGPT工具解锁图像创作新维度 。JSON Visuals forChatGPT发布,用户可用超50种美学代码和随机器生成个性化视觉内容,支持高分辨率输出,适用于多个领域。

中国成AI专利最大持有国。国家知识产权局局长申长雨宣布,中国成为全球AI专利最大持有国,占全球总数60%,国家知识产权局积极推动相关知识产权系统创新。

小米发布智能音箱 。小米新智能音箱售价199元,虽硬件配置简化,但引入AI大模型提升智能交互体验,支持连续对话和语音控制,还增加远程汽车准备功能。

© 版权声明
Trea - 国内首个原生AI IDE