在科技领域蓬勃发展的当下,一些新兴力量正崭露头角。其中,DeepSeek成为备受瞩目的焦点。其创始人梁文锋,1985年生于广东湛江吴川,父母皆为小学语文老师,良好的家庭环境使他自幼成绩出众。2002年,梁文锋以吴川一中“高考状元”之姿考入浙江大学,先后攻读电子信息工程专业本科及信息与通信工程专业研究生。大学期间,他就与同学探索全自动量化交易,积累市场行情数据。
2015年,梁文锋硕士毕业后与几位浙大同学创立量化对冲基金公司幻方量化,并于当年获得首张私募牌照,管理规模迅速超百亿。2016年,幻方量化首次上线AI策略,后实现投资策略全面AI化,且是国内唯一公开宣称拥有万张英伟达A100显卡的企业,这为梁文锋后来投身AI领域埋下伏笔。
2023年,全球AI大模型竞争激烈,梁文锋宣布进军通用人工智能领域。同年4月,DeepSeek在杭州成立,11月发布开源代码大模型。成立至今,DeepSeek未开放外部融资,却凭借自身实力逐渐走进大众视野。2024年5月,DeepSeek发布DeepSeek-V2开源MoE模型,降低推理成本,引发大模型“价格战”。
上个月,梁文锋团队开发的大模型DeepSeek-V3正式发布,起初在AI发烧友圈流传,因其出色表现轰动硅谷。1月20日,DeepSeek发布DeepSeek R1,迅速席卷全球。春节前夕,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费App下载排行榜,在美区下载榜上超越ChatGPT,这是中国应用首次同期在中国和美区苹果App Store占据首位。
DeepSeek R1在数学、代码、自然语言推理等任务上性能比肩OpenAI o1模型正式版。其受关注焦点集中在低训练与使用成本以及开源两方面。与OpenAI不同,DeepSeek利用算法处理数据,提高训练效率并降低成本。R1预训练费用仅557.6万美元,在2048块英伟达H800 GPU集群上运行55天完成,不到OpenAI GPT-4o模型训练成本的十分之一。
DeepSeek的崛起给美国科技股带来冲击。1月27日美股收盘,英伟达股价下跌近17%,市值单日蒸发近6000亿美元,不少美股主要科技公司股价也下跌。为应对压力,OpenAI采取行动,而DeepSeek在除夕当天发布开源多模态模型Janus-Pro,进军文生图领域。
与此同时,杭州还有其他科技力量崛起。宇树科技旗下机器人H1登上2025年央视春晚舞台,其在一级市场也颇受关注,2024年春节前夕完成近10亿元B2轮融资。前不久,宇树科技的机器狗产品B2-W演示视频展示了高难度动作,引发海外关注。
2024年,杭州诞生了火爆全球的游戏大作《黑神话:悟空》。2018年,游戏科学将开发团队迁至杭州。同年,杭州招引强脑科技落地,如今强脑科技与马斯克的Neuralink成为全球唯二融资超过2亿美元的脑机接口公司,并实现产品量产。此外,云深处科技的机器人“绝影X30”走进海外电力系统,群核科技因“酷家乐”软件闻名。它们与DeepSeek、宇树科技并称为“杭州六小龙”,成为杭州科技产业名片。
杭州市委副书记、市长姚高员表示,杭州将坚定不移推进创新活力之城建设,打造“三个地”,让创新成为城市气质。中国科技创业者们正以实际行动重新定义古老文明,DeepSeek愿为科技发展贡献力量。