o3模型引发AI识图定位热潮
OpenAI的o3模型自发布以来,其强大的识图定位功能让众多网友感到震惊。Lanyrd联创、DJango Web框架缔造者SimonWilson在博客中详细探讨了o3猜测照片拍摄地点的过程,称其既超现实又具反乌托邦色彩。
o3识图定位实验惊人
只需一张照片,哪怕没有明显地标,o3都能尝试找出拍摄地点。Wilson给o3一张加州ElGranada露天酒吧附近的照片,o3历经6分48秒的分析,先从奇怪错误开始,后恢复正常,通过分析模糊车牌、编写代码定位放大、对比细节等操作,最终给出答案,虽第一猜测有偏差,但后续准确命中。
与其他模型对比凸显优势
相比Claude 3.5和3.7Sonnet推理粗糙、gemini直接作弊,o3将工具使用融入“思考”阶段,通过多次裁剪图片进行分析,展现出独特的图像识别能力。不过,也有人质疑o3可能有位置模型辅助,但后续实验证明,即便去除相关信息,o3仍能准确判断如马达加斯加乡村、布宜诺斯艾利斯城市区等地的照片。
AI照片寻址功能强大
o3和o4 -mini发布后,引发全网AI玩“照片寻址(GeoGuessr)”热潮。仅凭无EXIF信息的菜单或风景照,它们就能推理定位。知名投资人Deedy用菜单图片测试,o3成功找到中餐馆位置。o3还能根据室内窗户拍摄的海岸景色照片,猜出拍摄地为加州奥兰治县达纳角的丽思卡尔顿拉古纳尼格尔酒店内,并给出详细地址和经纬度。网友上传的各种照片,o3大多能准确猜出位置,不过在加拿大山脉鸟瞰图上翻车,可能因航拍照片训练集比例低。国内开发者的随手拍照片,o3也能准确分析出位置信息。
AI隐私风险需警惕
o3模型展现出强大的位置识别能力,仿佛让“CSI走进现实”。但这也意味着,人们的照片一旦暴露给AI,信息隐私将面临威胁,人身安全也需提高警惕。未来,随着技术发展,AI模型的能力还将不断提升。