刚刚,年度最强 AI 登场!马斯克奥特曼点赞 Gemini 3
发布时间:2025-11-19 23:01 浏览量:10
AI开始替你干活,人类却还没准备好,谁该为自动订车负责?
Google悄悄推出了Gemini 3 Pro这个新功能,没开发布会也没做直播,连具体发布日期都没说,它直接内置在搜索、AI Studio和Vertex AI这些常用工具里,你在使用这些工具的过程中就能发现它在帮你处理事情,不用等你开口问它。
它的分数确实挺高,但重点不在于比较谁更强,它在数学题上能达到23.4%的准确率,在视频理解方面能看出“匹克球动作哪里不对”,这说明它不只是会答题的机器,它能看懂画面中的行为逻辑,还能处理长达一百万字的上下文内容,比如你给它一份手写菜谱,它可以整理成带图的电子版,还会加上步骤说明。
最特别的是那个叫Antigravity的东西,它不是代码编辑器,更像是一个能够自己动手干活的程序员,你交给它一个需求,比如做个航班追踪器,它就自己规划任务,动手写代码,进行调试,完成测试,最后给出一个能运行的程序,它还连接了GitHub和JetBrains这些开发者常用工具,等于把整个开发流程全都包揽下来了。
现在它能回答问题,还能帮你做事情,你告诉它下周要去上海,它就自己查好航班信息,比较租车价格,生成预订链接,连行程都提前安排好,你让它整理收件箱,它会自动分类邮件,帮你写好回信草稿,等你确认之后再发出去,整个过程不用你动手,但每件事都会经过你的同意。
这技术背后用的稀疏专家模型挺巧妙,不是所有参数一起工作,只调用需要的部分,这样能节省电费、降低成本,训练时用的是谷歌自家的TPU芯片,内存足够大,能处理上百万字的文本,API收费方面,输入一块钱可以处理一万个字,输出的费用更高些,但相比市面上大多数商业API还是更划算。
它和OpenAI、Anthropic那些模型有区别,那些模型注重对话流畅和多模态表现,这个模型关注的是完成具体任务,比如你需要写报告,它不但帮你写完,还会检查数据、找出错别字,甚至帮你调整格式,你给它一个包含多个步骤的任务,它可以逐步执行下去,不会中途卡住,也不会胡乱操作。
这带来一个问题,如果智能系统帮忙订车却发生事故,责任应该由谁承担,Google提出需要用户逐步确认操作,但普通用户未必理解那些技术细节,目前法律尚未完善,企业已经在使用这类系统处理自动化流程,部分人觉得方便省事,另一部分人则担心失去控制,缺乏监管的时候最容易引发问题。
我试着让它帮我整理菜谱,把手写内容转成电子版,加上图片和步骤说明,它完成得很快,比预想中要可靠,不过我也在琢磨,如果它把食材分量搞错,害我把菜炒糊了,这责任该算它的,还是怪自己没仔细核对,这种模糊的情况以后估计会越来越多。
它不追求对话有多精彩,也不讲究界面多好看,它就是安静地做事,把你安排的任务完成,你不用告诉它具体步骤,它会自己分解任务、执行操作、检查结果,这才是真正的变化——人工智能从一个助手变成了同事,而且是那种话不多但很可靠的伙伴。
很多人还没明白这一点,他们还在比较谁的分数更高,谁的回答更聪明,但实际情况是,分数再高也不如能把事情办妥,Gemini 3 Pro不是在榜单上取胜,而是在生活中获胜,它不喊口号,不讲故事,只是把你懒得做的事情一件件完成。