首页 > 科技知识 > 科技知识 > 致幻的AI Overviews,谷歌再次翻了车

致幻的AI Overviews,谷歌再次翻了车

发布时间:2024-05-28 22:45:18

继将马斯克画成黑人后,谷歌再次翻了车。(虎嗅注:今年2月份,谷歌的Gemini在推出文生图功能几周的时间内,被用户发现该平台刻意拒绝生成白人形象。对此谷歌方面表示加快改进,暂停人物图片的生成功能。)

此次谷歌又犯了前科。在5月15日推出这一AI搜索引擎功能后,有不少用户在使用过程中发现谷歌的AI Overviews会“胡言乱语”,对搜索的问题给出有违常识的、荒谬的解决方案。比如,兔子曾经作为密尔沃基鹰队的后卫在NBA打过球、金毛犬可以生下奶牛、建议人们每天至少吃一块小石头……

此外,谷歌的人工智能搜索系统有时会难以解决基本的数学问题和方程式。例如,询问2000年美元的相对价值,会返回一个荒谬的答案,即“2000 年至 2023 年期间价格累计上涨 -43.49%”(根据谷歌自己引用的通胀计算器,当时价格实际上涨了77% );又或是认为2024年10月至2025年1月之间有 738,523 天。

AI Overviews是谷歌在5月15日的I/O大会上高调推出的新型AI搜索引擎,由Gemini大模型驱动,展示在谷歌搜索的页面顶部,可总结提炼用户查询内容的概要。在I/O大会上,谷歌称该功能将“重新定义搜索体验”。由于这一功能的推出,一些专家甚至将这一天称为 Google 搜索的“零日”。 2023年5月推出的Search Generative Experience是AI Overviews的测试版。CEO 桑达尔・皮查伊曾表示,在测试版推出后谷歌已经处理了超过 10 亿次查询。

之所以会犯这样的错误,最直接原因是Reddit网站网友评论的错误数据。谷歌的大模型以Reddit上的帖子作为学习资料,在数据清洗与训练环节出现纰漏,因而出现了“大模型致幻”。

事实上,谷歌这样“满纸荒唐言”并非个例。

谷歌之外,OpenAI、Perplexity、You.com等无一幸免,均出现过不同程度的失误。为了增强对话的拟真性和数据的全面性,这些AI搜索功能都将Reddit等社交平台作为模型训练的数据库,甚至奥特曼本身便是Reddit的投资人。

但Reddit等社区上的发言良莠不齐,显然AI在内容真实性和可靠度方面的判断力还未成熟。在常规的搜索中,这些来自随机互联网用户的恶作剧帖子可能不会成为人们点击网络链接列表时看到的首个答案。但有了AI Overviews后,这些恶作剧帖子就被整合到结果页面顶部显示的权威数据摘要中。

本质上,AI Overviews此次出现的问题是人工智能幻觉的一种新变体,当生成式人工智能模型提供虚假或误导性信息并将其呈现为事实时,就会出现幻觉。幻觉是由有缺陷的训练数据、算法错误或对上下文的误解造成的。

HITCon安全会议上的相关研究成果显示,仅仅需要“污染”不到0.7%的数据集,就能有效规避防御机制,导致大模型输出的内容准确性大幅下降。当大模型被投喂的数据集含有误导性信息时,其给出的结果必然同样失真。

对此,纽约大学的AI专家和神经科学荣誉教授加里・马库斯(Gary Marcus)曾表示,AI模型天生无法对自己的工作进行理性检查,而这正是这个行业的致命伤。

而谷歌发言人梅根・法恩斯沃斯则表示,“用户展示的事例都是不常见的查询,并不代表大多数人的经历,我们也看到了一些被篡改或我们无法复现的例子”“绝大多数 AI 概览查询都产生了高质量信息,并提供了深入挖掘网络的链接”。谷歌将使用有问题答案的“孤立例子”来完善其系统。

科技知识更多>>

加州推进新排放法规并拟推2亿美元电动车激励计划 雷军直播透露新一代SU7最新进展:已完成研发测试,2月13日起七城展出 起亚印度2026年1月销量达27603辆,同比增长10.3% 小鹏汽车官方公布的交付成绩:2026年1月,小鹏汽车共交付新车20,011台 现代首款纯电MPV Staria EV首次路试曝光,计划2026年上半年在韩欧上市 重构产业生态 动力电池回收迎来强监管时代 特斯拉Robotaxi版Model Y加装外置摄像头清洗装置,量产车或跟进但 retrofit需付费 Air史上最大电池!红魔11 Air官宣搭载7000mAh牛魔王电池 硅谷新贵、Cursor最强对手高调宣布:MiniMax是默认的首选模型 新能源车的“硬核”战事,2026年卷向何处? Anthropic将Claude Cowork AI智能体扩展至20美元Pro订阅用户 机器人将再度登上春晚舞台引热议,网友:绝不是小心翼翼扭秧歌 金额超9000亿元 马斯克向微软、OpenAI提出天价索赔 马斯克旗下SpaceX宣布完成第600次猎鹰火箭发射任务 消息称苹果计划为5款产品升级OLED屏幕,涵盖iPad mini、iMac、MacBook Air等 邓紫棋长篇科幻小说入选银河奖!官方:初选不等于入围 喧哗的《樱桃园》大胆的“契诃夫” 北京曲剧《雷雨》上演 高校学子感受传统戏曲魅力 汇集12支童声合唱团,2026成都童声合唱新年音乐会举行 日媒:华为手机国产化率达到60%,网友:实际已达95%了 6年没有发布新品,日本最强产品,被国产手机“打死”了 全球最畅销的15款电车:2款是特斯拉,另外13款全是中国车 中国最值钱的10大车企:小米第1、比亚迪第2,赛力斯第3 智界R7累计交付量突破 10 万台 印度提议将马来西亚玻璃反倾销税延长五年 全新ES8,蔚来盈利在此一举? 欧洲新锐破局,零跑725%增速成黑马 | 2025年9月,中国乘用车出海,谁在领航? 天马Micro-LED的透明技术再进化,显示产业“加速度”全面开启! 打不动了?淘宝牵线,小米、海信合伙开公司!电视开机率跌破30%后,10年冤家也和好了 对话海博思创杨洸:储企出海有价格底线,“低价混战”是所有人都不愿意看到的