谷歌 Bard“史上最大更新”!终于会说会读图,支持中文等 40 多种语言
Bard 打赢监管阻拦,成功进军欧盟市场,并新增读图、调整答案语气和风格等新功能。华尔街见闻抢先使用的感受如下:暂时无法解读人像图片,还读不懂人类的图片讽刺语气,中文读诗 AI 腔太浓不够惊艳。
7 月 13 日周四,谷歌发布了旗下与 ChatGPT 正面打擂台的人工智能聊天机器人 Bard 最新进展,并称之为 “Bard 工具迄今为止最大规模的扩张”。
谷歌 A 周四午盘后涨幅扩大至 4.4%,至一个月最高。生成式 AI 竞争对手微软也涨超 1%。
Bard打赢监管阻拦进军欧盟市场,新增读图、调整答案语气和风格等 “硬实力”
官方博文称 Bard 已可以支持 40 多种语言,包括阿拉伯语、中文、德语、印地语和西班牙语。用户可在巴西和整个欧洲进行访问,即使用场景拓展到全球更多地区,特别是重要的欧盟市场。
同时,用户可以获得更多定制化、个性化的 AI 回复。
例如,Bard 可以将回答用语音读出来了,这一功能已支持 40 多种语言。谷歌相关负责人称,“这对想听听单词的正确发音,或者听一首诗歌或剧本被朗诵出来等格外有用”。
用户还可以调整 AI 回复的语气和风格,目前分成五个选项,即简单、长、短、专业或休闲。该功能仅限英语使用,但将很快拓展到新的语言。
此外,Bard 还推出了四个 “增进用户生产力” 的新功能,包括在网页左侧固定(pin)和重命名此前的对话记录,方便随时重新访问;将 Bard 撰写的 Python 代码导出到 Google Colab 和 Replit 等软件开发工具中;提供可分享的链接,方便用户与他人分享部分或全部与 AI 工具的聊天内容,这三种功能均已支持 40 多种语言。
更引人注目的是,Bard新增了读图功能,可在用户提问框中上传图像,要求 AI 聊天机器人解读图像、提供更多画面信息,以及根据图像撰写标题。这一功能目前仅限英语使用,未来将很快拓展到更多新语言中。5 月谷歌的 I/O 年度开发者大会上,曾宣布把 Google Lens 的功能引入 Bard。
谷歌还在官方博文中给出了一段疑似 AI 撰写的 “鸡汤文字”,称:“好奇心和想象力是人类创造力背后的驱动力……想象新可能性的能力也是人类与生俱来的人类品质之一。这就是我们创建 Bard 的原因:帮助您探索好奇心,增强想象力,并最终将想法付诸实践,而不仅仅是回答您的问题。有鉴于此,Bard 现在可以在世界大部分地区使用且能理解最广泛使用的语言。”
有分析称,Bard 的最新改进正值谷歌试图在白热化的生成式人工智能领域保持领先地位,以在来自微软支持的 OpenAI、Anthropic 和其他公司的快速、激烈竞争中脱颖而出。
而在一个月前,谷歌还因欧盟《通用数据保护条例》(GDPR)背后的欧洲主要数据监管机构——爱尔兰数据保护委员会的阻拦而无法如期在欧盟推出 Bard。
当时该监管机构的反对理由是,这家科技巨头没有就如何尊重欧盟数据隐私规则提供足够的信息。谷歌今日在 Bard 拓展到欧盟后称,将 “大胆而负责任的开发人工智能”,主动与专家、政策制定者和隐私监管机构进行接洽,未来会将 Bard 引入更多的地区和语言,并聆听公众反馈。
见闻使用感受:还读不懂人类讽刺图片,中文读诗 AI腔太浓不够惊艳
上述新功能听起来天花乱坠,实际使用效果究竟如何?针对普通受众最关心的 “听说读写” 功能,华尔街见闻也对 Bard 做了如下测试,简单来说,新功能使用起来似乎暂时算是 “马马虎虎”。
首先,华尔街见闻询问了 Bard 如何解读周三马斯克宣布成立新公司 xAI 后,网友嘲笑 Meta 的小扎将挖墙脚抄袭的图片,这显然是讽刺 Meta 的 Threads 抄袭了马斯克的推特。
Bard 反应了一会儿后,给出的回答很简单:“不好意思,我当前还不能解读有关人物的画面。”并在给出回答的同时删除了提问对话框中的图像本身。
接着,华尔街见闻询问如何解读昨日另一热门网图,即 xAI 掀起的飓风正在摧毁一座标有 ChatGPT 字样的房子,“自然人智能” 都可以理解这是一副讽刺漫画,形容 ChatGPT 在 xAI 面前不堪一击。
Bard 一开始只是简单描述了画面中有的物体:房子正在被飓风摧毁,并描述了飓风的特性,以及房子已经摇摇欲坠的画面感。但结论却是:“该图像有力地提醒人们龙卷风的破坏力,它还提醒人们为恶劣天气事件做好准备的重要性。” 可见并不是一个令人满意的答复。
华尔街见闻紧跟着询问为何画面上出现了 X.AI 和 ChatGPT 的字样,Bard 回复称,这是因为两者都是能产生文本的大语言模型 LLM,解释了一下 LLM 的定义,并认为 “该图像旨在隐喻 LLM 的破坏力就像龙卷风一样,可以做善事也能作恶”,还称 “图片上的 X.AI 和 ChatGPT 的标志提醒我们 LLM 是强大的工具,应该负责任地使用,需要确保它们不会被用来造成伤害。”
是熟悉的 AI 聊天鸡汤味儿了。
如果询问给图片配上标题,Bard 给出了 “LLM 的力量”、“LLM 的危险性” 和 “LLM 的未来” 等驴唇不对马嘴的内容,很显然,人类的毒舌讽刺实力,AI 机器人还未能很好地贯彻领会。
华尔街见闻玩心渐起,又上传了一张北极熊捂脸的图片让 Bard 解读。见闻老读者们都知道,美股熊市之际这张图片会屡屡出现在媒体中。
如果只是简单询问 “图片讲了什么”,Bard 给出的答复也非常中规中矩,但点明熊的动作和面部表情说明它要么是悲伤、要么是恐惧、要么是专注,可能是感到孤独或者害怕,总之是感情强烈。
如果具体询问北极熊与股市的关系,Bard 的回复便靠谱多了,准确地答出 “是熊市隐喻,作为空头对股市悲观情绪的象征”。还称图片也可以被看作是对股市投资风险的提醒。
要求它给出的标题也恰如其分,例如:“股市看跌的时候,连北极熊都捂着脸”;“熊市即将来临,北极熊已经做好了准备”;“当股市崩盘时,就是冬眠的时候了”,属实非常优秀。
华尔街见闻也询问了鸽子图像与美联储之间的关系。Bard 一开始显然在 “AI 式扯淡”,称 “它与美联储的联系是明确的:鸽子代表美联储的独立性、对和平的承诺以及对未来的希望。”
如果具体询问鸽子与美联储货币政策有何关系时,Bard 显然在尝试理解 “隐喻/比喻”(metaphor)这个概念,但给出的不是 “鸽派联储” 这种标准回答,而是称 “它与美联储货币政策的联系是显而易见的:鸽子代表了美联储即使面对不确定性也保持经济步入正轨的决心。”
好吧,Bard 读图能力看上去还不能令人眼前一亮,毕竟人像解读功能还没有上线,对画面中讽刺和隐喻的理解也不够到位,那么 Bard“用语音读出回复” 的新功能如何呢?
华尔街见闻输入了李白《静夜思》的中文文字,首先要求 Bard 根据这首诗给出相关图片,但被告知只能给出图片的文字描述版,“对不起,我没有生成图片的功能。我只能生成文本。”
随后华尔街见闻点击答案框的右上角 “小喇叭” 标志要求 Bard 进行朗读,读出来的统统都是 AI 味儿,不论如何询问 “请用深情朗读”、“换成男声朗读” 等具体要求,Bard 都表示 “臣妾做不到”。
若朗读莎士比亚的英文剧本,倒是比较纯正的美式发音,可见中文的进步空间还有不少!