谷歌Gboard新增Gemini驱动听写,支持多语言识别。
5月13日,据当地媒体报道,当地时间周二(12日),谷歌在“AndroidShow:I/OEdition2026”活动中正式推出了一项由人工智能驱动的语音转文字功能,名为Rambler,并已整合至其官方输入法Gboard中。
与其它听写应用类似,Rambler 也具备删除“呃”“啊”等填充词的功能。此外,它还能准确识别句子中的即时修正,例如:“我将在周三下午3点在我们常去的咖啡店见面……呃,2点”,系统也能正确识别并呈现。 这种对口语表达中常见停顿和修正的处理能力,体现了语音识别技术在实际应用场景中的不断进步。对于需要高效处理语音内容的用户来说,这类功能无疑提升了使用体验,也让语音转文字更加贴近自然对话的实际情况。
谷歌表示,该功能采用基于Gemini的多语言模型,支持“代码切换”功能。
注:“代码切换”指用户可以在同一句话中切换不同语言,而 Rambler 能够在不丢失上下文的情况下继续识别。
公司表示,Gboard 会向用户明确提示 Rambler 正在运行。该功能不会保存任何语音记录,仅用于音频转写。谷歌在简报中指出,由于 Rambler 可以在所有应用中使用,相当于“重新定义键盘”。
关于隐私问题,Android Core Experiences负责人Ben Greenwood表示,谷歌通过结合设备端与云端处理方式,并在多年来的持续投入中“进行了大量投资”,以确保相关功能“安全且注重隐私”。这一表态旨在回应用户对Rambler及第三方语音输入应用之间可能存在的隐私担忧。
该功能最初将在夏季仅针对三星Galaxy和谷歌Pixel手机推出,后续将逐步扩展到其他Android设备。