OpenAI于5月安排了一场惊喜媒体活动,就在谷歌2024年I/O主题演讲之前,谷歌在活动上重点介绍了其产品组合中的GeminiAI新功能。当时,OpenAI以新的多模式ChatGPT功能震惊了世界,包括能够理解照片、视频和计算机屏幕中的内容。
更令人印象深刻的是高级语音模式,它使ChatGPT能够更自然地进行语音对话。你可以用新信息打断聊天机器人,就像人类的讨论一样,而ChatGPT不会失去思路。你还可以感受到ChatGPT语气中人类独有的情绪和变化。
谷歌一天后演示了GeminiAI的类似功能。但当时两家公司都还没有准备好全面推广这些功能。
OpenAI于7月下旬向ChatGPTPlus的部分用户发布了高级语音模式。该公司表示,所有Plus用户都将在今年秋季获得高级语音模式,但并未透露发布日期。现在,一系列新的似乎表明该日期正在迅速临近。OpenAI可能会在下周向更多用户提供ChatGPT的高级语音模式。
Redditor发现有关X的泄露信息,表明语音功能可能会在9月24日向更多用户开放。它甚至可能开始向所有Plus用户推出。
如下图所示,有人表示,OpenAI可能会在9月底之前将高级语音模式的可用性扩展到更多人。据报道,OpenAI已经“迭代以提高安全性和更流畅的体验”。该用户暗示,一小部分用户将获得高级语音模式,而不是所有Plus用户。
另外,一位X用户发现代码,表明高级语音模式可能会在9月24日收到更新。
这个日期与SamAltman上周对一位X用户关于ChatGPT高级语音模式扩展的回复一致。Altman的回应并不是最好的,并且遭到了ChatGPTPlus付费用户的强烈反对。但他确实表示新玩具即将推出。
谷歌宣布向Android用户推出GeminiLive的同一天,Altman回答了有关更广泛推出高级语音模式的问题。GeminiLive相当于高级语音模式。谷歌推出了GeminiLive,作为Android版Gemini移动应用的免费更新。
OpenAI不能落后。它最近可能发布了更先进的ChatGPTo1预览模型,但这仍然是一个测试。OpenAI必须向投资者证明它可以跟上谷歌的步伐,因此高级语音模式不会太遥远。提醒一下,OpenAI正在寻求筹集更多资金,据传苹果是OpenAI的新投资者之一。
目前尚不清楚免费ChatGPT计划的用户何时可以使用新的语音功能。