提示:本页直接在浏览器调用 OpenAI 官方接口,需开启 VPN。Key 仅保存在本地,请使用可调用对应模型(speech / whisper / realtime)的密钥。
调用 /v1/audio/speech。两种播放模式可切换:流式边生成边播、首音更快;完整模式等全部生成完毕再播。
当前:完整生成后播放 · 等 OpenAI 把整段音频生成完,再一次性播放。
调用 /v1/audio/transcriptions,支持浏览器录音或上传音频文件。两种模式:整段一次性返回;流式边返回边显示(仅 gpt-4o-transcribe 系列,whisper-1 不支持流式)。
当前:整段转录 · 录完/选完文件后一次性返回结果。
通过 WebRTC 连接 gpt-4o-realtime,全自动端点检测(VAD),可直接说话对话。