编程进入「对讲机」时代!Claude抢发语音写代码,转录Token全免费_Code_Voice
新智元报道
编辑:定慧
刚刚,Anthropic给Claude Code加了个语音模式。
以后写代码,用嘴说就行。
Claude Code是Anthropic出品的命令行AI编程工具。
以前你得打字跟它交流。现在不用了。
跟对讲机一模一样。
目前灰度测试阶段,大约5%的用户先尝鲜,接下来几周逐步放开。
如果你的账户有权限,打开Claude Code时欢迎界面会提示你。
语音模式这玩意儿牛在哪?
不是简单的语音转文字。
语音转出来的文字,会直接在光标位置实时流式输出。
类似下面网友分享的这样。
无缝衔接。不覆盖。不替换。
这才是关键——它不是替代键盘,是补充键盘。
想象一个场景:你在调一个诡异的bug,涉及三层回调嵌套加一个竞态条件。
打字描述这玩意儿,光组织语言就得五分钟。
但如果张嘴说?人类天生就擅长口头描述混乱的场景。三十秒搞定。
还有一个大利好:语音转录的Token完全免费。不计费。不扣额度。想说多少说多少。
对面奥特曼什么反应?
有意思的是,OpenAI的Codex几乎在同一时间也加了类似功能。
Codex 0.105.0版本更新日志写得明明白白——按住空格录音,松开转录,文字直接输入到终端界面。
用的是Wispr语音引擎,目前支持macOS和Windows,Linux还没跟上。
而且这功能还需要手动开启:
在配置文件里设置features.voice_tranion=true。
两家几乎同时出招。
这不是巧合,是共识。
编程工具的下一个战场,不在模型有多聪明,而在交互有多自然。
社区怎么看?
开发者社区其实早就在自己搞了。
在官方语音模式之前,GitHub上就有一个叫Voice Mode的社区项目,通过MCP协议给Claude Code***了语音能力。
还有各种第三方工具——AquaVoice、Superwhisper、Voicy——都在抢占语音写代码这个生态位。
有人用Talon Voice实现了全程免手操作,连终端的Ctrl+C都是用嘴说的。
而现在,官方直接下场了。
第三方工具颤抖了吗?可能没有。
因为官方的语音模式更像一个入口级功能——它降低了门槛,让更多人意识到原来写代码可以用嘴。
语音编程的体感到底怎么样?
根据早期用户的反馈,几个场景特别好用:
Debug的时候
口头描述bug比打字描述快太多了。
你说话时会自然带出更多上下文——就是那个,登录页面,输入带加号的邮箱,它验证就报错了——这种人类碎碎念的信息密度,打字时你绝对懒得写。
架构讨论的时候
我想让这个API用JWT做认证,accesstoken十五分钟过期,refreshtoken七天,再加一个刷新端点——说出来十秒钟,打出来一分钟。
不在电脑前的时候
吃东西、喝咖啡、手受伤了、得了腱鞘炎——这些场景下,语音输入不是锦上添花,是刚需。
但也有短板。
所以最佳实践是:自然语言部分用嘴说,精确代码部分用手打。
一个更大的信号
让我们把视角拉远一点。
2024年,Cursor让AI写代码成为主流,Tab一下是当时的潮流。
2025年,Claude Code和Codex让AI Agent自主编码成为可能。
2026年,语音模式的加入,补上了人机交互的最后一块拼图。
编程正在经历一次输入革命。
键盘不会消失,就像鼠标没有消失一样。
但编程的主要瓶颈,已经从写代码变成了表达意图。
而表达意图这件事,人类最原始、最高效的方式,就是说话。
人类说话的速度大约是每分钟150词,打字速度大约是40词。
这中间3-4倍的差距,就是语音编程要吃掉的市场。
畅想一下:
再往前看几步。
如果语音输入足够准确,如果AI对代码意图的理解足够深,那 编程最终的形态可能是这样的:
你坐在沙发上,对着电脑说:把用户模块的权限系统重构一下,改成RBAC模型,别忘了写测试。
AI自动读代码、理解架构、写实现、跑测试、提PR。
你审一眼diff,说一句LGTM,合并。
从写代码到说需求,从程序员到编程导演。
这一天比大多数人想的要近。
Claude Code的这个/voice命令,就是一个起点。
它可能还很粗糙,可能还有各种小毛病。
但方向错不了——未来的编程,一定是多模态的。
键盘、语音、甚至手势和眼动,所有人类自然的表达方式,都会成为编程的输入通道。
到那时候回头看今天,就像我们现在看二十年前的打孔卡片一样。
会觉得很可爱。
写代码这件事,终于可以动口不动手了。
虽然动完口之后,你可能还是得动手改bug。
参考资料:
秒追ASI返回搜狐,查看更多
同类文章排行
- 男人的快乐有多简单?
- DP和HDMI哪个好,有什么区别?
- 新项目可以使用flutter吗?会不会因为不成熟,导致众多问题,最后不得不放弃?
- 以前大力推广的沼气池,怎么现在越来越少了?
- 养乌龟生态缸到底可行吗?
- 如何评价浙江这个省?
- 为什么面对 Adobe 的版权要求下,vposy 大神还能从容不迫?
- 你如何评价小米这个品牌?
- ***将华为和中芯国际列入出口黑名单,会造成哪些影响和后果?
- 央行行长潘功胜首次在公开场合谈及稳定币,稳定币是什么?有何深意?
最新资讯文章
- 毕设答辩,老师说node不可能写后台怎么办?
- 怎么看待三十而已里说的养鱼让人玩物丧志,养鱼是魔鬼,是黑洞,养鱼毁三代鱼缸毁一生的话?
- 央行行长潘功胜首次在公开场合谈及稳定币,稳定币是什么?有何深意?
- 240hz的显示器对比144hz提升有多少?
- 为什么有的人喜欢带着 MacBook 去咖啡店或者书店上网,而不是 ThinkPad 之类的?
- Golang 中为什么没有注解?
- 小米发布了 REDMI 首款旗舰小平板 K Pad,仅 8.8 英寸,小巧便携,如何评价这一设计?
- 前端,后端,全栈哪个好找工作?
- 为什么国内程序员们没有联合起来设计一种中英文严格2:1宽度比的字体呢?
- QQ为什么败给微信?
- 如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 人工智能相关专业里有什么「坑」吗?
- Rust 未来会成为主流的编程语言吗?
- Swift 和同时代的其他语言比起来怎么样?
- 你看过哪些以为是段子新闻,结果发现居然是真的?
- 美军 B-2 轰炸机参与袭击伊朗核设施,B-2轰炸机战斗力如何?会摧毁伊朗核设施吗?
- 花那么多钱举办婚礼的意义在哪呢?
- 如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 商务部称中国已依法批准一定数量的稀土相关物项出口许可合规申请,目前中国稀土出口情况是怎么样的?
- 网络小白如何建立一个网站,供别人下载文件(主要是PDF和MP3)?





