菜单
首页财产ai正文 CLI 以后,人类与 AI 将相忘在江湖 本文讲述作者1992年学Logo语言,2025年批示AI写代码,指出CLI是人机交互自由王国,先容其特性、汗青和于AI时代因透明性再度主要,还有切磋将来语言变化。 2026-03-25 07:54 ·微信公家号:硅基态度骆轶航 AI投资人解读· CLI是人机交互自由王国,具备可组合性、可编程性、文本即和谈三个布局性特性,能让人类与计较机举行开放式协作。于AI时代,CLI因能实现人机双向透明,成为付与人们摸索AI能力自由度的最好界面。· 跟着AI agent成熟,人类对于其监视削减,CLI主要性或者降低;将来呆板间通讯和谈可能从API向A2A蜕变,CLI或者再也不合用。总结:CLI于AI时代因怪异上风重获青睐,但跟着技能成长,其合用性可能变化,投资时需存眷技能蜕变对于CLI运用的影响。内容由AI天生,仅供参考
它是末了一种人类及呆板都能利用、都能读懂的界面形态。
1992年,炎天。我妈给还有是小学生的我报了一个暑期电脑班。
我就是那会儿,于位在交道口的北京市东城区第二十二中学的极新机房里,*次接触到电脑这个工具的。其时进机房要套鞋套,由于电脑怕灰。
20多个差未几年夜的小孩排排坐,眼前是一台台苹果机——绿色字符于黑屏上闪耀的那种。
咱们学的是 Logo 语言。屏幕中心有一只小海龟,你敲一行号令,它就动一步。FORWARD 100,海龟往前走一百步,画出一条线。RIGHT 90,海龟就右转90度。把这两步反复四次,屏幕上就呈现一个正方形。
这是我人生中*次体验到一种非凡的交互:你用文字告诉一个工具该怎么做,它马上照做,你看着成果,决议下一步。
你还有可以把"画正方形"存成一个新号令叫 "SQUARE",以后只要敲"SQUARE",海龟就会主动画一个正方形。然后你可以用 SQUARE 组合出更繁杂的图形。
33年后,2025年10月,人到中年的我,坐于电脑前,对于着打开的 Claude Code 敲下一行字:重构这个网页的 UI。屏幕上最先滚动一行行号令——它读取文件、阐发布局、修改代码、运行测试。
我看着它的每一一步操作,于要害节点决议让不让它继承。
影象秒回到阿谁于蝉鸣、假山、池塘缭绕,位在讲授楼五层的开着空调的电脑房。作为文科生,我已经经那末多年没亲自看着号令行于我的面前这么跑了。
一个小学生批示一只海龟画画。一小我私家批示一个 AI agent 写代码,中距离了33年,但交互布局是同样:人类用号令表达用意,呆板及时履行并展示历程,人类按照成果调解标的目的。
这个交互布局有一个名字。它叫号令行界面,Co妹妹and Line Interface,就是近来颇为风行的 CLI。
CLI 拥有一颗老魂灵,它于计较机交互界面的汗青中已经存于了60多年,于我的小我私家生掷中已经存于了34年。而今天,它宛若婴儿。
CLI 是人机交互的自由王国
许多人对于号令行的印象逗留于黑客影戏——黑屏绿字飞速滚动,键盘啪啪作响,然后一句I'm in。
这个印象不克不及说错,但它掩蔽了一个更基本的事实:CLI 起首是一种用户界面。跟你手机上的触屏、电脑上的图形桌面同样,它是人及计较机之间的一层翻译。
区分于在:图形界面用图标及鼠标翻译,而号令行用文字及键盘翻译。
但"用文字操作电脑"只是外貌。真正让 CLI 于 AI 时代从头变患上主要的,是它的三个布局性特性——
可组合性。于 Unix/Linux 体系里,每一个号令都是一块积木:一块搜刮文本,一块排序,一块计数,一块筛选。这些积木可以拼于一路:搜刮的成果交给排序,排序的成果交给计数,一行号令完成一个繁杂使命。于图形界面里,你能做的事是设计师预先计划好的。而于号令行里,你能做的事是无穷的,只要你会拼积木。
可编程性。就像 Logo 里把"画正方形"存成 SQUARE 同样,号令行操作自然可以被记载、封装、复用。你今天手动敲的十行号令,明天酿成一个剧本主动运行。号令行就是主动化的进口——任何你能手动完成的事,均可以酿成呆板主动完成的事。
文本即和谈。号令行世界里一切都是文本。输入是文本,输出是文本,东西与东西之间通报的也是文本。这看起来是限定,实在是一种极强的同一性——任何东西,只要能读入文本、吐出文本,就能跟任何其他东西协作。不需要提早商定数据格局,不需要专门的对于接开发。文本就是通用语言,是*条约数的和谈。
CLI 不是甚么"更极客的操作方式",它是一种人机交互哲学:你不是于利用一个被预先设计好的体系,而是于跟一套开放的东西集对于话,而且可以随时从头组合它们来解决新问题。
可以这么说,当人们的默许设置是利用既有的架构、软件及东西完成某项使命的时辰,GUI(图形交互界面)是更适合的选项,人们没必要给本身找贫苦。
而当人们需要与计较机举行开放式的协作、创造并接管历程的不确定性的时辰,CLI 是阿谁最适合的界面,它的想象力及履行力没有甚么界限。
不难判定,人与 Agent 的协作属在哪种。
钟摆的汗青
所有的计较机界面设计,暗地里都隐蔽着一套权利秩序:是人姑息呆板的认知,还有是呆板姑息人的习气。前者指向了 CLI,后者指向了 GUI。
而你惊讶地发明,这是一个钟摆。
物理计较时代的GUI(Before 1960s)
于1961年"分时体系"降生前,人与呆板——更多的是传统的物理计较机而非电子计较机——互动是缺少及时性的。
人们用打孔机及批处置惩罚电传打字机处置惩罚重大运算,而打孔卡及纸带就是物理化的比特——你能瞥见它、摸到它。纸带上的孔洞摆列就是步伐的视觉出现。操作员看着一叠卡片的厚度,就年夜概知道步伐有多长;看着孔的位置,就知道数据是甚么。
这就是物理计较机时代的 GUI 图形界面——信息被编码于物理空间里,酿成人类可以用视觉及空间直觉理解的工具。
CLI 的降生及主宰(1960s-1970s)
到了1961年,MIT 的 CTSS(兼容分时体系)让人与计较机的交流变患上及时可交互。整个1960-1970年月,计较机都是经由过程号令行操作的。
1970年月 Unix 操作体系于贝尔试验室降生,C 语言被发现,Unix 被重写后,号令行东西变患上越发可移植、组合及扩大。
这个阶段,CLI 是*的界面。所有人——工程师、科学家、初期的贸易用户——都必需用呆板的语言跟呆板措辞。没有另外选择。
真实的 GUI 时代(1980s-2010s)
就于 CLI 逐渐年夜行其道的1960年月末,属在电子计较机的 GUI 最先萌芽:鼠标、超文本链接、多窗口及视频集会等观点降生。
1973年施乐试验室(Xerox PARC)造出了*台具备图形操作体系的计较机——Alto。乔布斯于1979年看到它的时辰说:"我感觉这是我平生中见过的*的工具"。
以后就是各人认识的故事了:1984年,苹果发布 Macintosh,1985年 Windows 1.0 发布,自此 GUI小我私家电脑最先普和,CLI 利用显著降落。到了1995年的 Windows 95,GUI 基本完成为了对于消费级计较的统治。
CLI 的 中兴 (2010s- )
而又是于 CLI 衰落,GUI 鼓起的1990年月初,Linux 的发布给了 Unix 时代的 shell 及号令行东西创造了新平台,生存并从头点燃了人们对于终端计较的兴致。
而跟着互联网的成长,云计较平台降生并逐渐强盛,CLI 东西于云计较及主动化范畴从头得到主要职位地方。2010年月,Git、Docker及Kubernetes,整个云原生基础举措措施,都成立于号令行之上。
2022年,人类猝不和防线跨入了天生式人工智能时代,AI 的主动化及组合性需求催生了无处不于的 Agent,CLI 再度成为付与人们摸索 AI 能力的自由度最合适的界面。
整个计较机的汗青,就是 GUI 及 CLI 钟摆式切换,界说着人机交互方式的汗青,这真是太美妙了。
GUI 是呆板向人类的让步,把"删除了文件"酿成一个收受接管站图标,把"存储层级"酿成一个个文件夹,把"封闭进程"酿成窗口右上角的阿谁×。
这些空间隐喻极为乐成,让全人类,包括不懂任何技能的人,都能利用计较机。从 Macintosh 到 Windows 再到 iPhone,每一一次 GUI 的进化都是呆板更努力地把本身翻译成人类的直觉。
而 CLI 则是人类向呆板的哈腰,学会一套严酷的语法,记住指令及参数,理解输入输出的法则。
find . -mtime -1 -type f这些字符,比用鼠标打开文件目次,搜刮近来24小时修自新的文件要抽象患上多。这是人类把本身的用意压缩成呆板能无歧义解析的格局,换来切确性、组合性及主动化能力。
而你越姑息呆板的理解能力,呆板给你的自由度越年夜,而这恰是让 AI Agent 更好为人类事情的方式。
CLI 毫不是 GUI 的掉队版本,而是光谱上的另外一个位置。此刻,钟摆的投影又回来了。
一只海龟及一个 Agent
回到1992年炎天,我那高枕而卧,*次打开苹果机,进修 Logo 语言的童年。
Logo 值患上从头审阅,不是由于它是一种好的编程语言——以今天的尺度看它极为简陋。而是由于它于30多年前就展示了一种人机协作模子,而这个模子刚好就是今天 Agent 时代的焦点交互范式。
你对于海龟说 FORWARD 100,海龟画一条线。你感觉标的目的不合错误,说 RIGHT 45。海龟调解了角度。你说 FORWARD 50,海龟再画一条线。你对于成果满足了,把这几步存成一个新号令,下次直接挪用。
Claude Code 也是如许。你说"重构这个模块"。Agent 阐发代码布局,提出方案。你说"别动这个文件,换个思绪"。Agent 调解标的目的,天生新的修改。你查抄改动,说"可以,继承"。Agent 履行下一步。你把适才的历程,天生了一个 Skill。
它们看上去如出一辙,但有一个要害区分。Logo 的海龟只会严酷履行你的号令——走一百步就走一百步,多一步都不会。Claude Code 纷歧样。你说"重构这个模块",它需要本身理解甚么叫重构,本身决议从哪里最先、怎么拆分、先改哪一个文件。
海龟没有判定力,以是不会犯错。Agent 有判定力,以是会犯错。
这就是 CLI 于 Agent 时代最主要的价值。不是效率,不是可编程性,这是它已往就具有的。CLI 于这个时代新的价值,是透明性。
假如一个 Agent 只会逐字履行你的指令,你不需要监视它——就像你不需要监视 Logo 语言下的那只海龟。但今天的 AI agent 有自立判定能力,它会本身决议下一步做甚么。
这象征着你必需能看到它于做甚么。
而号令行,也就是 CLI,是*对于人类及 Agent 同时透明的界面。
对于人类而言,Agent 的每一一步操作——读了甚么文件、改了哪行代码、跑了甚么测试、拿到甚么成果,都以文本情势及时滚动于屏幕上。你不消等它做完再看陈诉,任何一步均可以喊停、发问、改正。
对于 Agent 来讲:CLI 是它的母语。年夜语言模子的底层能力就是处置惩罚文本——理解文本输入,天生文本输出。于号令行里,Agent 读文件、写代码、跑号令、阐发日记,全是文本操作,全是它最擅长的事。它不需要模仿鼠标点击,不需要辨认图标位置,不需要理解空间结构。
这就是 Anthropic 把 Claude Code 做成号令行东西的缘故原由。不是由于工程师偏幸终真个审美——而是由于号令行提供了一种双向透明:人类看患上懂 Agent 于干甚么,Agent 也能无障碍地履行使命。
号令行是一间透明的房间。人及 Agent 都于内里,都能看到对于方于做甚么。而 GUI 做不到——你无法让 Agent 于可视化界面里拖拽图标,同时让人类及时理解它的用意。API 也做不到——它高效但对于人类不透明,你看不到历程,只能看到成果。
于 AI agent 方才最先进入人类事情流的今天,这类人与 Agent 能同享的透明化机制,对于双方都好。
CLI 终于会消散,GUI 也不会再中兴
但透明的房间不会永远被需要。
AI agent 帮你事情了一年,处置惩罚了成百上千个使命而少少犯错,你最先跳过逐行查抄,最先说"直接做吧,做完告诉我"。从盯着屏幕看每一一步,到扫一眼成果就行,再到不消看了我信你。
今天已经经有开发者于 Claude Code 里输入需求,然后去倒杯咖啡,回来看成果就好。Agent 的履行历程正于畴前台退到后台,从及时不雅测酿成异步回首,从慢慢审批酿成过后抽查。
那末,当人类退出这间透明的房间以后,呆板之间会说甚么语言?
简朴回覆是 API。但这个回覆可能太简朴了。
API 的素质是人类预先界说好的左券——你能挪用甚么、传甚么参数、返回甚么格局,全是工程师事前设计好的。它是一本菜单,你只能点菜单上的菜。对于今天的软件体系来讲够了。对于有自立判定力的 Agent 来讲,这是不敷的。
变化已经经于发生。MCP(Model Context Protocol,模子上下文和谈)是一个新标的目的——它不只是让 Agent 挪用固定函数,而是让 Agent 本身发明有甚么东西可用、理解每一个东西的能力、然后自行决议怎么组合。
但这不是结局,实在也很轻易被跳过。再往前一步。当 Agent 不只是跟东西对于话,而是跟其他 Agent 对于话呢?
两个 Agent 协作完成一个使命,通报的不只是数据——还有成心图、上下文、不确定性、优先级及对于危害的评估。
这些工具塞不进一个固定的数据格局。它们之间的通讯更像一种协商:我有这些信息,我的判定是如许,你何处甚么环境,咱们怎么分工。
这就是传说中的 A2A 和谈。
我感觉,A2A 更像是呆板之间的"天然语言",而不是人类可以理解及编译的语言。它是呆板演化的、合适呆板认知方式的语言。布局化但不刚性,有语义理解能力,能处置惩罚恍惚性及上下文变化。
想一想看,假如两个 Agent 之间最高效的通讯方式是直接互换某种压缩的语义暗示——高维向量空间里的一组旌旗灯号——那它们的"语言"将再也不是任何人类能读懂的符号体系。不是文字,不是代码,不是 JSON,而是某种降生在呆板认知空间内部的表达方式。
信赖我,那一天会来到的。咱们终将有一天退出它们的对于话。
而 CLI,是咱们与它们末了的一道沟通樊篱,及接头的灯号。
咱们也不会看到 GUI-CLI-GUI-CLI 的钟摆再一次摆回到 GUI 的一侧,由于这本是计较机汗青及人机交互的一部门。接下来,人机不会再交互了。
配合语言的闭幕
转头看界面演化的汗青,线索很清晰。
最早,人类学呆板的语言——打孔卡、汇编、号令行。然后呆板最先学人类的语言——图形界面、触屏、语音助手。再然后,呆板跟呆板之间成长出了本身的通讯方式——API、数据库和谈、微办事架构。每一一步,人及呆板之间的"配合语言"都于缩小。
CLI 是这条线上的一个非凡节点。它是末了一种人类及呆板都能利用、都能读懂的界面形态。
于它以前,人类不能不彻底用呆板的语言措辞。于它以后,图形界面让人类可以用本身的直觉操作呆板,API 让呆板绕过人类直接对于话。CLI 恰好卡于中间——人类让步了,呆板的输出人类委曲还有能读懂。
Agent 的到来,有可能完全消解这个延续了半个世纪的让步。人类用天然语言措辞,Agent 用本身演化出的方式跟东西及其他 Agent 通讯,年夜语言模子于中间做翻译。没有人需要再说对于方的语言。
也没有人还有能看到房间里发生了甚么。
而咱们今天热中在中兴的,是人类及呆板末了一种配合语言。
【本文由投资界互助伙伴微信公家号:硅基态度授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-今年会jinnianhui官网