程博 | 插件:理解媒介的一个新基点——基于文化技艺理论视角的分析

发布者:复旦大学信息与传播研究中心发布时间:2025-04-17浏览次数:10

内容摘要

本文聚焦插件在计算平台与社会文化交织背景下的崛起,特别是其作为ChatGPT、文心一言等大模型的扩展工具所发生的角色转换。通过结合计算机的历史,从软件研究和文化技艺理论视角分析插件,揭示它如何成为技术革新和社会文化转变的参考系统,并且构成二者交接转化的本体节点和本体操作。在人人皆有望成为开发者的时代,以“原媒介”更新“元媒介”,旨在回归和重构元媒介与计算机的开放性、扩展性和实验性等多重属性之间的关联,探询插件开发作为微观实践调节人类生活世界的可操作性。将插件作为媒介研究新的关键词,为我们理解媒介与社会文化之间的互动和进行媒介实践提供了新基点和新视角。



观点精粹

1

计算平台的形态不断改变,但插件却始终决定着巨型主机系统的表现形式和行为模式。

2

数字媒介的出现完全得益于与人类感官存在接口的插件内化的过程。

3

插件的操作链条不断延伸,计算机的生态系统也处于持续的扩展之中,意图链接整个信息世界。

4

现在人类能够运用插件、编程和想象,在商业逻辑之外去实验巨机器新的媒介可供性。



关键词

插件;软件研究;文化技艺;原媒介;操作本体论





论文正文



一、从19642024

计算平台的变与不变



著名媒介研究学者约翰·彼得斯将1964年描述为“充满喜悦的”“人类思考技术、文化和社会的”好年头。这一年,麦克卢汉的《理解媒介》面世,将技术媒介视作人体器官的延伸,而法国古人类学家徳烈·勒罗伊-古尔汗的《手势与言语》,从进化论角度论述人类生理特征与语言和工具使用能力之间的关系,把人体器官看作是技术的延伸。同年,控制论之父诺伯特·维纳在《上帝与魔像公司》一书中探讨“人类生命和计算机程序合作的神学意义”。彼得斯列举了很多值得媒介研究探讨的作品。总的来说,1964年相关学术论著的基调,是把技术的角色提升到本体的地位。人类开始被视为一种技术生物,媒介成为人类的在世存有,甚至人类文明的历史性构成。



本文延续彼得斯对1964年的相关讨论。与他选择关注这一年的学术论著不同,本文认为更需要关注的是1964年的技术创新。英伟达CEO黄仁勋说:“我们如今习以为常的所有计算技术,都是从1964年开始的。”这一年,IBM豪掷50亿美金开发的IBM System/360计算系统,“开创了兼容性的时代”,为设计、构建和使用计算机系统创造了新的思维方式,甚至无心插柳地建立了第一个平台商业模式。IBM System/360首次将互相独立的操作系统、处理器、外围设备和应用软件等统一在一个架构下,所谓“360”就是“旨在通过一个统一的软件兼容架构来满足所有可能类型的用户”。自此之后,计算机不再只是单纯组件的集合,而是平台。主机制造商、第三方供应商和个体开发者都可以参与扩展通用计算平台的软硬件组件开发,用户也因此能够依据需要自由混合、匹配和定制计算机,机器可以转变为其创造者从未预想过的形态。



一甲子过后,在“千模竞帆”的生成式人工智能时代,大语言模型成为新的计算平台。这次的兼容性目标不再停留在技术范围内,而是意图与用户的日常生活进行全方位耦合,使大语言模型成为社会文化系统运转的数字基座和通用媒介。但是,大语言模型的技术通用性如何转变为社会文化层面的媒介通用性?从已有的实践来看,多个大语言模型厂商都不约而同地将视线瞄准了“插件”,尝试赋予大模型使用工具的能力,并认为“未来,插件将成为大模型的标配,更好地解决用户个性化、复杂化的需求”。如OpenAI将插件看作是延伸ChatGPT的“眼睛和耳朵”,从而联系和影响现实世界。百度则是用插件为文心一言装上“手和脚”,做到“读万卷书,行万里路”。



科技巨头们的默契不止于此,它们在平等地为每个用户提供一个统一模型的基础上,鼓励第三方开发者(包括各类服务提供者、专业数据拥有者,甚至只是有创意有想法的普通用户)自主开发插件,实现个人的智能体自由。OpenAI鼓励人人开发创建自定义版本的ChatGPT(即“GPTs”),其CEO山姆·奥特曼(Sam Altman)表示,全球数百万的开发者是推动过去一年里世界巨变的核心。百度则是直接喊出了“人人皆插件开发者”的口号。百度CEO李彦宏在“Create2024百度AI开发者大会”上,发表了题为《人人都是开发者》的主旨演讲,相信随着“prompt”成为人机交互的主要方式,自然语言有望成为通用的编程语言,开发应用会像拍短视频一样简单。也就是说,“会说话就可以成为一名开发者,用自己的创造力去改变世界。”



将人对插件的开发与整个世界的更新相联系,这在人类文明史上是开创性的。为何是插件?从1964年到2024年,从大型计算机器到大语言模型,计算平台的形态不断改变,但插件却始终决定着巨型主机系统的表现形式和行为模式,即便它们是来自第三方的,且通常是低成本、轻应用、微协调的技术形式。用微软首席技术官凯文·斯各特(Kevin Scott)的话来说,插件是“让PC变得伟大的东西,让互联网变得伟大的东西,让手机变得伟大的东西”。那么从插件进入,是否预示着我们能对1964年就提出的相关议题作出新的回应,为理解和重塑人与技术,特别是人与计算机程序的互动关系开拓新的视角和方法?更关键的是,媒介研究能够在此中作出哪些洞见?



新媒体理论家列夫·马诺维奇(Lev Manovich)判定,媒介研究正被新媒体召唤进入新的阶段——软件研究,在这一全新阶段中需要“借助计算机科学来理解新媒体的逻辑”。具体而言,就是要从计算机科学中寻找一些“新的名词、新的范畴和新的操作来描述媒体的可编程特征”,从而将媒介理论推进到软件理论。本文认为插件理应如马诺维奇所言,能够推进媒介研究所需的新名词、新范畴和新操作,使人们更好理解当下的技术和社会文化形态。所以本文还将从能够“勾连起微观的技术操作与宏观的文化差异和社会变迁”的文化技艺(Cultural Techniques)理论展开对插件的阐释,最终串联起与插件相关的术语、对象、结构和思想,从中尝试提出理解媒介的新基点和新概念,为人类对媒介及其形塑的社会文化进行反向调节提供新的参照。



二、插件:编纂计算媒介的关键词



插件作为一种技术对象或技术形式实际并不新鲜。如浏览器上的多种扩展项、Adobe系列媒体编辑软件中的各色滤镜和插件、手机上的应用服务卡片,等等,插件早已深入人们的日常生活。斯各特的表述并不夸张,插件贯穿了计算媒介的历史演变进程,以至于人们今天总是在与插件打交道。从此插件到彼插件,“即插即用”(plug and play)成为了人们的生活方式。插件在不同的语境中指涉不同的形式,可以是一段代码、一个被封装的对象、一个脚本或者是一个第三方应用程序,也可以是一个音乐合成器、MIDI键盘、外接屏,等等。除此之外,插件无论是在中文语境下还是英语语境下,都有多个称谓,并且彼此之间多可以替换使用,比如插件(plug-inpluginadd-onaddonadd-inaddin)、外挂(pluginhack)、外设(peripherals)、加载项/附加组件(add-on)、附加项(addin)、扩展(extension),等等。由此可见,插件及其变体的身影早已分散在整个互联网乃至现实世界中。从软件研究的方法来看,针对插件的数字话语建构就是要将其看作一个关键词,持续收集和明确有关插件的一系列关联和解释,在不同的术语、对象、结构和思想之间建立联系,使其变得可理解和可操作。



依据大英百科全书的解释,插件(plug-in/add-on/extension)是指“在不改变主机程序本身的情况下为主机程序增加新功能的计算机软件。广泛应用于数字音频、视频和网页浏览,能够使程序员在无需用户脱离程序环境的情况下更新主机程序”。该定义的一个实例来源是1987年一个名为“Digital Darkroom”(一款照片编辑软件,也是最早的数字成像程序之一)的软件的开发人员创造的,他们使用类似超文本逻辑的“XCMD”(外部命令)编程方式来扩展Digital Darkroom的功能,允许后者调用自身应用程序中并不存在的图像创建和修改技术。颇为有趣的是,这一实例也被马诺维奇用于新媒体法则的建构和“软件之后的媒介”的探讨。从中得出的结论认为,计算媒介的本质是开放式的,具有永久可扩展的特征。得益于插件的支持,软件可以实现在程序发布之初未能提供但用户需要的功能。所以在像Google ChromeMicrosoft EdgeFirefox等浏览器中都配置有插件商店,智能手机上的APP store、微信的小程序也是同理。



计算媒介永久可扩展性的背后,是插件已不仅仅是附加组件的事实。程序架构已完全由插件组成,插件构成了软件的本质。基于插件开发的软件应用程序同时具有集成性(integrability)和可扩展性(extensibility)的双重属性。具体而言,应用程序架构被划分为“一组设计稳定的组件”和“一组允许(实际上鼓励)变化的互补组件”,前者具备低多样性和高复用性,后者则是高多样性和低复用性的,两种组件类型通过接口实现连接和交互。具备这种系统架构的程序往往被定义为平台。系统的接口由平台建立,控制着不同组件之间交互的规则。当平台公开自己的接口后,第三方开发者可以编写插件来补充平台原生模式中所不具有的功能或操作。所以,平台与纯粹的应用程序不同,它是一个可以重新编程的系统(这是平台的基本定义),会公开自己的接口以接受由外部开发人员定制的应用程序,从而满足用户的衍生需求。与平台相关的应用程序一般被定义为“连接到平台以扩展其功能的附加软件子系统或软件服务”,是为平台系统增加价值的补充产品或服务。但插件也并不总是对平台的原生功能进行补充,如类似外挂或作弊器这样的第三方插件,接入平台的操作就充满了不确定性。



插件不都是软件,还可以指用来插入电源插座或电路的物件。在20世纪初的技术文献中,插件最早指的就是由晶体管组成的可插拔的电路单元,能够方便机器维护和换新。世界上第一台超级计算机“Atlas”的创新性特征之一就是使用了名为“Extracode”的硬件插件。Extracode可以被插入特殊的插槽中,以添加在硬件层面直接执行的新指令或功能。现在打开作为计算机骨架的主板,最为直观的视觉体验就是所有板块上都分布有数不尽的插槽,这些插槽就是供能够拓展和增强底板功能的插件板使用的。



对插件的开放性支持塑造了新的计算文化形态,使得计算机能够作为一种媒介发挥调节作用。如媒介考古学者尤西·帕里卡(Jussi Parikka)所言,“在经历了20世纪80年代的‘革命’之后,计算机越来越多地被设计成‘插件式’系统,以满足没有专业知识的人的需求。从某种意义上说,这一转向的核心是对计算机的一种新的文化认知和理解。”这种新的文化通常被称为用户友好文化(user-friendly),是由个人计算机“1979三雄”(Commodore PETApple IIRadio Shack TRS-80)和IBM PC所开启的,它们放开了对像音乐合成器、打印机、磁盘驱动器这些外设的支持。外设就是与计算机一起工作但却不属于计算机的单元,它们可以由非程序设计人员即普通用户直接插入至PC预留的扩展卡槽中。我们现在所使用的智能终端,实际就是众多外设完成内置的结果。也可以说,数字媒介的出现完全得益于与人类感官存在接口的插件内化的过程,用户可以使用包括鼠标、键盘、摄像头、语音输入装置、图形用户界面在内的各式插件来完成与计算机的交互。也得益于插件的装配,人类用户才能在连通网络世界和远距空间的同时,保留自然的交互方式。



如果说温思罗普-扬以硬件、软件、湿件的三合一来指称计算机,那么作为湿件的人类同样可以作湿件-插件来理解,特别是随着麦克卢汉“媒介即人的延伸”(“extensions”是插件的另一种代称)反转成为“人是技术的延伸”。ChatGPT和文心一言这样的大语言模型构成了用户神经系统的延伸,但作为大模型的延伸(眼、耳、手、脚)的插件却是由用户开发和组装的。换言之,基于生成式人工智能的个性化AI智能体(AI agent),恰恰不是通过人工智能直接生成的,而是与人类智能体共同生成的,在二者的一次次prompt和响应中生成。所以,是硬件、软件和湿件共同组装为一个完全插件化的生成性系统。我们自然要对《黑客帝国》系列电影中所描绘的未来人类身体与矩阵之间不可自主控制的插拔保持批判性的审视,但在当下,同样不可否认的是,人类或计算系统都必须在与对方反馈耦合的过程中存有和存续。正如温思罗普-扬所总结的,无论是人创造工具还是技术控制人的腐朽立场都应该摒弃。人与技术之间始终存在着最为原始和根本的耦合,新技术只会更强调它是人类的本体论条件,二者共同进化。“最终来说,人类与机器的共同发展为媒介理论划定了界限,媒介理论将不得不认识到这一点。”



三、作为文化技艺的插件:

无尽延展的操作链



通过对插件这一关键词进行梳理,发现本是作为补充角色的插件在计算媒介时代实际拥有着不可忽视的本体地位,并且其范畴是多样化的。但还未能阐明的是,插件是如何获得这种本体角色的?其技术性如何?如何转化为媒介性?德国媒介学者伯恩哈德·西格特(Bernhard Siegert)认为,像插件这般看似微不足道、不引人瞩目,但又构成社会意义基础的技术,与索引卡、标点符号这类通常不被归类为媒介的技术一样,是一种文化技艺。它们可以作为观察、分析智力和社会文化转变的参考系统,也就是将社会文化融入至这些不起眼的技术和实践中,此时的技术就作为媒介发挥作用。如温思罗普-扬所言,文化技艺就是要“将文化、物质——谁知道还有什么呢?——和生物结构解构为由实践、技巧、技术本身和相关行动者组成的操作链”。所以,文化技艺不是某种既定的媒介形式,而是一个不断合成对象的操作过程,但这些对象却往往被认为是社会文化系统中运作的主体,从而拥有了本质化的身份或被认为是本体论的。比如,正是由书写这种技艺,文本和书籍才可以作为一种媒介来运作,是英语中类似“read”“write”这样的与语境无关的动词最终创造了计算机代码。因而,与其说是作为实体的插件取得了媒介本体的地位,不如说是其所蕴含的操作(如plug in/add on/add in/extend)是本体的。所以,对插件的研究既不能从主机程序开始,也不是从某个插件开始,而是将看似内在一致的计算平台,解耦合为一种包含技术、实践、工具和制度程序的操作网络。



从最为通俗的意义上而言,一切借由“插”这个动作来完成操作的物件都可以看作是插件。但受限于篇幅和研究需要,插件操作链的展开将采纳西格特的建议。“任何对文化技艺的最新描述——更准确地说,任何对技术最新状态的关注——都必须建立在对电子和电子媒介的历史性了解之上,它们对现实进行着技术性和数字性的可操作处理。”计算机先驱也是第一位程序员伯爵夫人埃达(Ada Lovelace)曾言,“我们所说的‘操作’指的是任何改变两个或两个以上事物之间的相互关系的处理,这种关系可以是任何类型的。”所以,针对计算机的操作,是一种面向关系网络的动作,使不同的实在相耦合,产生新的系统,包括技术性和社会性的。



在计算机开发的“手工发轫阶段”,也就是20世纪50年代初到60年代中期这段时间,程序员、电子工程师和数学家的工作基本是手工操作。《说文解字》中讲,“插,刺内也。”计算机的一系列实践与手工刺内技能是紧密耦合的。穿孔卡片——最早用于计算机程序和数据输入的媒介——无疑是经由刺内操作所生成的。女性操作员敲动键盘打孔器,每一次敲击都会击穿薄纸卡片,留下的孔位会指向特定的数据和指令。原始的编程形式,也是一种直接在计算机器上进行插接线的物理行为。为了实现特定的运算,女性技术员会将预先布线好的插板(plugboard)插到机器不同的位置上,这会形成不同的电路进而运行特定的程序。穿孔卡片和电缆插接在计算机发展史上的很长一段时间内是一同运行的,如第一台通用计算机“ENIAC”,既支持数百根电缆和插板的转换插拔编程,也使用穿孔卡片进行数据的输入和输出。除此之外,用于构建ENIAC神经元即逻辑电路和存储器的18000个真空管,也是采用可插拔设计。“我们在项目早期就决定了唯一的方法,就是把真空管做成模块化的管子,然后插进去”,计算机科学先驱、ENIAC发明者埃克特(J. Presper Eckert)如是说。自此可编程的计算机正式诞生。如全喜卿(Wendy Hui Kyong Chun)所言,作为动词的“程序”(to program)是ENIAC留给我们的唯一遗产,“可编程性”(programmability)和“可编程的”(programmable)的概念都是对ENIAC的继承。而本文分析得到的是,可编程的计算机的本体架构和编程实践都依赖对插件的操作,程序员、程序和可编程计算机是在技术员-插板-电缆-穿孔卡片的插接操作中生成的,又一并组成了新的操作链。



作为一种文化技艺,插件在计算机历史中的演变不止于ENIAC1957年之前,借由插接动作得到命名的“plug-in unit”,只是指一种需要工程师手工接线并焊接的电子元器件,且出于封装的需要,插件的类型、数量都被要求保持在最低限度。20世纪60年代,身为大型计算机行业领导者的IBM,决定对大型机做彻底的重新设计以实现规模化生产。在公司内部推出了“标准模块化系统”(Standard Modular System),要求将先前为了机器维护方便,仅支持直接替换个别组件的插拔设计,推广至计算机的所有电路。所有的插件单元都必须具有“相同的尺寸、元件(晶体管、电阻器和电容器)、布线和连接引脚,以便任何‘可插接’(pluggable)电路都可以与其它任何电路交换”。这样一来,IBM生产的所有计算机组件之间都具有即插即用的“插接兼容性”(plug-compatible)。IBM把这种标准化的、高可互换性的插件单元重新命名为模块,并决定在公司内部全力以赴地实现“模块化、可扩展性,或者说开放性”。插件的操作链和操作网络自此不断延伸。从1958年开始,IBM生产线上的电路、SMS卡、主板、电源、存储器、框架和外壳等都实现了标准化和模块化,还设计了50个新的计算机硬件、数千个软件程序和一套新的制造设备。到了1964System/360发布时,硬件、软件不相兼容的碎片化世界就被蚕食瓦解了,插接技艺重组了计算机产业。



IBM将插件标准化和模块化的设计不仅被动地定义了计算机的开放式架构,也奠定了信息时代整体操作网络的基础。首先,随着IBM将标准模块化系统应用在自身系统设计、生产、管理和劳动力供应的所有环节,这一理念也由内而外地渗透至计算机生产的整个产业生态系统,“硅谷模式”由此诞生。IBM对有关模块的结构、接口和标准的公开,为依靠IBM生存的第三方公司自主创造模块提供了技术上的可能性,他们生产的硬件和软件外设可以在遵守IBM设计规则的前提下直接插至IBM计算机中。以至于IBM20世纪80年代决定进军个人计算机市场时发现,组件都是现成的,组装所需的大部分硬件、操作系统和应用软件都可以直接向外围供应商购买。因而那台奠定了个人计算机技术标准的IBM PC(此后PC成为它的专属称谓)短短1年时间就上市了。这一收获也让IBM大呼,“设计成开放系统的PC是由第三方硬件和软件来定义的”,个人计算机市场的繁荣取决于对开放设计的维护。时至今日的人工智能时代,智能计算产业仍是“由一系列技术标准和知识产权将材料、器件、工艺、芯片、整机、系统软件、应用软件等”紧密耦合在一起的技术网络。



更重要的是,IBM PC的成功,有力地证明了“创新性技术产品系统可以通过重新组合模块产品(即技术要素)加以实现”。这一发现,随着上万名IBM工程师跳槽和在硅谷创业,成为了加州意识形态和硅谷话语的核心组成。可以说,硅谷就是一个围绕可扩展的通用计算平台所形成的内在插接兼容的递归循环系统,工程师和创业者们从事的完全就是插件的设计、开发和组合,包括硬件和软件。这一新兴的计算机产业集群,其日常操作就是,“一方面以试错的方式持续改进和重新定义组合各类对象而形成的模型,另一方面又通过增加新近设计的要素来丰富对象的种类。”由此循环往复,插件的操作链条不断延伸,计算机的生态系统也处于持续的扩展之中,意图链接整个信息世界。



马诺维奇会把模块化看作是新媒体的核心法则是情理之中的事情。因为他发现,到了21世纪,除了计算机的物理层之外,为了提高软件的重用性、灵活性和扩展性,面向对象的程序设计语言、结构化的计算机程序设计也是模块化的。到了应用层则更是如此。从多媒体电影、插入了非文字格式对象的word文档到超文本标记语言文件,乃至整个万维网,都是模块化的。当计算机的所有层级都是模块化的,无论是何种类型的用户,其通用和基础的操作就是运用插接技艺编织自己的媒介系统。



这一切从IBM决定全面实行插件标准化就预见到了,“标准有时使我们失去最新和最具创新性的技术,但是当一个标准同时包含硬件和系统软件时,它也为第三方软件和外围设备的蓬勃发展奠定了基础。随着软件基础以及硬件附加组件的增加,标准化机器几乎可以完成任何类型的计算任务。到那时,无所不能的标准机器会成为人们的必然选择。”用户已经做出了自己的选择。当基于Transformer这种可扩展的通用架构的大模型厂商,许诺人人都可以是开发者时,规模法则(scaling laws)在用户端上演。回应大模型厂商的是上亿用户、千万日活以及每分钟都在产生的AI原生应用,后者范围涵盖学习、工作、购物、游戏、情感、命理等几乎所有的文化和社会领域。用户现在不只是消费者,而是计算操作网络中的“制造-使用者”(maker-user)和“设计-使用者”(designer-user),亲身实践着技术通用性向媒介通用性的转化。



相比于《黑客帝国》中的世界,插件不只是充当着人类身体与矩阵虚拟现实之间的物理接口,而是矩阵本身。从计算机组件、个体化的计算机、计算机生产线、计算机产业集群,到软件程序设计、多媒体、互联网,再到人工智能、大模型、AI原生应用,凡此种种。插件的接引脚在技术-社会-文化系统中无处不在。现在不仅是计算机追求即插即用和插接兼容,人类的生产、生活及其文明都取决于插件的装配和生成。人类对混合现实的一切体验都在插拔之间。斯各特·拉什(Scott Lash)的分析恰如其分,人类如今都是以人机接口为操作方式的技术生命。在连接有机体系与科技体系的同时,“总是对又一个联结、一个附录的可能性开放。”非线性的“附加率”(additivity)取代了线性的因果率,行动者之间都是附加关系(adding on)。所以,“+”及其符号变体在计算世界中随处可见,包括加载扩展、上传文件、附加链接和知识库、添加朋友等等。人类主体只有在对插件的技术性操作中,才能成就自己的社会性,进行社会文化的生产。



四、从元媒介到原媒介:

人人皆可为开发者时代的来临



构成计算系统先验程序的插件,为计算机附加了可编程的本质属性和原生特质。可编程性又赋予了新媒体“不死性”,其新就在于“更新”,始终作为一种“未来媒介”存在。而随着软件程序在社会各个层面的广泛渗透和重组,可编程也早已超越了程序员以纯粹的代码指令编写配置软件程序的狭义内涵,成为了人们通用的经验加工系统和参考体系。广泛的用户参与和协作推动着人类世界“可编程的愿景”。现在是“生存即更新”,人和非人行动者的在场和存在就是“更新和受更新的影响”。媒介研究同样要与人类操作和技术演化一起更新。因为,不再存在一种可以占据独属于批判的本体论层次的批判。一切批判都不过是“能够为重新组构这样一种物质的、人类的、生物学的和社会的生命/生活形式做出卑微的贡献的那种附录”。理论同其阐释的对象一样都是附加和补充性质的。



可编程的新媒体是一个拥有自己新型标准和体制空间的领域。一开始,马诺维奇把新媒体阐述为包含计算机层和文化层并且相互影响的层级性组合。包含指涉“原始媒体结构(电影、建筑空间、音轨)”的对象语言和指涉“允许用户生成描述和更改原始媒体结构的软件工具”的元语言。以“跨码”的格式转换重建着文化的计算机化,即“在含义和(或)语言层面,文化的范畴和概念可以替换为计算机的本体论、认识论和语用学所衍生的新范畴和新概念”。这样一来,计算机的可编程性就从媒介视角转译为“跨码性”,马诺维奇用“元媒介”(meta-media)来对此进行特别指称。计算机作为元媒介的本质就是“模拟其他媒介的能力”。但此一阐述存在的问题在于,计算媒介完全被简化成了一个只是整合旧的模拟媒介技术的新型媒介,是将已知的和熟悉的媒介再中介化为看似美妙的数字化的东西,计算媒介的本体属性并没有得到揭示。



随着代码软件成为“我们与世界、与他人、与我们的记忆和想象的接口——世界赖以沟通的通用语言和世界赖以运行的通用引擎”,马诺维奇不得不更新对元媒介的认识,更准确地说,是将计算机的可编程性从跨码性复归到插件的本体操作上。马诺维奇认识到,软件与20世纪的工业产品所存在的最大不同在于,前者是高度可塑和可延展的,特别是在面向对象编程作为一种软件开发范式和计算的方法论普及开来以后,“可以描述的一切事物都能由单一行为组成块的递归组合来表示”。这允许程序员通过创建、分发和复用离散的封装对象进行软件的发明创造,也就是一切都可以被模块化进而“从称为功能或过程的可复用的小部件设计计算机程序”。以往各式媒介的独特属性或技术特征现在都成为可以在计算机中被组合构建的软件模块。一如最早使用“元媒介”这一概念且同时是面向对象编程的发明者艾伦·凯(Alan Kay)所说,“元媒介,其内容将会是各种已经存在的和尚未发明的媒介。”过去、现在和未来媒介的组合使起源自IBM的“硅谷模式”成功延伸至媒介创新的领域,“‘新媒体’之所以‘新’,是因为新的属性(即新的软件技术)总是可以很容易地添加到其中。”所以Microsoft WordAdobe Photoshop等这些原始版本可以追溯到20世纪80年代的应用程序至今还在更新,而像ZoteroObsidian这样的新兴科研和文本编辑软件,则一开始就将插件的自由组合作为提升用户体验的核心手段。



虽然马诺维奇借由重新定义软件的插接本质而更新了对元媒介的理解,但同跨码性和层级性相耦合的元媒介并不与插接技艺相兼容。比如,计算媒介的开放性和扩展性使得针对其的媒介研究很难通过单纯聚焦媒介技术本身的方法来完成,以至于元媒介既无法解释个体基于各种开源模型的个性化媒介的开发过程,也无法回应行将到来的自然语言取代代码成为编程通用语言的现实。此外,“meta-”μετά)这一希腊语前缀蕴含着一种对一切存在者更高抽象层级上的存在的讨论,但计算媒介的本质恰恰是非本质的或去本体论的。用西格特的话来说,计算媒介是一种插接操作本体,是在由插件驱动的集成涌现中获得定义和再定义,而这一过程是持续进行的。所以现在的问题就转变为我们该如何从操作本体论出发重新概念化“软件之后的媒介”,或者说如何定义永久可扩展的媒介。其实在马诺维奇自己的多本著作中,已经提及了更为合适的概念——“原型”(prototype)。原型是技术在开放式交互过程中某些保持不变的内核、结构,不同的软件版本总是基于原型来不断地衍生,所以原型也往往是某一范畴中最原始和最具有代表性的成员,如ChatGPT之于GPTs



随着软件研究领域的逐渐开拓,原型在马诺维奇的潦草使用之后被吸纳为新的关键词。更关键的是,原型设计的运作模式与插件的操作链几乎无缝兼容和耦合。原型最常出现在实验室、产品设计和创客文化的讨论中,其一般定义是“有形地展示一个想法以测试其可能性,并与利益相关者(经理、合作者、潜在用户)分享”,指涉范围包括“表达、表现或思想的中介;用于共享、协作、沟通、测试的工具;论证和愿景的体现;行动或讨论的道具”。原型因而可以说是一种通过众包组织进行发明创新的成长性平台,其操作网络同样是行动者、器具和技艺的配置。



不止于此,与计算机的开放式架构和永久更新一样,原型也具有“开放性”(openness)和“虚构性”(fictionality)的双重属性。开放性是指原型对转换和变形保持开放,其本有的不完成性(incompleteness)鼓励涉众“玩乐”(play),希冀玩家在与原型互动的过程中不停地反馈需求,实现产品更新迭代。应用市场上的“beta版”“测试版”等就是基于原型的开放性考量发布的“有缺陷”程序,内测用户成为产品完善的必要一环。虚构性则是指原型通常是对想象场景的物质化呈现,是一个可以发展、探索和具体化假设的试验场,以图开辟新的研究领域或创造新的可能性。早期的谷歌眼镜、近来大热的苹果Vision Pro以及要取代智能手机和APPAi PinRabbit R1等都属于意图开辟某一新型产品市场的原型机,是面向未来的实验性预测或有待进一步开发的创新提案。所以综合来看,原型通常是“不稳定的、临时的、不确定的、不统一的、易于转换和重新定义的,处于一个动态的生命周期中,在已造和未造之间存在”。这与艾伦·凯最初所定义的元媒介意涵产生了共鸣,“元媒介是活跃的——可以对质询和实验作出回应——而这些过程也将让学习者参与双向对话”。



因而或许可以用“原媒介”(proto-media)来复归元媒介与计算机的复杂关联,凸显其开放性、扩展性和实验性等多重本体属性,并能支持和动员多元行动者的协作操作。原媒介同各品牌的原型机一样,其于人类社会的意义不在于自身的技术进步,而是人们在其基础上衍生扩展出的后续操作。以计算技术为内核的原媒介将始终处于一种可编程和再编程的状态,等待被发明创造出新的媒介形态和交互实践。因此可以说,原媒介将重新定义一个“技术性的精神和实践的世界”,人们通过彼此的发明创造来进行沟通,始终保持着对技术重新组合和再构的关注。如ChatGPT的“GPTs store”、字节跳动的“Coze”以及腾讯的“腾讯元宝”平台,作为生成式人工智能时代的“APP Store”,面向所有开发者开放,可以基于各厂商的大模型自由创建、分享和使用个人开发的插件、bot、智能体。



事实上,从ENIAC确立插接的可编程本体操作,到计算媒介的永久可扩展性即永远更新的不死性,操作链上的行动者们所打交道的一直是原媒介。只是借着人人皆开发者的时代契机,我们才发现,用户从未与一个处于完整和完成状态的媒介交互过,硬件会换代,操作系统和应用程序会更新。所以硅谷有“原型之地”之称,工程师、设计师、经理和营销团队夜以继日地生产着硬件、软件和其它有关技术文明概念的原型。而现在,无论是因为技术的进步,还是科技厂商追逐市场的需要,原媒介的编程接口开始向普通用户开放,开发方式和价值定位都发生了改变。据艾伦·凯自述,他发明面向对象编程和产生计算机作为一种媒介的想法,是因为他想让儿童也能参与编程,计算机媒介必须足够重视普通用户的编程能力。



时至今日,计算技术的迭代使编程拥有了更为广义的内涵,自然语言成为继能源、信息之后的又一新生产力。以往常常由艺术家所扮演的媒介先锋的角色,现在既可以是OpenAIAdobe和百度这般的技术机构,也可以是独立程序员、黑客和设计师等掌握一定专业技能的少数人群,更可以是几乎没有编程知识储备的普通用户。例如上述提到的ChatGPT和文心一言,通过开放插件支持和无代码编程,允许用户和开发者创造个性化的应用。这些插件可以是简单的问答模板,也可以是复杂的交互式故事生成器,它们扩展了模型的边界,使得大模型成为一个可由用户根据需求不断更新和定制的原媒介。而科技厂商们也都坦言,大模型本身实际毫无价值,真正使社会受益的是人们基于大模型开发出的各种服务和应用。自由软件和开源运动数十年的资源和文化积累,也在被激活和扩散,开发插件以更新和差异化原媒介将成为软件社会里的操作日常。马诺维奇也不得不感叹说,新媒介的发明从未像今天这般容易,可以由一个人或一小群人开发并便捷地向外传播。由插件矩阵构成的媒介文明正在涌现,每个人的自我表达、需求和创意都可以在快速开发出的插件中获得满足和具现。



永久更新的原媒介,人人皆开发者的时代承诺,全球硅谷对全球工厂的取代,所有这些变革都是插件技术不断迭代升级所催生的媒介生态革命。用菲利克斯·加塔利的话来说就是,人类的抽象生命力与蕴含无尽潜能的“原-机器”(proto-machine,用具、器具、最简单的工具、机器最小的结构零件)将组合成机器装配的新链条,以“链接的种种横组合关系”激活新的社会文化形态。作为原-机器的插件将同时兼容人类有机体和计算系统,成为二者耦合的接口,三者互为本体性构成。其中任意一元的操作都将带动系统整体的变化。考虑到接近性和易用性,人类能动的自我更新将主要通过主导插件开发来驱动。



在社会文化形态层面,拉图尔的《实验室生活》正在转变为“生活实验室”(living labs)。实验室以原型开发替代了论文的生产,是原型指涉内容的空间化体现和原型常态化生产的主要场所。这其中存在着一种双向运动。首先,纯粹自主的科学现在“下降”到“技术性科学”(techno-science)的层次;其次,日常社会关系则“上升”蜕变为本身就是实验室生活的形式。一言以蔽之,科学和社会现在都是技术性的。不仅是媒体实验室、人文实验室、黑客实验室、科技孵化器、创客空间等机构在社会中创造了“实验室热”(Laboratory Fever),而且是人类的整个生活世界已经以实验室为原型进行了改造(如智慧城市),加速着技术革新与社会文化的开放融合和交接转化。所以在后大众媒介时代,不是人人都有麦克风,而是你我皆可为插件开发者,作为插件、开发插件、组合插件,才能作为非异化主体从科技厂商和专业机构对改变社会的技术操作垄断中逃逸而出,接入能动更新世界的进程。



五、结 语



麦克卢汉说,在提供“自助工具包”(do-it-youself kits)蔚然成风的后文字时代,“观众或读者现在必须成为共同创造者”。其预言家的身份再一次坐实。并且他认为,“两种媒介杂交或相汇的时刻,是发现真理和给人启示的时刻,由此而产生新的媒介形式。”因而有理由期待,插件与原媒介之间的互操作,会为人们提供洞察真理和获得启示的可能,并实现自下而上的媒介涌现。意大利哲学家科西莫·亚卡托(Cosimo Accoto)的总结恰到好处,“proto-”将会取代“post-”成为新时代的标志性前缀和新的技术-社会-文化系统的起点。“‘proto-’(原)意味着对一个潜在的未来持开放态度,而不仅仅是尾随一个时间线序列;对各种可能性的突显持开放态度,而不是尾随一个预定未来的现阶段而已。”插件的可操作本体论就是为实践这一时代理念,支持实验、思辨设计和日常生活畅想的操作网络。这是一个混合实验室,将机器、基础设施、行动者、空间和各种想象集成在一起,配备有一个包含物质、符号、身体和文化的完备技艺工具箱。拉图尔曾有言,“给我一个实验室,我将举起全世界。”现在人类能够运用插件、编程和想象,在商业逻辑之外去实验巨机器新的媒介可供性。哪怕只是轻微的调节和转换,得益于操作链的绵延,也将构建与现有世界相异的未来。



至此也可以回答,什么是面向未来的批判?又如何做到批判性重组?技术哲学家吉尔贝·西蒙东(Gilbert simondon)将工人的异化归因于其机器调节者身份的丢失,他们被禁止调节机器,不能在操作机器时进行延伸发明。“只有当人以操作者和操作对象的双重角色介入技术活动时,才能跨越中心化的门槛,进而实现‘非异化’。”人与机器的正确关系应是彼此紧密耦合,进行持续的发明和创造,社会结构和心灵构成都是在此互操作中生成。所以,在可扩展的通用型媒介行将胜利的情景下,媒介批判绝不是一种家长式的说教,而是向全社会发出更为开放的思考邀请,鼓励能动主体通过开发插件去物质化地实验一种技术文化。这要求在人人皆开发者的时代,所有人都要有“思辨设计”(Speculative Design)的思维。任何人都可以对当下看似理所当然的技术系统进行质询和挑战,从工具主义和决定论的逻辑框架中跳脱出来以想象未来,以不被现实因素局限的玩乐式思维去展开所有的可能性。这不是臆想或感性的艺术想象。作为思辨技术哲学的形式之一,思辨设计是指“思辨是抽象的,集中在思维层面;设计是具体的,落实在实践环节”。原媒介就是链接实践操作和抽象思维过程、支持无限扩展的平台。它由已经存在的和尚未发明的插件所构成,是耦合开发者想象力和现实技术世界的递归循环系统。开发者们要做的,就是从理性出发(只需要对既存世界有所了解即可),通过插件开发,对原媒介进行调制和再编程,实现自我与技术-社会-文化系统的更新与重组。



作者简介:程博,复旦大学新闻学院2022级博士生。
[版权声明]本文章发表于《传媒观察》2024年第8期。本文由作者授权发布,未经许可,请勿转载(个人转载不在版权限制之内)。如公开出版机构需转载使用,请联系刊发杂志及作者本人获得授权。
[用格式]程博。插件:理解媒介的一个新基点——基于文化技艺理论视角的分析,2024年第8期。