1. 模型概述:当AI大模型遇见苹果自动化生态
Siri Shortcuts MCP服务器是一个基于模型上下文协议(MCP) 的桥梁工具,它的核心使命是让支持MCP的AI大模型(如Claude、GPT等)能够直接访问和操作你macOS系统上的所有Siri快捷指令。
你可以把它想象成一个“翻译官”或“接线员”。AI模型说:“我想运行一个快捷指令”,MCP服务器就负责把这个请求转换成macOS系统能听懂的命令,并调用相应的快捷指令来执行任务。
1.1 能力评估:你的AI助手能做什么?
这个服务器的能力完全取决于你macOS上已经安装和创建的快捷指令。它本身不创造新功能,而是将现有功能暴露给AI。其核心API接口主要有三个:
-
list_shortcuts:侦察兵。无需任何参数,调用后返回一个包含你Mac上所有可用快捷指令名称的列表。这是AI了解你“武器库”的第一步。 -
open_shortcut:导航员。需要输入一个快捷指令的name(名称)。它会在macOS自带的“快捷指令”App中打开指定的指令,方便你查看或编辑其内容。 -
run_shortcut:执行官。这是最主要的功能。需要输入要运行的指令name,并可选择提供一个input参数(文本或文件路径)。AI通过它来真正执行任务,比如发送消息、处理文档、控制智能家居等。
更智能的是,服务器会自动为每个已发现的快捷指令生成一个专用工具。例如,如果你有一个名为“Fetch Weather”的指令,服务器就会创建一个叫run_shortcut_fetch_weather的工具,让AI调用起来更直观。
1.2 技术特点介绍
-
基于MCP协议:这是由Anthropic提出的、旨在统一AI访问各种数据源和工具方式的开放协议。苹果已在iOS/macOS的测试版中开始整合此协议,意味着该项目走在了生态融合的前沿。
-
动态工具生成:无需手动为上百个快捷指令编写接口,服务器自动扫描并生成对应工具,极大降低了配置复杂度。
-
依赖系统原生能力:其底层实际上调用了macOS系统内置的
shortcuts命令行工具,稳定性和兼容性有较好保障。 -
平台局限性:目前仅支持macOS。它无法在Windows、Linux或其他非苹果系统上运行,因为它深度依赖macOS的快捷指令生态。
1.3 应用场景
-
语音助手的超级延伸:将复杂的多步操作(如“准备会议”:静音手机、打开文档、查询天气、预约会议室)打包成一个快捷指令,然后只需对AI说一句话即可触发。
-
AI代理的“手和脚”:让AI在自动化工作流中扮演决策中枢。例如,AI分析邮件后,可自动运行“保存附件到指定文件夹并通知我”的快捷指令。
-
个人效率倍增器:通过自然语言指挥AI处理日常高频任务,如整理截图、快速发微博、生成工作报告初稿等。
-
智能家居语音控制中枢:结合家庭自动化快捷指令,用更自然的语言通过AI控制家居设备,超越Siri原有的固定指令集。
2. 安装与部署:一步步激活你的AI“魔法棒”
目前,该服务器仅支持在macOS系统上部署和运行。以下是在macOS上的完整安装配置流程。
macOS系统配置与安装流程
前置条件检查:
-
确保你的Mac系统版本较新(建议macOS Monterey 12或更高版本)。
-
已安装 Node.js(版本16或以上)。可通过终端运行
node -v检查。如未安装,请访问 Node.js官网 下载安装。 -
已在“快捷指令”App中创建或安装了一些可用的快捷指令。
安装步骤:
-
打开终端:在“应用程序” -> “实用工具”中找到“终端”,并打开。
-
全局安装MCP服务器:在终端中粘贴并执行以下命令。
npx命令会自动从网络获取并运行该服务器包。npx mcp-server-siri-shortcuts
首次运行可能会提示安装依赖,请按提示确认。
-
验证安装:如果命令执行后没有报错,并出现服务器相关的日志信息(可能包含本地端口号),说明服务器已成功启动。
配置AI客户端(以Claude Desktop为例):
要让AI模型(如Claude)使用这个服务器,需要在AI客户端的配置文件中进行连接。
-
找到Claude Desktop配置文件:
-
打开Finder,按下
Shift + Command + G,输入路径~/.config/claude/,然后前往。 -
找到并编辑
claude_desktop_config.json文件(如果不存在,可手动创建)。
-
-
添加服务器配置:在配置文件中加入以下JSON结构。如果文件已有内容,请将
mcpServers部分合并到顶层对象中。{ "mcpServers": { "siri-shortcuts": { "command": "npx", "args": ["mcp-server-siri-shortcuts"] } } }
-
重启客户端:完全退出Claude Desktop应用,然后重新启动。
-
连接测试:重启后,在Claude的对话窗口中,你可以尝试输入指令,例如:“帮我列出我Mac上所有可用的快捷指令。” 如果配置成功,Claude将调用服务器并返回指令列表。
常见问题与解决:
-
command not found: npx:说明Node.js未正确安装或环境变量有问题。请重新安装Node.js,并确保终端重启。 -
Claude无法调用工具:检查配置文件路径和格式是否正确(JSON语法无错误)。确认服务器在后台运行(重新执行安装步骤2的命令)。
-
快捷指令列表为空:确保“快捷指令”App中至少有一个已启用且未损坏的快捷指令。在“快捷指令”App的设置中,检查“高级”选项里“允许运行脚本”是否已勾选。
其他系统说明
-
Windows系统:目前不支持。由于核心依赖macOS的
shortcuts命令行工具和沙盒环境,无法在Windows上直接运行。唯一的间接使用方式是远程连接至一台已配置此服务的Mac。 -
Linux系统:同样不支持。原因与Windows相同。
-
iOS/iPadOS:虽然Siri快捷指令的核心在移动端,但此MCP服务器本身无法安装在iOS/iPadOS上。不过,有迹象表明苹果未来可能将MCP协议深度整合进系统,届时或许有新的使用方式。
3. 配套客户端:连接AI的主要门户
-
客户端名称:Claude Desktop(官方推荐且已验证)
-
是否付费:免费。Claude Desktop是Anthropic提供的免费桌面应用程序。
-
配置方式:如上文“安装与部署”部分所述,通过编辑其JSON配置文件进行连接。
-
下载地址:访问 Anthropic官网的Claude下载页面 获取对应macOS版本的安装包。
-
其他可能支持的客户端:任何支持标准MCP协议的AI客户端或IDE插件理论上都可以配置使用此服务器,例如Cursor编辑器、支持MCP的VS Code扩展等。配置方法类似,均需在相应设置中指定服务器的启动命令。
4. 案例讲解:构建一个智能回复助手
让我们模拟一个实际场景:你正在忙碌,需要快速、得体地回复工作邮件或信息。我们将创建一个快捷指令,并用AI通过MCP服务器来驱动它。
第一步:在macOS上创建基础快捷指令
-
打开“快捷指令”App。
-
点击右上角的“+”新建一个快捷指令。
-
将其命名为“智能生成回复”。
-
添加以下操作:
-
操作1:“要求输入”(类型:文本),提示语设为“请输入需要回复的原始内容或问题:”。
-
操作2:“运行JavaScript”。我们将在这里编写一个调用AI API(如DeepSeek)的简单脚本。
-
-
在“运行JavaScript”的操作中,粘贴以下代码。你需要将
YOUR_DEEPSEEK_API_KEY替换成你自己的API密钥(可在DeepSeek官网申请)。// 从上一个“要求输入”操作中获取文本 let inputText = config.runner.shortcutInput; // 定义调用DeepSeek API的函数 async function run() { const apiKey = 'YOUR_DEEPSEEK_API_KEY'; // 请务必替换! const response = await fetch('https://api.deepseek.com/chat/completions', { method: 'POST', headers: { 'Content-Type': 'application/json', 'Authorization': `Bearer ${apiKey}` }, body: JSON.stringify({ model: 'deepseek-chat', messages: [ { role: 'user', content: `请根据以下内容,生成一段专业、礼貌的回复。如果是问题,请直接给出答案;如果是陈述,给予恰当回应。内容:${inputText}` } ], max_tokens: 500 }) }); const data = await response.json(); // 将AI生成的回复内容,设置为快捷指令的输出 return data.choices[0].message.content; } // 执行并返回结果 run();
-
操作3(可选):“拷贝至剪贴板”(将上一步JavaScript的输出拷贝)。
-
操作4(可选):“显示通知”,提示“回复内容已生成并拷贝!”。
-
完成后保存。务必先手动运行测试一次,确保快捷指令能正常工作。
第二步:通过AI和MCP服务器调用
-
确保
mcp-server-siri-shortcuts服务器正在运行,且Claude Desktop已按前文配置好。 -
在Claude中,你可以这样下达指令:
“请运行名为‘智能生成回复’的快捷指令。需要回复的输入内容是:‘客户王先生来信问,之前提到的项目方案本周五前能否交付,他希望有个确认。’”
-
Claude会通过MCP服务器调用
run_shortcut工具,并附上输入文本。快捷指令执行后,会将生成的得体回复(例如:“尊敬的王先生:您好!项目方案正在按计划进行最终复核,预计本周四下午可以完成,我们会在周五上午10点前准时发送给您。感谢您的耐心与关注!”)返回给Claude。 -
Claude再将这个结果呈现给你。你可以直接复制使用,或者指示Claude在此基础上进一步修改。
这个案例的亮点在于:你将一个需要打开邮箱、思考措辞、打字回复的多步流程,简化为对AI说一句话。AI负责理解上下文和触发自动化脚本,而复杂的API调用和逻辑封装在快捷指令中,两者各司其职,效率倍增。
5. 使用成本与商业价值
使用成本评估
-
直接经济成本:极低。
-
Siri Shortcuts MCP服务器本身是开源免费的。
-
主要的潜在成本来自于你在快捷指令中集成的第三方服务的API调用费用(如案例中使用的DeepSeek API,或可能用到的OpenAI GPT、邮件服务、云存储等API)。这部分成本完全由你使用的服务商决定,且可控。
-
目前没有证据表明苹果会对通过此方式使用Siri快捷指令收费。
-
-
技术与时间成本:中等。
-
学习成本:需要理解MCP的基本概念、Node.js环境配置,以及macOS快捷指令的编辑。对于有一定技术背景的用户,门槛不高。
-
维护成本:需要维护快捷指令的可用性(如API密钥更新、第三方服务变更等)。MCP服务器本身更新不频繁,相对稳定。
-
商业价值与前景
-
对个人与开发者的价值:
-
效率工具:是连接前沿AI能力与成熟操作系统自动化生态的强力粘合剂,能显著提升知识工作者的工作效率。
-
创新沙盒:为开发者提供了一个低成本试验场,可以快速原型化“AI代理+系统操作”的应用场景。
-
-
对苹果生态的战略意义:
-
补齐Siri生态短板:长期以来,Siri相较于Alexa和Google Assistant,在第三方服务接入和复杂任务处理上被视为短板。此类工具通过“捷径”巧妙地绕过了自然语言理解的难题,让用户和开发者自行定义高价值任务,极大地扩展了Siri的能力边界。
-
拥抱MCP开放协议:苹果在系统层面开始整合MCP,表明其正以更开放的态度,让自家生态成为AI大模型落地的重要平台。这有助于吸引开发者和AI公司围绕iOS/macOS构建下一代AI应用。
-
未来的盈利想象空间:分析指出,深度AI整合后的Siri可能成为新的收入渠道。例如,在用户发出“帮我订餐”指令时,Siri可以优先推荐与苹果有商业合作的平台,或通过竞价排名方式产生广告收入。虽然当前这个开源项目本身不涉及此类商业行为,但它所代表的技术方向与苹果的潜在商业策略高度吻合。
-
总结:Siri Shortcuts MCP服务器是一个精巧、专注且极具前瞻性的开源项目。它本身不是一个大而全的解决方案,而是一把精准的“钥匙”,为特定人群(macOS用户、AI爱好者、效率追求者)打开了用自然语言驱动系统级自动化的大门。虽然受平台限制,但其体现的“AI作为大脑,系统自动化作为四肢”的理念,正是人机交互未来发展的一个重要方向。对于苹果用户而言,它是当前就能用上手的、提升生产力的利器;对于观察者而言,它是窥见苹果AI战略下一个落脚点的有趣窗口。

关注 “悠AI” 更多干货技巧行业动态