冷水工具箱

Open Computer Agent 是 Hugging Face 推出的免费云端 AI Agent 工具。支持在 Linux 虚拟机中运行，基于预装的程序（如 Firefox）完成用户指定的任务，例如用......

Mistral Medium 3是Mistral AI推出的多模态语言模型。模型在性能和成本之间实现平衡，接近甚至达到Claude Sonnet 3.7模型的性能水平，成本仅为后者的1/8（每......

oli 是开源的智能代码助手，支持为开发者提供强大的编程支持。基于现代化的混合架构，结合 Rust 后端的高性能和 React/Ink 前端的交互式终端界面。oli 支持多......

Klavis AI 是一个开源的 MCP（Multimodal Communication Protocol，多模态通信协议）集成平台，帮助 AI 应用快速接入生产级的 MCP 服务器和客户端。平台提供......

FlexiAct是清华大学和腾讯ARC实验室联合推出的新型动作迁移模型。FlexiAct能在给定目标图像的情况下，将参考视频中的动作迁移到目标主体上，在空间结构差异较......

ICEdit（In-Context Edit）是浙江大学和哈佛大学推出的指令式图像编辑框架。基于大规模扩散变换器（Diffusion Transformer）的强大生成能力和上下文感知能力......

Amazon Nova Premier 是亚马逊推出功能最强大的多模态 AI 模型，能处理文本、图像和视频输入（不包括音频），擅长处理需要深度理解上下文、多步骤规划以及跨......

VPP（Video Prediction Policy）是清华大学和星动纪元推出的首个AIGC机器人大模型。基于预训练的视频扩散模型，学习互联网上的大量视频数据，直接预测未来场......

Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI模型，具体版本号为 Gemini 2.5 Pro Preview 05-06。模型在编程能力上取得重大突破......

Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的模型的预览版本。Granite 4.0 Tiny Preview用极高的计算效率和紧凑的模型结构为特......