ggwave 是一个用于通过声音传输小数据的轻量级库。
Cobra 是一个用于构建现代命令行界面 (CLI) 应用程序的开源库,具有简单的子命令结构,完全符合 POSIX 标准的标志,支持嵌套子命令和多种标志功能,提供智能建议和自动生成帮助文档、命令补全和手册页的功能,旨在提升用户体验和开发效率。
项目布局 (project-layout) 是一个为 Go 应用项目提供标准项目结构的开源项目,旨在帮助开发者保持代码整洁,避免隐藏依赖和全局状态。它提供通用的目录模式,支持 Go Modules 管理依赖,灵活适应不同项目需求,适合各种规模的 Go 项目。
Qwen2.5-VL 是由阿里云 Qwen 团队开发的多模态大型语言模型,具备强大的文档解析能力,支持多种语言和文档格式,具备精确的对象定位和超长视频理解能力,能够处理长达数小时的视频并提取事件片段,同时提升了在计算机和移动设备上的推理和决策能力。
LangBot 是一个开源的即时通信机器人平台,支持多种消息平台 (如 QQ、微信、飞书、Discord) 和大型语言模型 (如 OpenAI GPT 和 ChatGPT)。它具备高稳定性和完整的功能 (如访问控制和敏感词过滤),支持插件扩展,拥有活跃的社区生态,并提供 Web 管理面板以便于管理实例。
wechat-bot 是一个基于 WeChaty 的开源微信机器人,结合多种 AI 服务 (如 DeepSeek、ChatGPT、Kimi 和讯飞),能够自动回复微信消息、管理微信群和好友,检测僵尸粉,提升群聊质量。该项目简单易用,支持多种 AI 服务配置和自定义白名单,灵活性高。
OmniParser 是一个开源的屏幕解析工具,旨在为基于视觉的 GUI 代理提供支持,能够将用户界面截图解析为结构化元素,增强 GPT-4V 生成界面交互的能力,支持多种大型语言模型,提供细粒度的图标检测和交互预测,尤其在 Windows Agent Arena 中表现突出,受到广泛欢迎。
OCRmyPDF 是一个开源工具,旨在为扫描的 PDF 文件添加可搜索的 OCR 文本层,支持生成 PDF/A 文件,保持图像分辨率,优化文件大小,并可在多个 CPU 核心上并行处理,使用 Tesseract OCR 引擎支持多语言识别,确保用户数据的私密性。
Onlook 是一个开源设计工具,允许用户在实时的 React 应用中进行设计,支持与 TailwindCSS 集成,提供实时编辑、项目聊天功能、快速定位代码的右键功能,旨在提升设计与代码的无缝协作。
ImageToolbox 是一款功能强大的开源图像处理应用,支持批量处理和 230 多种滤镜,提供裁剪、背景擦除、EXIF 数据编辑等基本工具,能够将图片转换为 PDF,适合摄影师和开发者使用,界面简洁,功能丰富。