Tag

#AI工具

共 93 篇文章。

2026年7月1日

Docling:把复杂文档变成 AI 能用的结构化资料

做 RAG、知识库或智能体应用时,最容易被低估的一步不是调用大模型,而是把 PDF、Word、网页、表格、扫描件这些“脏文档”稳定地变成可检索、可引用、可追溯的结构化内容。Docling 正是为这个环节准备的开源项目:它把多种文档解析、PDF 版面理解、OCR、导出格式和 LLM

2026年6月14日

agentsview:如果你已经在同时用 Claude Code、Codex、Gemini,这个本地分析台值得收藏

AI 编程助手越用越多,一个新问题也会越来越明显:对话散在不同工具里,花了多少钱、哪些项目最常用、哪段历史值得回看,往往并不清楚。agentsview 想解决的就是这件事。它把多种 AI 编程助手留在本机的会话记录统一索引到本地数据库里,提供搜索、浏览、统计和成本分析界面。今天它

2026年6月5日

Headroom:如果你每天都在喂 AI 大量上下文,这个项目值得先记住

很多团队已经发现,AI 真正贵的地方不只是模型本身,而是越来越长的上下文:日志、搜索结果、RAG 片段、代码文件、工具输出都会快速把 token 成本和响应时间一起推高。今天想看的项目是 Headroom。它的定位很直接:在上下文真正送进模型之前,先做一层压缩,而且尽量不牺牲回答

2026年5月8日

TabPFN:如果你手里是表格数据,这个开源项目值得尽早知道

这两天 GitHub 热门 AI 项目里,TabPFN 是少数不靠“套壳应用”出圈、而是直接改写表格建模流程的项目。它的核心思路很明确:把传统表格机器学习里大量依赖调参、反复训练和特征预处理的环节,尽量收敛成一个预训练好的基础模型接口。对经常处理业务数据、风控数据、运营数据、实验

2026年5月7日

Local Deep Research:如果你想把“深度研究”尽量留在本地,这个开源项目值得先试

这两天 GitHub 热门 AI 项目里,Local Deep Research 是少数既有明显使用场景、又能快速验证价值的一类。它不是单纯再包一层聊天界面,而是把“搜索、检索、阅读、引用、沉淀资料库”整合成一个可本地运行的研究助手。对需要长期做资料整理、行业研究、论文检索或内部

2026年5月2日

Sim:如果你想把 AI Agent 真正接进业务流程,这个开源工作台值得先看

这两天 GitHub 上涨得比较快的 AI 项目里,Sim 是少数既有热度、又能很快讲清使用价值的一类。它本质上不是“再来一个聊天机器人壳”,而是一个开源 AI 工作台:把模型、工作流、知识库、外部工具和运行日志放到同一个空间里,让团队用可视化方式搭 Agent,并能部署、调用、

2026年4月30日

VibeVoice-ASR:如果你经常处理长音频转写,这个项目值得先记住

很多语音转写工具在长音频场景里都会遇到同一个问题:切段后容易丢上下文,分不清谁在说话,时间戳也不够稳。微软开源的 VibeVoice-ASR 想解决的正是这件事。它主打 最长 60 分钟单次处理,并把转写结果直接整理成 谁在说、什么时候说、说了什么 的结构化输出。对做播客、会议纪

2026年4月24日

Presidio:给 AI 应用补上一层“隐私刹车”

今天在 GitHub 热门 AI 项目里,Presidio 是一个很值得单独拎出来看的工具。它不是做模型能力本身,而是专门处理敏感信息:识别、脱敏、遮盖、匿名化文本和图片里的 PII(个人可识别信息)。如果你的应用会接入用户对话、工单、病历、日志或截图,这类工具往往比“再调一个更

2026年4月22日

TrendRadar:比“刷热搜”更有用的开源热点雷达

如果你每天都要盯新闻、看舆情、找选题,TrendRadar 值得放进工具箱。它不是又一个简单的“热榜聚合页”,而是把多平台热榜、RSS 订阅、关键词过滤、AI 筛选、AI 分析和多渠道推送打通成一套可部署的工作流。更重要的是,项目文档足够完整,支持 Docker 与 MCP 接入

2026年4月19日

Thunderbolt:一个更像“可自托管 AI 客户端底座”的项目

这两个月,AI 工具很多,但真正让团队放心落地的并不多。Thunderbolt 值得关注,不是因为它又做了一个聊天界面,而是它试图把 多模型接入、自托管部署、跨平台客户端和企业集成 放进同一套开源产品里。对想把 AI 用进内部协作、又不想完全把数据和入口交给单一厂商的团队来说,它

2026年4月15日

Voicebox:一个更值得关注的本地开源语音克隆工作台

这两天 GitHub 上升温的 AI 项目里,Voicebox 是少数“用途明确、资料完整、能马上试”的一个。它的定位不是再造一个在线配音网站,而是把语音克隆、文本转语音、后期处理和多角色编排都收进一套本地工作台里。对内容团队、产品团队和独立开发者来说,这类工具的价值很直接:想做

2026年4月12日

Mem0:如果你在做 AI Agent,值得先补上的不是提示词,而是记忆层

这两个月大家都在谈 Agent,但很多产品一上线就暴露出同一个问题:会对话,不等于会“记住你”。Mem0 想解决的正是这层缺口。它把长期记忆从主提示词里拆出来,单独做成可检索、可更新、可管理的一层,让助手、客服机器人或业务 Agent 不必每次都把全部历史塞进上下文,也能保留用户