Tag

#2026年07月

共 3 篇文章。

2026年7月1日

Docling:把复杂文档变成 AI 能用的结构化资料

做 RAG、知识库或智能体应用时,最容易被低估的一步不是调用大模型,而是把 PDF、Word、网页、表格、扫描件这些“脏文档”稳定地变成可检索、可引用、可追溯的结构化内容。Docling 正是为这个环节准备的开源项目:它把多种文档解析、PDF 版面理解、OCR、导出格式和 LLM