William的AI技术分享 | LLM、RAG与Agent开发实践

Prompt Engineering vs Context Engineering：我们与LLM交互方式的演变

9 个月前

随着大模型能力不断演进，开发者与其交互的方式也在发生深刻变化。从最初精雕细琢一条指令，到现在构建完整的上下文架构，我们正在经历从提示工程（Prompt Engineering）到上下文工程（Conte...

阅读全文

Nanonets-OCR：Qwen2.5VL-3B的微调模型更强大的文档解析能力|附效果实测

10 个月前

传统的Pipeline方式，只能检测出图片，无法处理图片的内容；相比之下，Nanonets-OCR模型，不只是看得见文字，更能从图片中提取出具体的语义信息，从而丰富文档的内容。

阅读全文

MonkeyOCR：用三元组范式重构文档解析与识别

10 个月前

最近恰好发现MonkeyOCR这个项目，主要是使用端到端VLM来做主要内容识别以及使用Pipeline模型中常用的版面分析模型来做结构识别。

阅读全文

Mem0：新一代AI Agent的持久化记忆体系

10 个月前

Mem0 是一个轻量级、可扩展的长期记忆框架，支持本地部署和云端使用。其设计初衷是为 LLM 提供结构化的记忆支持，帮助智能体记住用户偏好、背景信息等，从而提供更个性化、更连贯的回答。

阅读全文

AI Agent的记忆体系与架构设计

10 个月前

LLM本质上是无状态的模型，每次调用都像一次“短暂失忆”。为了让 AI Agent真正理解上下文、具备个性化交互和任务持续性，引入记忆系统至关重要。

阅读全文

一文看懂现役最强开源模型Qwen3

11 个月前

本次千问3开源了两个 MoE 模型：Qwen3-235B-A22B以及Qwen3-30B-A3B，其中，235B和30B表示模型总参数量，A22B和A3B表示激活的参数量。

阅读全文

告别RAG上下文丢失：Late Chunking 与 Contextual Retrieval 深度对比解析

11 个月前

在传统RAG流程中，必不可少的一个步骤是把长文档进行分块，然后把这些文本块进行向量化处理，并且存放在向量数据库中，当查询的时候，则从数据库中检索出相似的文本块传递给大模型，用于生成响应。

阅读全文

SmolDocling-256M：极小参数量的视觉语言模型|端到端文档解析方案的另一种思路

11 个月前

SmolDocling是一种超小型的VLM，能够在使用远少于大型模型计算资源的情况下，提供与大型模型相当的性能，支持OCR、布局和定位、代码识别、公式识别、图表识别、表格识别、图像分类、标题对应、列表...

阅读全文

Ollama-OCR：基于Ollama多模态大模型的端到端文档解析和处理

11 个月前

Ollama-OCR是一个Python的OCR解析库，结合了Ollama的模型能力，可以直接处理 PDF 文件无需额外转换，轻松从扫描版或原生 PDF 文档中提取文本和数据。

阅读全文

PostgREST：无需后端快速构建RESTful API服务

11 个月前

PostgREST是基于无服务器的一种实现方案，允许开发者将PostgreSQL数据库直接暴露为RESTful API，而无需编写任何后端代码，从而可以专注于核心功能的开发。

阅读全文

1 2 3 4 5 6 7 8

GitHub Email X

公告

欢迎来到我的博客！这里会分享一些技术文章和个人思考。

共76篇

第 1 / 3 页

查看完整归档

Prompt Engineering vs Context Engineering：我们与LLM交互方式的演变

Nanonets-OCR：Qwen2.5VL-3B的微调模型更强大的文档解析能力|附效果实测

MonkeyOCR：用三元组范式重构文档解析与识别

Mem0：新一代AI Agent的持久化记忆体系

AI Agent的记忆体系与架构设计

一文看懂现役最强开源模型Qwen3

告别RAG上下文丢失：Late Chunking 与 Contextual Retrieval 深度对比解析

SmolDocling-256M：极小参数量的视觉语言模型|端到端文档解析方案的另一种思路

Ollama-OCR：基于Ollama多模态大模型的端到端文档解析和处理

PostgREST：无需后端快速构建RESTful API服务

网站信息

公告

最新文章

归档

共76篇

Prompt Engineering vs Context Engineering：我们与LLM交互方式的演变

Nanonets-OCR：Qwen2.5VL-3B的微调模型 更强大的文档解析能力|附效果实测

MonkeyOCR：用三元组范式重构文档解析与识别

Mem0：新一代AI Agent的持久化记忆体系

AI Agent的记忆体系与架构设计

一文看懂现役最强开源模型Qwen3

告别RAG上下文丢失：Late Chunking 与 Contextual Retrieval 深度对比解析

SmolDocling-256M：极小参数量的视觉语言模型|端到端文档解析方案的另一种思路

Ollama-OCR：基于Ollama多模态大模型的端到端文档解析和处理

PostgREST：无需后端 快速构建RESTful API服务

网站信息

公告

最新文章

归档

共76篇

Nanonets-OCR：Qwen2.5VL-3B的微调模型更强大的文档解析能力|附效果实测

PostgREST：无需后端快速构建RESTful API服务