Prompt Engineering vs Context Engineering:我们与LLM交互方式的演变
随着大模型能力不断演进,开发者与其交互的方式也在发生深刻变化。从最初精雕细琢一条指令,到现在构建完整的上下文架构,我们正在经历从提示工程(Prompt Engineering)到上下文工程(Conte...
阅读全文随着大模型能力不断演进,开发者与其交互的方式也在发生深刻变化。从最初精雕细琢一条指令,到现在构建完整的上下文架构,我们正在经历从提示工程(Prompt Engineering)到上下文工程(Conte...
阅读全文传统的Pipeline方式,只能检测出图片,无法处理图片的内容;相比之下,Nanonets-OCR模型,不只是看得见文字,更能从图片中提取出具体的语义信息,从而丰富文档的内容。
阅读全文Mem0 是一个轻量级、可扩展的长期记忆框架,支持本地部署和云端使用。其设计初衷是为 LLM 提供结构化的记忆支持,帮助智能体记住用户偏好、背景信息等,从而提供更个性化、更连贯的回答。
阅读全文本次千问3开源了两个 MoE 模型:Qwen3-235B-A22B以及Qwen3-30B-A3B, 其中,235B和30B表示模型总参数量,A22B和A3B表示激活的参数量。
阅读全文在传统RAG流程中,必不可少的一个步骤是把长文档进行分块,然后把这些文本块进行向量化处理,并且存放在向量数据库中,当查询的时候,则从数据库中检索出相似的文本块传递给大模型,用于生成响应。
阅读全文SmolDocling是一种超小型的VLM,能够在使用远少于大型模型计算资源的情况下,提供与大型模型相当的性能,支持OCR、布局和定位、代码识别、公式识别、图表识别、表格识别、图像分类、标题对应、列表...
阅读全文Ollama-OCR是一个Python的OCR解析库,结合了Ollama的模型能力,可以直接处理 PDF 文件无需额外转换,轻松从扫描版或原生 PDF 文档中提取文本和数据。
阅读全文PostgREST是基于无服务器的一种实现方案,允许开发者将PostgreSQL数据库直接暴露为RESTful API,而无需编写任何后端代码,从而可以专注于核心功能的开发。
阅读全文欢迎来到我的博客!这里会分享一些技术文章和个人思考。