Page 4 of 15 for 文章

知识图谱在可研报告评审中的实用性探索

2024-10-10 About 12 mins

每次看到同事参与可研报告评审，我都会共情他们那种熟悉的疲惫感：一边翻着厚厚的 PDF，一边在不同章节里来回确认“这个总投资到底是哪一个版本”“这里的年发电量和前面说的是不是同一个口径”。很多时候，明知道问题可能藏在“容量—利用小时—发电量—IRR”这条链路上，但人的注意力和时间都很有... Read More
- #知识图谱
- #NER
总结笔记

2024-07-28 About 10 mins

很多人一提起“大模型应用”，脑子里还停留在那种：写一条超级长的 Prompt，按回车，等模型给自己一个“一步到位”的回复。 Andrew Ng 在 Sequoia 的 AI Ascent 演讲里，把这个幻想当场掀翻，他反复强调，真正能把模型能力榨干的，不是更大一代的基础模型，而是一整套更像人干活的 ... Read More
当下主流 LLM API 调用价格比较说明

2024-07-28 About 12 mins

大模型 API 的价格这两年是真·杀疯了，国内厂商一轮轮卷价，美国厂商一轮轮降价。对做工程落地的人来说，同一份文档丢给不同模型，成本可以差一个数量级，不算清楚，很容易烧钱烧心。这篇小文就用一个固定场景，来直观对比几家常见 LLM 的调用成本，并给出一些选型上的实用建议。统一对比场景为了让不同厂商... Read More
- #Agent
- #调研
从 LLM 到 Agent

2024-07-28 About 13 mins

大语言模型（LLM）本身就像一个见多识广的咨询顾问：能聊天、能解释概念、能写代码。可一旦深入使用，你很快会发现几个明显的短板：做复杂数学运算容易出错推理链条一长就开始“胡编” 碰到知识更新很快的领域（比如医疗、金融政策）就不太可靠 LLM Agent（智能体），就是为了解决这些... Read More
- #LlamaIndex
- #Agent
QAnything 源码解析

2024-07-14 About 26 mins

QAnything 的定位，是一个本地知识库问答系统，支持多种文件格式、离线部署和两阶段检索 rerank。本篇我们不从“架构宣传图”开始，而是沿着源码，顺着三条主线把系统拆开看：启动流程：从一行 Shell 一路走到 Sanic 服务和 LocalDocQA。文档上传流程：文件是怎么变成向量库里... Read More
- #RAG
- #Notes
GeoServer 内存优化策略

2024-06-22 About 11 mins

折腾 GeoServer 这几年，我踩过最多的坑，大概就是“内存不够用”，不是 OOM，就是频繁 Full GC，把整台机器拖得跟没吃早饭一样虚。回头看，其实很多问题并不在于 GeoServer 本身“性能差”，而是我一开始既没照顾好栅格数据的组织方式，也没给各种请求设好“安全阀”，更不了解 Jav... Read More
- #GeoServer
- #优化
VAX 只重三斤

2024-06-13 About 10 mins

我很多年前第一次看《Unix 编程艺术》（TAOUP），看到附录里的《无根的根：无名师的 Unix 心传》。当时完全没想到，这本正经谈 Unix 美学的书，附录居然塞了一堆禅宗故事。其中有一篇叫无名师的双路论。故事开头很简单：无名师对学生们讲，Unix 传统里有两条很有名的“... Read More
- #Notes
- #Methodology
SQLite + simple 插件实现中文全文检索

2024-06-10 About 10 mins

做中文全文检索这件事，我一开始也以为离不开 Elasticsearch、Postgres + 插件这些“大件”。但很多时候，我只是想在一颗 SQLite 里，把几万条新闻丢进去，安安静静地搜几个中文关键词——不想搭集群、不想运维服务，更不想为一个小工具搞一套“大数据”基础设施。后来发现 wangfenjin/simple 这个扩展，配合 FTS5，居... Read More
- #SQLite
- #全文检索

Prev 4/15 Next

思考的碎片，拼凑出前行的地图

在这里记录技术的进阶，也复盘那些与世界碰撞的瞬间。