-
NetCDF vs Zarr:风速时间序列服务的现实选择
要做风速查询服务,一开始我在 NetCDF 和 Zarr 之间犹豫过:Zarr 很「新潮」, 云原生、并行友好,被很多地学和能源项目用来做大规模分析;NetCDF 则是 xarray 官方推荐的老牌格式, 和它的数据模型一一对应,尤其适合本地盘上的气象数据集。 但把自己的约束条件摆在桌面上——单台服务器、本地磁盘、只做全... Read More
-
Life Designing 视频笔记
这是 Stanford 的 Open Office Hours,对话的是 Dave Evans 和 Bill Burnett,也就是《Designing Your Life》的那两位老师。他们把“设计思维”用在 “我该干嘛 / 人生要往哪走” 这种大问... Read More
-
Programming as theory building 读后感
读完《Programming as Theory Building》,我第一反应居然是想起特德·姜的《软件体的生命周期》。 这篇文章想讲的和小说里表达的那种 软件慢慢长成一条生命 感觉很相似: 软件的价值,从来不只躺在代码里。 如果我们只盯着语法、框架和架构图看,其实是看不到最关键那一层... Read More
-
新能源标准规范 RAG 切片方案
在风电、光伏等新能源项目中,标准规范文档(如 GB/T、DL/T、NB/T、企业技术规范)往往具有以下特点: 篇幅长、层级多:章、节、条、款结构复杂; 语句严格但偏抽象:检索时很难直接命中关键条款; 上下文依赖强:单条标准离开上下文经常难以正确理解。 如果把整本标准直接丢进向量库,会带来... Read More
-
Typesense 信息提取与性能评估
刚开始用 Typesense 做中文搜索的时候,我一度以为用个 locale: zh 就完事了, 直到线上数据一多,才发现分词效果、召回质量、内存占用这些细节,全都绕不过去。 ICU 自带的分词规则很稳,但在垂直领域又总觉得差那么一点点,Jieba 之类外部分词器看起来很香, 却会把索引体积和维护成本一起拉上来。 于是... Read More
-
如何让 Ollama 后台 API 常驻
在默认配置下,Ollama 会在一段时间没有请求后,把模型从内存里卸载掉——这对节省资源是好事, 但对 需要低延迟响应 的服务来说就很烦: 第一次请求总是要“热身”,尤其是大模型,冷启动几秒甚至十几秒都不奇怪。 这篇文档的目标是:在 不改动 Ollama 服务本身 的前提下,通过合理调用 API,让模型常驻内存,尽量... Read More
-
Rezoning 系统拆解
Rezoning 本质上是一个把「全球多源空间数据 + 经济模型」拼在一起, 用来做风光项目宏观选址和情景对比的决策支持工具。 它不是帮你画最后一排机位、调整单条电缆的“细活”, 而是站在国家或省级尺度上,回答几个更基础的问题: 哪些区域可以建?大致能建多少?大概多少钱一度电?和别的区域相比划算吗? 下... Read More
-
为什么需要在 Python 项目里坚持用 src 目录结构
做 Python 项目久了,你大概率经历过这些场景: 本地跑测试一切正常,打包装到干净环境里就各种 ImportError; 重构包名之后,仓库根目录的某个同名文件悄悄“抢”了导入; Docker 容器里 uvicorn 启不起来,本地却完全没问题。 很多时候,罪魁祸首不是 Python 本身,而是项目结构,尤其是把包直... Read More