-
FinGLM 财报问答比赛技术路线总结
FinGLM 源于 SMP 2023 ChatGLM 金融大模型挑战赛,核心任务是: 在 上市公司年报/财务报表 构建的知识库基础上,使用 ChatGLM 系列模型完成财报问答。 参赛系统需要围绕 PDF 年报回答三类问题: 基础查询(初级): 例如“某公司 2021 年研发费用是多少?”... Read More
-
在 Nextcloud 中配置 ElasticSearch 全文检索
本文记录如何在 Docker 环境下,为 Nextcloud 配置 ElasticSearch,并通过 Full Text Search 系列应用实现文件内容检索,包括: 使用 docker-compose 启动 ElasticSearch 服务 安装 ingest-attachment 与 analysi... Read More
-
在 Nextcloud 中安装和配置 OnlyOffice
OnlyOffice DocumentServer 可以让 Nextcloud 直接在线编辑 Word / Excel / PPT 等文档。 下面以 Docker 方式部署 OnlyOffice,并在 Nextcloud 中完成配置为例,带你一步一步完成集成。 前提条件 在开始前,确保你已经具备: 一套可... Read More
-
从零上手 spaCy:中文 NLP 的实用入门指南
我一直觉得,做中文 NLP 很容易走两条极端,要么写一堆零散的正则和脚本,勉强把需求拼起来, 要么脑子一热,直接把问题全丢给大模型。但真到落地一个能长期跑在生产上的小系统, 比如从风电 / 光伏新闻里稳定抽出装机容量、上网电量这些指标——你会发现,光靠“大力出奇迹”其实挺难维护的。 spaCy 对我来说,就是在这两端之间找到的那条“中间道... Read More
-
使用 PVLib 计算光伏板排布的最佳倾角和朝向
本文面向已经会用 Python、对光伏发电有基本概念的工程师,目标是: 在掌握“经验规则”的基础上,用 PVLib 做一套可以落地的 最佳倾角 / 朝向 计算流程。 问题背景与总体思路 在实际项目里,“组件怎么摆”通常会落到三个问题: 朝哪边?(方位角:东、南、西还是介于它们之间?) 抬多高?(倾角:离水平面多... Read More
-
再谈 FastAPI 架构落地:从 Dispatch 学来的几件事
做 FastAPI 项目,我发现自己有时候会迷恋类似 Clean Architecture / Hexagonal,好像选了这么一个“万金油”的架构就能解决一切问题,但真到落地时,目录还是一团乱:main.py 越写越胖、业务逻辑塞进 router、运维动作全靠口口相传。 后来仔细拆了 Netflix 的 Dispatch,才发现人家厉害的不... Read More
-
运维中的安全实践备忘录
上线一套服务,从买云主机、跑 Docker,到接上数据库、GeoServer、FastAPI,中间哪一步没想清楚,日后都可能变成一颗“定时炸弹”。 这篇运维中的安全实践备忘录,不是教科书式的最佳实践大全,而是按我自己常用的技术栈, 把云服务器、Docker、Postgres、GeoServer、FastAP... Read More