Liuxiaohanhanzi = 跨越屏幕，幸识

2025-09-146.4k字6 分钟

kaggle高频波动率预测

# eda（数据描述）&baseline target 服从泊松分布（或卡方） MSE 的分布前提假设数据满足高斯分布分类问题的评估函数多用 f1 score F1 分数是精确率（P，预测结果对了多少）和召回率（R，对实际结果我覆盖了多少）的调和平均数 encoding 技巧：对面板数据，按类别 groupby，然后聚合操作按时间聚合时，可以考虑 tsfresh 包聚合时，考虑到越新的数据，对未来影响越大，可以考虑从后往前选特定长度伪标签思想：用初始学到的模型给无标签数据集打标签，取确信度大的结果加入 train set，用于后续训练（要防止确认偏见）

more...

2025-08-211k字1 分钟

神明在指尖寄宿的片刻

拿不拿结婚了。因为工作繁忙，我晚了一个月才刷到。消息迟来，我当时懵了一小会，接着是惊讶、甚至近乎破防。忽然想起，今年 7 月，专辑《花と水飴、最終電車》已发售十周年原来被遗落在那个夏天的只有我。我向来是个只推歌、不记作者的人。日推放什么，我便听什么。即使这样，我依然对旋律背后的这个拧巴男，怀揣一种难以叙说的复杂情感。我从初中时代起听他的术曲，以前玩舞萌时最喜欢鸟的谱子也是《海百合海底谭》。有点像一个素未谋面的旧友，他的音符陪我走过了我最想自杀的高中与大学岁月 —— 无论是奔赴教室时拥挤的地铁，还是深夜时淡黄孤灯下的自习桌前。我也爱听 “命嫌”，但 “命嫌” 给我的触动如疾风猝雨

more...

2025-08-211.4k字1 分钟

shayo(斜陽)

# 飞天来源 B 站当万户夹杂着铁粒的火舌，被超低温氢氧的烈焰所代替。我才知道，我们早已在征途上。航天推进器的尾焰会烧掉一切愚昧，人类不会因阴谋而停下脚步 # 哈基米来源知乎很多人绝对低估了猫狗在互联网的重要性。你们根本不知道，一个恨儿童、恨老人、恨同事、恨同学、恨同性、恨异性、恨人类的类人生物，如果失去了在犬科和猫科动物面前展现自己仅存且廉价同情心的机会，这对它们意味着什么。 # 忘了以前做什么？来源知乎扬州瘦马现代版南宋南明 + 预警版以后会有更多人站在朱熹这边，哪怕他们不知道朱熹都说过什么，也不知道自己的观点与朱熹观点重合宋朝时期，大量权贵富豪喜欢奢靡享

more...

2025-08-203.4k字3 分钟

docker学习

本 post 为狂神课程笔记 # 重要名词镜像（image） Docker 镜像就好比是一个模板，可以通过这个模板来创建容器服务，tomcat 镜像 => run => tomcat01 容器，通过这个镜像可以创建多个容器（最终服务运行或者项目运行就是在容器中的）容器（container） Docker 利用容器技术，独立运行一个或者一组应用，通过镜像来创建的启动，停止，删除，基本命令！就目前可以把这个容器理解为一个建议的 linux 系统仓库（repository）存放镜像的地方 Docker Hub（默认是国外的）阿里云

more...

2025-07-052.8k字3 分钟

poetry命令总结

# 优点思考这样一种情况 —— pip install Apip uninstall A安装包 A 时，你会安装一大堆依赖；uninstall 后，A 删了，但是安装的一堆依赖还在于是 poetry 横空出世，这种问题迎刃而解。poetry 的优点如下：通过 pyproject.toml 声明依赖，并自动用 poetry.lock 锁定所有包（包括子依赖）的具体版本，这样能保证不同环境中安装一致、避免 “在我机器上能跑” 的问题集成虚拟环境管理，一口气安装、打包、发布等操作 Poetry 本身依赖很多包（>30 个），所以在安装 Poetry 时，把它放在一个专门的

more...

2025-05-21219字1 分钟

炒股实操收获

# 股票所属板块在哪看？板块情况怎么看？在同花顺指数中，同花顺自己编制了各个板块，结构如下 —— 同花顺指数同花顺概念同花顺行业同花顺地域（实用性弱一些）板块主要用来看涨跌幅和资金净流入量 # 当日不及预期，次日处理方式指数板块开盘三根交割单！！下杀第一时间跑，早跑！！！绝对龙头，中期（4-7 板）可以等等 todo：未完待续

more...

2025-05-042.1k字2 分钟

数理基础

# 平稳时间序列 # 为什么要平稳性？时间序列数据与传统统计数据结构不同。最大的区别在于，传统随机变量可以得到同一分布的多个观测值（比如骰子点数，可以反复掷得到多个观测值，忽略时间的差异）。而时间序列数据中，每个随机变量只有一个观测值（比如设收盘价为研究的随机变量，每天只有一个收盘价，不同日子的价格服从的分布不同，即考虑时间的差异）。这样一来，每个分布只能得到一个观测值，数目太少，无法研究分布的性质。但是通过平稳性，从不同日期的分布之间发现内在关联，缓解了由于样本容量少导致的估计精度低的问题。研究时间序列的最终目的是，预测未来。但是未来是不可知的，我们拥有的数据都是历史，因此

more...

2025-04-102.8k字3 分钟

数字货币初窥

# 永续合约，币币等等东西都是什么？ # 币币交易（现货交易）是什么：直接用一种币买另一种币（比如用 USDT 买比特币）。特点：现货交易：一手交钱，一手拿货，就像在菜市场买菜，钱和菜当场交换。无杠杆：你花多少钱就买多少币，亏赚都按实际金额算。无期限：买了币可以一直拿着，想什么时候卖都行。例子：你用 100 元买苹果，当场拿走苹果，苹果涨到 120 元时卖掉，赚 20 元。 # 交割合约（期货合约）是什么：约定未来某个时间以某个价格买卖币的合同。特点：有到期日：比如约定 “下个月 1 号以 1 万刀买 1 个比特币”。杠杆：可以押小钱玩大钱（比如 10 倍杠

more...

2025-03-253k字3 分钟

LLM推理加速概览

# GPU 内存概论参考视频如上图，DRAM 用于电脑内存；HBM 用于芯片外显卡显存；SRAM 用于 GPU 芯片内，如 L1 Cache、L2 Cache； GPU 内有大量 Core 和 thread，使用 SIMT（单一指令，多线程执行）技术，比如矩阵乘法里结果里的每个元素可以分配一个线程。32 个线程一组，叫做一个 Warp。Warp 是 GPU 里调度任务的最小单元。 GPU 由大量的块组成，每个块称作一个 SM（流式处理器），一个 SM 结构如下：由于显存传输相对慢，计算单元更快更空闲，因此我们希望减少 GPU 空闲 —— 因为矩阵乘法的计算时间复杂度为 O(N3

more...

2025-03-04562字1 分钟

技术面学习（三）

视频教程炒股真正的三步骤：交易纪律和执行力这是基础，这是必须的。先拿小资金如 2w，去随意买卖，无所谓盈利，直到你在买卖间做抉择时，丝毫无压抑，丝毫无心理障碍，该割就割该买就买，这才是有了一定交易记录和执行力。这一阶段不能用模拟盘。寻找自己的交易模式学别人的没用，学不了 —— 因为每个人的性格、习惯、喜爱、风险偏好均不一样。在有执行力的情况下，去试各种模式。不喜欢不习惯就换一个，直到你在单一模式下，单月成功率达到 50%；去除无效交易，修建自己达到第二点后，就把这个月交割单理出来，一一仔细分析为什么成功、为什么亏，去反省自我认知。然后把那些亏的无效交易去除掉。这

more...