主页

Linux进程诊断技巧:使用pwdx命令追踪进程工作目录与故障排查应用

pwdx pwdx {pid} 显示进程的当前工作目录 主要是不需要root 权限, 也不用 cat /proc/{pid} 一大堆内容了 example yxc@yxc-MS-7B89:~/code/2410$ ps aux | grep clash yxc 34838 0.0 0.0 1239312 20604 ? Sl Oct29 2:12 ./clash-linux-amd64-v3-v1.18.0 yxc 391748 0.0 0.0 17812 2304 pts/1 S+ 22:15 0:00 grep --color=auto clash yxc@yxc-MS-7B89:~/code/241...

阅读更多

在线 C++ 性能测试:Quick Bench 工具

Quick Bench 简介 Quick Bench 是一个强大的在线 C++ 基准测试工具,让开发者能够快速比较不同代码实现的性能差异。无需复杂的环境配置,只需在浏览器中编写代码,就能获得精确的性能测试结果,使性能优化工作变得更加高效直观。 主要特点 多编译器支持:可选择不同版本的 GCC、Clang 等编译器 C++ 标准灵活选择:支持从 C++11 到最新标准 自定义编译选项:可添加特定的编译标志和优化级别 精确的性能比较:自动计算 CPU time 与 noop time 比率,消除系统噪声 结果可视化:直观图表展示不同实现的性能差异 代码共享:生成唯一链接,方便分享结果与讨论 汇编代码查看:可检查生成的汇编代码,深入分析性能问题 本地部...

阅读更多

OpenCL性能评测工具

找到一款opencl-benchmark 工具 https://github.com/ProjectPhysX/OpenCL-Benchmark 双卡1080ti实测: yxc@hua-System-Product-Name:~/code/3/OpenCL-Benchmark$ ./make.sh .-----------------------------------------------------------------------------. |----------------.------------------------------------------------------------| | Device ID 0 | NVIDIA GeForce...

阅读更多

HBase集群健康监控:Status查询命令详解

hbase shell hbase(main):004:0> status 1 active master, 0 backup masters, 8 servers, 0 dead, 179.2500 average load hbase(main):001:0> status 'simple' active master: 172.17.128.217:16000 1713846984224 0 backup masters 8 live servers 172.17.129.68:16020 1714282894493 requestsPerSecond=187.0, numberOfOnlineRegions=176, usedHeap...

阅读更多

Docker BuildKit故障排查问题分析

问题 docker build 过程中 build kit报错 yxc@yxc-MS-7B89:~/code/3/vllm$ docker build -t yxc.vllm.cuda.1 . Sending build context to Docker daemon 28.02MB Step 1/54 : FROM nvidia/cuda:12.1.0-devel-ubuntu22.04 AS dev ---> 963712b8747f Step 2/54 : RUN apt-get update -y && apt-get install -y python3-pip git ---> Using cache ---> 50ac8...

阅读更多

JavaScript与C++无缝集成:以stdlib.js的Node-API为例

0 背景介绍 stdlib.js 是一个综合性的 JavaScript 库,提供了多种数学和统计功能,提供了js调用c/cpp的实现 1 重构issue 在 Issue #1528 中,提出了对 @stdlib/blas/ext/base/snansum 函数进行重构的建议。主要目标包括: 从 C++ 插件接口迁移到 C 插件接口 统一代码风格 简化实现方式 遵循项目约定(详见 Issue #788) PR #2227 已经做了合入 2 基于Node-API的实现 核心实现在 lib/node_modules/@stdlib/blas/ext/base/snansum/src/addon.c #include "stdlib/blas/ext/bas...

阅读更多

CMake进阶:find_package()函数完全解析与自定义模块开发指南

在 cmakelist.txt 文件中,find_package() 命令用于查找并加载外部库的设置。它并不直接管理依赖包,而是依赖于外部预设的模块或配置来找到这些库。 他找的路径是 cmake/module/XX.cmake 因此,如果是单独的项目,要进行编译,可以设置path set(CMAKE_MODULE_PATH "${CMAKE_CURRENT_SOURCE_DIR}/cmake:${CMAKE_MODULE_PATH}") 这样的话,会去项目的cmake 目录找

阅读更多

GPU MEM 训练和微调估算

在训练或微调大型语言模型(LLM)和其他深度学习模型时,GPU显存限制往往是主要瓶颈。了解模型所需的最低显存是避免OOM(内存不足)错误的关键一步。以下是两个有用的在线工具,可以帮助你估算显存需求: 1. HuggingFace的模型内存使用估算器 HuggingFace提供了一个专门的工具,可以帮助估计训练和微调所需的最低显存大小: 名称:Model Memory Utility 链接:https://huggingface.co/spaces/hf-accelerate/model-memory-usage 用途:估算训练或微调模型所需的最低GPU显存 受欢迎程度:918个赞 这个工具允许你选择特定模型,并根据批量大小、精度等参数计算所需的显存。它可以帮...

阅读更多