このページで得られる理解:Ollama で LLM を動かしたとき、ROCm の各コンポーネントのうちどれが「ロードされているか」「実際に演算を担っているか」——その区別がこのページの核心。
What you'll gain here: when running LLMs on Ollama, which ROCm components are "loaded" vs. which are "actually handling computation" — that distinction is the core of this page.
ROCm には多数のコンポーネントがある。しかし Ollama での LLM 推論に関与するのは、その一部だ。
Phase C で /proc/maps を確認したところ、ロードされていないコンポーネントもあれば、
ロードはされているが dispatch されたかが不明なコンポーネントもある。
このページはその区別を整理するハブとして機能する。
ROCm includes many components. But only a subset is involved in Ollama LLM inference.
Phase C's /proc/maps check found some components not loaded at all,
and others loaded but with uncertain dispatch status.
This page serves as the hub for organizing those distinctions.
libggml-hip / libhipblas / librocblas / libhipblaslt / librocsolver / libamdhip64 / libhsa-runtime64 の 7 本(+ DRM 系)。libMIOpen / libMIGraphX は maps に現れず、LLM 推論パスへの関与は観測されていない。libggml-hip / libhipblas / librocblas / libhipblaslt / librocsolver / libamdhip64 / libhsa-runtime64 (plus DRM libraries).libMIOpen / libMIGraphX do not appear in maps — no involvement in the LLM inference path is observed.観測ポイント: 各コンポーネントが Ollama LLM 推論でどう関与しているか(していないか)。
Observation target: How (or whether) each component is involved in Ollama LLM inference.
| コンポーネントComponent | LLM 推論での役割LLM Inference Role | Phase C 観測Phase C Status | 詳細Detail |
|---|---|---|---|
| ROCm Bundle | bundle-first ロードの基盤。system ROCm より優先されるランタイム層。Bundle-first load foundation. Runtime layer prioritized over system ROCm. | 確認済みConfirmed | → |
| ggml-hip | HIP kernel dispatch の主経路。.hip_fatbin(587 MiB)に gfx1201 custom hsaco を格納。MMVQ / MMQ / Flash Attention / RoPE が入る。Primary HIP kernel dispatch path. Stores gfx1201 custom hsacos in .hip_fatbin (587 MiB). Contains MMVQ / MMQ / Flash Attention / RoPE. |
ロード・binary 確認Load + binary confirmed | → |
| hipBLAS | BLAS fallback 経路のゲートウェイ。ne11 が大きいとき rocBLAS へ委譲する。Gateway to the BLAS fallback path. Delegates to rocBLAS when ne11 is large. | ロード確認Load confirmed | → |
| rocBLAS | GEMM kernel 実行層(Tensile backend)。rocblas/library/ に gfx1201 向け 56 ファイル。GEMM execution layer (Tensile backend). 56 gfx1201-targeted files in rocblas/library/. |
ロード・hsaco 確認Load + hsaco confirmed | → |
| hipBLASLt | 大規模 GEMM / activation fusion 向け拡張 BLAS。rocBLAS 経由でロードされる。Extended BLAS for large-scale GEMM / activation fusion. Loaded via rocBLAS. | ロード確認Load confirmed | → |
| Tensile | rocBLAS kernel の生成器(ビルド時)。runtime には直接関与しないが、gfx1201 向け Cijk_* family の出所。rocBLAS kernel generator (build-time). Not directly involved at runtime, but the source of gfx1201 Cijk_* family. | gfx1201 hsaco 確認gfx1201 hsaco confirmed | → |
| rocSOLVER | LAPACK 演算ライブラリ。hipBLAS 経由でロード。LLM 推論での直接役割は未確定。LAPACK operations library. Loaded via hipBLAS. Direct role in LLM inference is unresolved. | ロード確認Load confirmed | → |
| MIOpen | DNN プリミティブライブラリ。Ollama LLM 推論パスへの関与は未観測。DNN primitives library. No involvement in Ollama LLM inference path observed. | maps に不在Absent from maps | → |
| MIGraphX | グラフ推論エンジン。Ollama LLM 推論パスへの関与は未観測。bundle にも不在。Graph inference engine. No involvement in Ollama LLM inference path observed. Also absent from bundle. | maps・bundle とも不在Absent from maps and bundle | → |
この一覧で「ロード確認」と書いてあるコンポーネントは、/proc/maps に現れていることが事実として確認されている。
しかし 「ロードされている」と「LLM 推論ループ中に実際に演算を担った」は別の問題。
Components listed as "load confirmed" have been factually confirmed to appear in /proc/maps.
However, "loaded" and "actually handled computation during the LLM inference loop" are separate questions.
| 示せることCan Show | 示せないことCannot Show |
|---|---|
各ライブラリが /proc/maps に現れること(ロードの事実)Each library appears in /proc/maps (the fact of loading) |
そのライブラリの演算が推論中に dispatch されたかWhether that library's operations were dispatched during inference |
| MIOpen / MIGraphX が maps に不在(Ollama LLM パスでは使われていない)MIOpen / MIGraphX absent from maps (not used in Ollama LLM path) | rocSOLVER / hipBLASLt がロード後に実際に呼ばれたかWhether rocSOLVER / hipBLASLt were actually called after loading |
| bundle-first で system ROCm より bundle が優先されることBundle takes priority over system ROCm (bundle-first) | 各コンポーネントが推論の何フェーズで・何回呼ばれたか(dispatch-safe observer が必要)How many times each component was called and in which inference phase (dispatch-safe observer required) |