ROCm 共通コンポーネント — LLM 推論で何が実際に関与するのか ROCm Components — What Is Actually Involved in LLM Inference?

このページで得られる理解:Ollama で LLM を動かしたとき、ROCm の各コンポーネントのうちどれが「ロードされているか」「実際に演算を担っているか」——その区別がこのページの核心。

What you'll gain here: when running LLMs on Ollama, which ROCm components are "loaded" vs. which are "actually handling computation" — that distinction is the core of this page.

ROCm には多数のコンポーネントがある。しかし Ollama での LLM 推論に関与するのは、その一部だ。 Phase C で /proc/maps を確認したところ、ロードされていないコンポーネントもあれば、 ロードはされているが dispatch されたかが不明なコンポーネントもある。 このページはその区別を整理するハブとして機能する。

ROCm includes many components. But only a subset is involved in Ollama LLM inference. Phase C's /proc/maps check found some components not loaded at all, and others loaded but with uncertain dispatch status. This page serves as the hub for organizing those distinctions.

Ollama / ggml-hip gfx1201 / RX9070XT Phase C: maps 確認済み Phase C: maps confirmed

このページの結論 Page Conclusion

Phase C で確認したロード済みコンポーネント:libggml-hip / libhipblas / librocblas / libhipblaslt / librocsolver / libamdhip64 / libhsa-runtime64 の 7 本(+ DRM 系)。
不在libMIOpen / libMIGraphX は maps に現れず、LLM 推論パスへの関与は観測されていない。
ただし「ロードされている ≠ 演算を担っている」。dispatch の直接確認は observer 制約により不可。
Components confirmed loaded in Phase C: libggml-hip / libhipblas / librocblas / libhipblaslt / librocsolver / libamdhip64 / libhsa-runtime64 (plus DRM libraries).
Absent: libMIOpen / libMIGraphX do not appear in maps — no involvement in the LLM inference path is observed.
However, "loaded ≠ handling computation." Direct dispatch confirmation is blocked by observer constraints.

コンポーネント一覧(RX9070XT / Phase C 観測状況) Component List (RX9070XT / Phase C Observation Status)

観測ポイント: 各コンポーネントが Ollama LLM 推論でどう関与しているか(していないか)。

Observation target: How (or whether) each component is involved in Ollama LLM inference.

コンポーネントComponent LLM 推論での役割LLM Inference Role Phase C 観測Phase C Status 詳細Detail
ROCm Bundle bundle-first ロードの基盤。system ROCm より優先されるランタイム層。Bundle-first load foundation. Runtime layer prioritized over system ROCm. 確認済みConfirmed
ggml-hip HIP kernel dispatch の主経路。.hip_fatbin(587 MiB)に gfx1201 custom hsaco を格納。MMVQ / MMQ / Flash Attention / RoPE が入る。Primary HIP kernel dispatch path. Stores gfx1201 custom hsacos in .hip_fatbin (587 MiB). Contains MMVQ / MMQ / Flash Attention / RoPE. ロード・binary 確認Load + binary confirmed
hipBLAS BLAS fallback 経路のゲートウェイ。ne11 が大きいとき rocBLAS へ委譲する。Gateway to the BLAS fallback path. Delegates to rocBLAS when ne11 is large. ロード確認Load confirmed
rocBLAS GEMM kernel 実行層(Tensile backend)。rocblas/library/ に gfx1201 向け 56 ファイル。GEMM execution layer (Tensile backend). 56 gfx1201-targeted files in rocblas/library/. ロード・hsaco 確認Load + hsaco confirmed
hipBLASLt 大規模 GEMM / activation fusion 向け拡張 BLAS。rocBLAS 経由でロードされる。Extended BLAS for large-scale GEMM / activation fusion. Loaded via rocBLAS. ロード確認Load confirmed
Tensile rocBLAS kernel の生成器(ビルド時)。runtime には直接関与しないが、gfx1201 向け Cijk_* family の出所。rocBLAS kernel generator (build-time). Not directly involved at runtime, but the source of gfx1201 Cijk_* family. gfx1201 hsaco 確認gfx1201 hsaco confirmed
rocSOLVER LAPACK 演算ライブラリ。hipBLAS 経由でロード。LLM 推論での直接役割は未確定。LAPACK operations library. Loaded via hipBLAS. Direct role in LLM inference is unresolved. ロード確認Load confirmed
MIOpen DNN プリミティブライブラリ。Ollama LLM 推論パスへの関与は未観測。DNN primitives library. No involvement in Ollama LLM inference path observed. maps に不在Absent from maps
MIGraphX グラフ推論エンジン。Ollama LLM 推論パスへの関与は未観測。bundle にも不在。Graph inference engine. No involvement in Ollama LLM inference path observed. Also absent from bundle. maps・bundle とも不在Absent from maps and bundle

示せること / 示せないこと — load ≠ dispatch What Can and Cannot Be Shown — load ≠ dispatch

この一覧で「ロード確認」と書いてあるコンポーネントは、/proc/maps に現れていることが事実として確認されている。 しかし 「ロードされている」と「LLM 推論ループ中に実際に演算を担った」は別の問題

Components listed as "load confirmed" have been factually confirmed to appear in /proc/maps. However, "loaded" and "actually handled computation during the LLM inference loop" are separate questions.

示せることCan Show 示せないことCannot Show
各ライブラリが /proc/maps に現れること(ロードの事実)Each library appears in /proc/maps (the fact of loading) そのライブラリの演算が推論中に dispatch されたかWhether that library's operations were dispatched during inference
MIOpen / MIGraphX が maps に不在(Ollama LLM パスでは使われていない)MIOpen / MIGraphX absent from maps (not used in Ollama LLM path) rocSOLVER / hipBLASLt がロード後に実際に呼ばれたかWhether rocSOLVER / hipBLASLt were actually called after loading
bundle-first で system ROCm より bundle が優先されることBundle takes priority over system ROCm (bundle-first) 各コンポーネントが推論の何フェーズで・何回呼ばれたか(dispatch-safe observer が必要)How many times each component was called and in which inference phase (dispatch-safe observer required)

未確定事項Open Questions

次の観測点 Where to Look Next

掲載情報は観測記録に基づきます。「示せないこと」欄は observer 制約による限界であり、調査の欠如ではありません。 Content is grounded in observation logs. "Cannot Show" entries reflect observer constraints, not gaps in investigation effort.