ROCm study 〜vegaからはじまるスタック探求〜

ROCm study - Exploring the Stack from Vega-

Vega (gfx900) を出発点に、ROCm の capability-based 設計思想とオープンソースエコシステムの構造を紐解く研究プロジェクトの公開ページです。

A research project that starts from Vega (gfx900) to unravel the capability-based design philosophy of ROCm and the structure of its open-source ecosystem.

https://aets-magi.github.io/vega-hbmx-pages/ 📂 GitHub: AETS-MAGI/ROCm-vega 💬 Community Forum Starting point: AMD Radeon RX Vega / gfx900 ROCm Design Philosophy
上から順に読むと「なぜこれを調べているか → ROCm 入門への入口 → 発表資料 → 詳細根拠」という流れで全体像が見渡せます。 Reading top to bottom follows the arc: why this matters → where to start learning ROCm → presentation materials → detailed evidence.
1

入口

Start here

技術の背景や研究の動機を、一般向けの読み物やストーリーで伝えるページ群です。専門知識不要。

Pages that convey the motivation and background of this work through essays and stories. No technical background needed.

General

理念 — 未来の道具を、みんなの手に。

Vision — Putting the tools of the future into everyone's hands

general-audience.html

「なぜこの活動をしているのか」「誰のためにやっているのか」を伝えるページです。技術の説明ではなく、理念の宣言。

A declaration page — conveying why this work is done and who it is for. Vision, not technical explanation.

  • 専門知識不要・一般向け
  • No technical background needed
  • 1画面1テーマのスクロール構成
  • One theme per screen, scroll-based layout
Story

Vegaちゃんのあったか成長物語

Vega-chan's Warm Growth Story

vega-story_for-child.html

gfx900 の歩みを、子どもにもわかる絵本形式のスライドで紹介します。各ページに解説モーダル付き。

gfx900's journey as a picture-book slideshow. Technical notes pop up on each page.

  • スワイプ/矢印キーでページ送り
  • Swipe or arrow keys to turn pages
Essay

Vegaと、わたしのはじまり

Vega, and Where I Began

essay.html

統計計算がしたいという小さな願いから、AIの研究にたどり着くまでの道のりを綴った研究エッセイ。

A research essay tracing the path from a simple wish to do statistical computing, to arriving at AI research.

  • やわらかい読み物形式
  • Gentle essay-style narrative
Media

音声・ポスター閲覧ページ

Media viewer page

media.html

NotebookLM の解説音声と、ポスター PDF 本体をブラウザ上で再生・閲覧できるページ。

Browser-friendly player for the NotebookLM audio and the poster PDF.

  • 音声プレイヤー内蔵
  • Built-in audio player
  • ポスター PDF 埋め込み表示対応
  • Embedded poster PDF viewer

2

ROCm 入門への入口

Start Learning ROCm

GPU・ROCm・NumPy・PyTorch をこれから学ぶ人向けの入口は、別サイト ROCm-docs に分離しました。初心者向けの理論ページと Python 講座は、そちらから読めます。

The beginner-friendly learning path for GPU, ROCm, NumPy, and PyTorch now lives on the separate site ROCm-docs. Start there for the theory pages and the Python course.

ROCm-docs

初心者向け ROCm 学習サイト

Beginner ROCm Learning Site

https://aets-magi.github.io/ROCm-docs/

GPU の基本、ROCm の全体像、NumPy / PyTorch のつながり、そして「やりたいこと」から入る Python and ROCm 教室をまとめた公開サイトです。

A public learning site covering GPU basics, the ROCm stack, NumPy / PyTorch connections, and a goal-based Python and ROCm course.

  • 理論ページで ROCm と GPU の全体像をつかめます
  • Use the theory pages to get the big picture of GPUs and ROCm
  • Python and ROCm 教室で、13 章の学習コースを順に進められます
  • Follow the 13-chapter Python and ROCm course in reading order
  • 研究ページではなく、入門と学習 UX を主役にした構成です
  • Designed as a beginner entry point rather than a research archive

3

発表と概要

Presentations & overview

実験結果と主張をまとめたスライド・ポスター・実験フローです。発表会場や口頭説明のための資料。

Slides, posters, and the experiment timeline that present the results and claims. Ready for presentations.

Slides

ポスター準拠の補助スライド

Advanced bilingual slides

presentation_advanced_en-jp.html

日英切替つきの補助スライドです。実験設定・再現結果・クラッシュ局在化・追加追試までを1本で確認できます。

Bilingual slide deck covering setup, reproduced results, failure localization, and follow-up tests.

  • 左右キーでページ移動・会場でそのまま表示可能
  • Navigate with arrow keys — ready for direct presentation
Poster

ポスター(日本語 HTML 版)

Poster (Japanese HTML version)

poster-ja.html

A0ポスターと同じ内容・配置を日本語で HTML 化したもの。ブラウザだけで閲覧できます。

The A0 poster content translated into Japanese and laid out as a responsive HTML page.

  • ポスター全7セクション完全日本語化
  • All 7 poster sections fully in Japanese
Case Study

GPU ケーススタディ集

GPU case studies

case-study/case-study-index.html

各 GPU ごとに、実機ログ・再現条件・解釈・未解決点を分けて整理するページ群です。最初のケースとして MI25 / gfx900 を追加しました。

A per-GPU collection that separates observed logs, reproducible setup details, interpretation, and open questions. The first case now covers MI25 / gfx900.

関連リポジトリとして AETS-MAGI/ROCm-MI25-build も案内しています。

The MI25 case also points to the related repository AETS-MAGI/ROCm-MI25-build.

  • Fact / Interpretation / Open Question の3層で整理
  • Organized into Fact / Interpretation / Open Question layers
  • 個別 GPU の話を ROCm 全体の一般論と混ぜない構成
  • Keeps per-GPU observations separate from broader ROCm generalization
Timeline

実験の流れ

Experiment history

experiment-history.html

問題設定から再現確認、モデル依存性の追試、GitHub chronology / PR-context synthesis まで、調査の流れを時系列で整理したページ。

A timeline from problem framing through reproducibility, model-dependency follow-up, and the GitHub chronology / PR-context synthesis phase.

  • 1ページで流れを俯瞰・凡例・やさしい解説つき
  • Single-page overview with legend and non-specialist explanations

4

深掘り

Deep dive

ソースコード・commit・実機ログを根拠にした技術資料です。仮説の構造的根拠、ROCm の設計思想、GitHub 履歴、solver・code トレースを収録しています。

Technical references grounded in source code, commits, and runtime logs — hypothesis evidence, ROCm design analysis, GitHub history, and solver / code traces.

Hypothesis

仮説: なぜ gfx900 はまだ動くのか

Hypothesis: Why Does gfx900 Still Run?

hypothesis.html

capability-based 設計が旧世代を包含しうる理由を、コード・ランタイム・git 来歴から構造的に分析した仮説ページ。

Structural analysis of ROCm's capability-based design encompassing legacy GPUs, grounded in code, runtime, and git provenance.

Design Model

gfx900 が明かした ROCm 全体像

What gfx900 Revealed About ROCm

reveal-hypothesis.html

gfx900 調査を起点に、ROCm 一般の設計思想を GitHub 一次資料で検証した要約ページ。layered support・capability-based fallback・staged deprecation を扱います。

GitHub-grounded summary expanding the gfx900 investigation to ROCm-wide design: layered support, capability-based fallback, staged deprecation, and role splits.

Structure

ROCm の構造と貢献レイヤ

ROCm Structure and Contribution Layers

rocm-structure.html

GitHub 一次資料から layered stack・support の意味の分離・repo topology の統合・AMD とコミュニティの寄与レイヤを整理した独立ページ。

Reads ROCm-wide structure from GitHub primary material: stack organization, split meanings of support, topology consolidation, and AMD / community contribution layers.

History

ROCm GitHub 履歴タイムライン

ROCm GitHub History Timeline

rocm-history.html

commit・release block・issue trail・retired/deprecated repo の痕跡を使った年表。追加・後退・統合・fallback を時間軸で読めます。

Chronology built from commits, release blocks, issue trails, and deprecated repos. Expansion, retreat, consolidation, and fallback on one timeline.

Solver Trace

gfx900 計算経路トレース(ROCm)

gfx900 solver path trace (ROCm)

solver-trace.html

MIOpen・rocBLAS・CK・Tensile における gfx900 推論経路を、ソース行番号と実機ログで対応づけた技術参照資料。

gfx900 computation paths through MIOpen, rocBLAS, CK, and Tensile — source line numbers cross-referenced with real Vega64 runtime logs.

Code Trace

num_gpu コード追跡資料

num_gpu code-tracing deck

code-tracing.html

num_gpu の意味を client → server → runner → llama.cpp まで厳密な行番号で追う単体資料(全11ページ)。

Traces the exact meaning of num_gpu from client to server, runner, and llama.cpp with precise line references. 11-page standalone explainer.

公開メモ: GitHub Pages のルートは /vega-hbmx-pages/ です。この index は相対リンクのみを使っているため、公開URL配下でそのまま動作します。 Publishing note: The GitHub Pages root is /vega-hbmx-pages/. This index uses only relative links, so it works directly under the published site root.
関連プロジェクト: 3/12 IEICE総合大会向けの日本語LLM評価基盤プロジェクト MAGI — AIが検証可能な科学であるために も公開中です。 Related project: See also MAGI — Making AI a verifiable science, an artifact-first Japanese LLM evaluation framework for the IEICE General Conference (Mar 12).