システムアーキテクチャ

システムアーキテクチャ設計、分散パイプラインパターン、マイグレーション記録。

技術メモとして残していた ObsidianノートにAIの要約を利用しています。

Rust (axum) で OpenAI 互換プロキシを設計・実装した経緯と Go 移行に至るまで

Rust (axum) で OpenAI/Ollama 互換プロキシを設計・プロトタイプ実装し、NATS + Dagster の統合を見据えた設計仕様を固めた経緯。SSE + NATS + PG の非 …

Go + NATS + Dagster によるAIオーケストレーション基盤：設計思想からミドルウェア選定まで

Go(Gin)によるOpenAI/Anthropic互換プロキシ、NATS JetStreamイベント中継、Dagster sensorによるジョブ実行、pgvector ANN検索、ColBERTリ …

familiar - ローカルLLMだけで動くマルチエージェント開発基盤を作った話

クラウドAPIに依存せず、自宅サーバーのローカルLLMだけで計画、実装、テスト、レビューを自律実行する familiar を作るまでの発端と初期設計の記録。

llm-jp-4-32b-a3b-base-NVFP4を翻訳運用で評価し、常駐translatorをやめてオンデマンドバッチへ切り替えた

llm-jp-4-32b-a3b-base-NVFP4をvLLM 0.18.0で単GPU検証し、SFT/DPO+LoRA前提から、必要時のみDagsterで翻訳バッチを起動する構成へ切り替えた実測記録 …

自作ハーネス familiar の検証: クラウドエージェント orchestrator と Qwen3-Coder-Next 80B / GLM-5.1 による実地観測

familiar の orchestrator / naughty / grandpa 構成を、Claude orchestrator、Qwen3-Coder-Next 80B …

agent-gateway 構築記 -- Phase 1 リアルタイム知識パイプラインと埋め込みサービスの統合

agent-gateway の Phase 1 構築記録。Go + Gin による OpenAI 互換ゲートウェイの設計から、NATS + Dagster の知識パイプライン …

Gemma 4 + Blackwell 2枚で組む familiar 推論スタックと model-foundry パイプライン

Blackwell GPU 2枚に Gemma 4 ファミリーを載せた familiar 推論スタックの構成設計。NVFP4 + vLLM と IQ4_XS + llama.cpp の使い分け …

agent-gateway 全レイヤーリファクタリング — Clean Architecture 適用と Conflict 解消

agent-gateway の全レイヤー（knowledge / llm / obsidian / pipeline domain、infra、transport）を Clean …

agent-gateway v3 リデザイン — knowledge ドメイン分割と MLflow/Obsidian 統合

agent-gateway の pipeline.knowledge.* 単一ドメインを llm / obsidian / mlflow の3ドメインに分割するリデザイン記録。NATS …

Rust + ONNX で embedding / rerank API を分離して組む設計を固めた

embedding(256d)とrerank(ColBERT 64d, MaxSim)をRust + Axum + ort + tokenizersで実装する前提を固め、doc側ベクトルの事前計算 …

WordPressライクなDjangoブログ基盤をどう設計するかを整理した

WordPressの主要概念をDjangoで再設計するブログ/CMS基盤の仕様書。共通抽象モデル、Termベースのtaxonomy、Django admin中心の運用、段階的な実装順序を整理した。