システムアーキテクチャ設計、分散パイプラインパターン、マイグレーション記録。
Rust (axum) で OpenAI 互換プロキシを設計・実装した経緯と Go 移行に至るまで
Rust (axum) で OpenAI/Ollama 互換プロキシを設計・プロトタイプ実装し、NATS + Dagster の統合を見据えた設計仕様を固めた経緯。SSE + NATS + PG の非 …
Go + NATS + Dagster によるAIオーケストレーション基盤:設計思想からミドルウェア選定まで
Go(Gin)によるOpenAI/Anthropic互換プロキシ、NATS JetStreamイベント中継、Dagster sensorによるジョブ実行、pgvector ANN検索、ColBERTリ …
familiar - ローカルLLMだけで動くマルチエージェント開発基盤を作った話
クラウドAPIに依存せず、自宅サーバーのローカルLLMだけで計画、実装、テスト、レビューを自律実行する familiar を作るまでの発端と初期設計の記録。
llm-jp-4-32b-a3b-base-NVFP4を翻訳運用で評価し、常駐translatorをやめてオンデマンドバッチへ切り替えた
llm-jp-4-32b-a3b-base-NVFP4をvLLM 0.18.0で単GPU検証し、SFT/DPO+LoRA前提から、必要時のみDagsterで翻訳バッチを起動する構成へ切り替えた実測記録 …
自作ハーネス familiar の検証: クラウドエージェント orchestrator と Qwen3-Coder-Next 80B / GLM-5.1 による実地観測
familiar の orchestrator / naughty / grandpa 構成を、Claude orchestrator、Qwen3-Coder-Next 80B …
agent-gateway 構築記 -- Phase 1 リアルタイム知識パイプラインと埋め込みサービスの統合
agent-gateway の Phase 1 構築記録。Go + Gin による OpenAI 互換ゲートウェイの設計から、NATS + Dagster の知識パイプライン …
Gemma 4 + Blackwell 2枚で組む familiar 推論スタックと model-foundry パイプライン
Blackwell GPU 2枚に Gemma 4 ファミリーを載せた familiar 推論スタックの構成設計。NVFP4 + vLLM と IQ4_XS + llama.cpp の使い分け …
agent-gateway 全レイヤーリファクタリング — Clean Architecture 適用と Conflict 解消
agent-gateway の全レイヤー(knowledge / llm / obsidian / pipeline domain、infra、transport)を Clean …
agent-gateway v3 リデザイン — knowledge ドメイン分割と MLflow/Obsidian 統合
agent-gateway の pipeline.knowledge.* 単一ドメインを llm / obsidian / mlflow の3ドメインに分割するリデザイン記録。NATS …
Rust + ONNX で embedding / rerank API を分離して組む設計を固めた
embedding(256d)とrerank(ColBERT 64d, MaxSim)をRust + Axum + ort + tokenizersで実装する前提を固め、doc側ベクトルの事前計算 …
WordPressライクなDjangoブログ基盤をどう設計するかを整理した
WordPressの主要概念をDjangoで再設計するブログ/CMS基盤の仕様書。共通抽象モデル、Termベースのtaxonomy、Django admin中心の運用、段階的な実装順序を整理した。