読むのがホネな技術書やビジネス書を取り上げて2週間の読書期限を課して読んでアウトプットする仮想読書会「デッドライン読書会」の第85回。同僚と読書期限を約束することによって積読が確実に減るという仕組み。過去記事はこちら。
さて、今回読む本は引き続き「SREをはじめよう ―個人と組織による信頼性獲得への第一歩」だ。発売から1年間も積んでしまった本である。前回は前半を読んだので、今回は後半「第Ⅲ部 組織がSREをはじめるには」を読んでいる。
前半の感想はこちら。
agnozingdays.hatenablog.com
「SREをはじめよう」後半および全体の感想
超良い本である。ただしSRE初心者が手に取るべきではない(SRE本または他の初心者向けの本を読もう)。SREを学んでいる人、実践している人にとっては極めて優れた知見やアドバイスを得られる本だろう。なにせ 人気コミュニティSREconカンファレンスの共同創設者が、おすすめの講演動画や資料を示しながらノウハウを(面白おかしく)伝授してくれるのだから。
あともう1点のポイントは、単著であることだろう。(ちゃんと読み返していないのだけど)オライリーの各種SRE本は論文集のような体裁で章ごとに著者が異なっている。しかし本書は筆者単独の著作であり、一貫性というか読みやすく理解しやすいような気がする(あと、著者の文章は面白い)。
ちなみに前半の感想を書いた時には気づいていなかったのだけれども、日本語版訳者の山口さんが本書についての解説記事(書籍紹介イベントの講演動画つき)を公開していた。本書の概要を把握したい場合は閲覧すると良いだろう。
「SREをはじめよう」後半の気になったポイント
以下は読んでいて興味深いと思った点などのメモだ。
11章 成功のための組織的要因
- 組織がSREを導入させるときのポイント集。SREに限らず、何かの取り組みを始める際の良いチェックポイントという印象。流用したい。
- How Complex Systems Fail このページは知ってた。「複雑なシステムがどのように失敗するか」
- SREcon17の講演「Care and Feeding of SRE」あとで見る。https://www.usenix.org/conference/srecon17europe/program/presentation/desai
12章 SREはいかにして失敗するか
- こんな一文から始まるのが好き「失敗から学ぶことの価値を繰り返し強調する本書の中で、同じ考えをSRE自身に適用するチャンスを逃すわけにはいきません」
- SREが失敗する兆候集。
- 結びに、SREが失敗しても、SREらしくインシデントレスポンスしようと書かれていて、これはなるほどと思った。
13章 ビジネス視点からのSRE
- SREに関するマネジメント経験者による対談形式で、ビジネスサイドとの調整などについて語られる章。
14章 Dickersonの信頼性の階層構造(良い出発点)
15章 SREを組織に組み込む
- 組織に対してSREが有効ということがわかった。ではどうやって導入するのかという話。
- SRE組織の形態パターン(統合モデル。本書では「中央集権型/パートナー型モデル」「分散型/埋め込み型モデル」「ハイブリッド型モデル」が示されている)が興味深い。
16章 SRE組織の進化段階
- SREcon18の講演「The Evolution of Site Reliability Engineering」あとで見る。https://www.usenix.org/conference/srecon18asia/presentation/purgason
- 消防士>ゲートキーパー>提唱者(アドボケイト)>パートナー>エンジニア
17章 組織におけるSREの成長
- SRE組織のスケールアップについての著者の見解。
- 人数のスケールアップについて、オンコールローテーションの安定性とあわせて検討している点が素晴らしい。参考にしたい。(日本でも同じように考えられるかは別として、人道的なオンコールローテーションを行うために著者は6名を最低と考えているということ)
18章 おわりに
- あとがきの章。著者から示される「お土産」としてのメッセージが素敵だった(ぜひ本を購入して確認してみてください)
付録A 若きSREへの手紙(リルケさんすみません)
- 著者の知るSRE業界の有識者からの「若きSREへの手紙」集。たいへんよい。
- John Amoriさんの以下の文章が心にぶっささった。
すべてのシステムがあなたの期待通りにエレガントに設計されているわけではなく、さらに多くのシステムはあなたの制御の及ばないところで改善されていることに気づくでしょう。 何でもできるわけではなく、最善を尽くしても、いずれは必ず壊れてしまうということを覚えておくことが重要です。 ここで、この知恵を授けます、「備えよ」。
付録B 元SREからのアドバイス
- 付録Aは現役SREからのメッセージのようだが、付録Bでは引退したSREからのメッセージが示される。これもかなり興味深い。
付録C SRE関連資料
- 関連資料集である
- とても良いと思ったのは、この中で「歴史的文書」という項があること
というわけで、非常にためになり、かつ面白い本だった。というわけで無事に読了! さて次は何を読みますかね。
現在気になっている技術書はこんな感じ。どの本がおすすめですかね
- セキュアで信頼性のあるシステム構築 ―Google SREが考える安全なシステムの設計、実装、保守(これは本書で紹介されていたから)
- ソフトウェアエンジニアガイドブック ―世界基準エンジニアの成功戦略ロードマップ(発売されたばかりの話題の本というイメージ)
- プラットフォームエンジニアリング ―成功するプラットフォームとチームを作るガイドライン (なんとなく気になっている)
- AIエージェント 人類と協働する機械(なんとなく気になっている)
- バイブコーディングを超えて ―AI時代を生き抜く開発者の未来(あ、これはまだ未発売か)
*1:ボーデインの「キッチン・コンフィデンシャル(新装版)」は個人的にとても大好きな仕事論なので
