2018-01-04

2017年下半期に読んだ本まとめ

book

2017年7月～12月に読んだ本のまとめ。カウント対象は期間中に読み終わったものに限り、読みかけの本は対象外としている。あと雑誌コミック類もけっこう読んでいるのだけれども、これは除外。

2017年下半期に読んだ本

2017年7月～12月に最後まで読み終わった本はこんな感じ。

オススメ文芸書編

たまたま2017年下半期はパラレルな世界を扱う2小説を読んだ（「1Q84」「クォンタム・ファミリーズ」）のだけれども、どちらもよかった。それぞれ過去の作品のオマージュという意味でも相似形を成しているのが興味深い。「1Q84」とオーウェルの「1984」、「クォンタム・ファミリーズ」と村上春樹の「世界の終わりとハードボイルドワンダーランド」という関係。あえて一冊を選ぶなら「クォンタム・ファミリーズ」を推す。量子コンピュータについても盛り上がっていることだし（本作品は量子コンピュータにも少し関係がある）。

クォンタム・ファミリーズ (河出文庫)

作者:東浩紀
発売日: 2013/02/05
メディア: 文庫

オススメビジネス書編

面白さだけで言えばルイスの「かくて行動経済学は生まれり」である。鉄板の面白さ。なお本作で興味を持った勢いで、「ファスト＆スロー」まで読むのがベストだと思う。

かくて行動経済学は生まれり (文春e-book)

作者:マイケル・ルイス
発売日: 2017/07/14
メディア: Kindle版

ファスト＆スロー　（上）

作者:ダニエルカーネマン,村井章子
発売日: 2012/12/28
メディア: Kindle版

ファスト＆スロー　（下）

作者:ダニエルカーネマン,村井章子
発売日: 2012/12/28
メディア: Kindle版

オススメ技術書編

Googleで実際に利用されている運用、システム管理に関するベストプラクティスを紹介する論文集である、いわゆるSRE本が素晴らしかった。

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

発売日: 2017/08/12
メディア: 単行本（ソフトカバー）

なお原著の内容は全て公開されているのだけれども、日本語で読めるというのが有難い。

この半期の振り返り

実は10月頃から仕事が非常に忙しくなってしまって、あまり読書に投じる時間が作れなかった。というわけで、かなりの本を積んでしまっている状況である。かなり、まずい。
あと、上記まとめには含んでいないのだけれどもこの半年で雑誌類の（継続的な）購読を完全にやめてしまった。ずいぶん前から新聞も取らなくなっているので、紙に印刷された文字を読む機会はずいぶんと減ったことになる。なお仕事的にもペーパーレスが進んでおり、印刷物を見る機会も減っているので、なんというか少しずつ風景が変わり始めているような気がしている。

過去の読書ふりかえり記事

2017-10-29

Incident Command Systemについて調べた

Project Management

Google SRE本を読み終わった。いや、これはすごい本だ。しかし非常に広範囲なプラクティスの詰め合わせ（というか論文集だ）のため、完全に消化不良である。ゆえに、同書で気になった箇所を少しずつ整理検討しているのだけれども、そのひとつがIncident Command Systemである。これはすぐに使いこなしたいプラクティスだと思っている。まぁ、仕事の規模や質次第かも。

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

作者: 澤田武男,関根達夫,細川一茂,矢吹大輔,Betsy Beyer,Chris Jones,Jennifer Petoff,Niall Richard Murphy,Sky株式会社玉川竜司
出版社/メーカー: オライリージャパン
発売日: 2017/08/12
メディア: 単行本（ソフトカバー）
この商品を含むブログを見る

Incident Command Systemとは何か？

14.3 インシデント管理のプロセスの構成要素
インシデント管理のスキルとプラクティスは、熱意ある個々人のエネルギーを正しい方向に向けるために存在するものです。Googleのインシデント管理のシステムは、明快でスケーラブルであることで知られるIncident Command Systemに基づいています。
SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

いや、知られていないよ！知らなくてごめんなさい！
英語版は全文公開されているので、興味があればこちらから該当箇所が読める。Google - Site Reliability Engineering

何かと思ったら、災害（障害）発生時の対応組織をボトムアップに（ブートストラップ的に）構成する標準化されたマネジメントシステムだった。消防とか警察とか軍事関連のように見える。いろいろ調べてみたけれども、以下のWikipediaの記事が一番わかりやすい印象。

インシデント・コマンド・システム - Wikipedia
1人の監督者（インシデント指揮者）が5-7名までのメンバーで構成される臨時組織を立ち上げて問題に対処する。指揮者の監督限界を超えた場合は組織を分割しなければならない。
指揮、実行、計画、後方支援、財務・総務の5つの機能をチームで分担して実行する。

米国では、1970年代、多くの山火事が発生し、当時の現場指揮官が、

一度に多くの人が、一人の監督者に報告するので処理しきれない（上がって来る報告を溜めるバッファがない）。

関係機関がそれぞれ異なった組織構造になっており、組織的な対応が困難。

信頼のおける情報が流れてこない。

通信装置や通信手順が統一化されていない。

関係機関の間で共通の計画を策定するシステムがない。

指揮命令系統が不明確。

関係機関が使用する用語が統一化されていない。

目標が不明確。

等の多くの問題に直面したため、1979年に消防大学校（Fire Academy）が次のコンセプトの下で「ICS」を開発した。
インシデント・コマンド・システム - Wikipedia

というわけなので、ITシステムの障害対応においても上記のような対応の失敗や課題に直面したことがあれば、採用検討に値するものではないかと思っている。

参考

2017-10-16

情報システムの障害状況ウォッチ（2017年前半）

Postmortem Project Management

SEC Journal50号で2017年後半の情報システム障害状況まとめが公開されたので読んでみる記事。単なる野次馬なんだけれど、勉強になるので続けている。

過去に書いた関連記事は以下の通り。

SEC Journal最新号の入手はこちらから。

最新号とバックナンバー：IPA 独立行政法人情報処理推進機構

情報システムの障害状況ウォッチ（2017年前半）

詳細はSEC Journalを確認いただくとして、掲載されているトラブル事例をいつもどおりニュース記事などとザックリ照らし合わせてみた。なお今期は割と注意して日経コンピュータ記事を読んでいたので、前期よりは情報は充実しているつもり。また4桁数字は元ネタ記事にあるトラブルNo.である。

[1701]ATM設定ミスで利用手数料の誤徴収(2017/1/10)
- りそな銀行、ATM手数料を誤徴収システム設定にミス - ITmedia NEWS
- ATM手数料の誤った引き落としについて|ニュースリリース|埼玉りそな銀行
- プレスリリースを見れば一目両全なのだけれども祝日と平日の料金テーブルの設定ミスか、祝日設定のミスのどちらかだろう(逆転してしまっている)。
[1702]学習塾の運用システムの移行不備で一部申込不可、教材作成不可、発送事務不能(2017/1/11)
- Z会、システム障害で教材準備できず最大10万人に影響 - ITmedia NEWS
- | Ｚ会 | 日々の学習から受験・資格まで、本物の学力を養成する教育サービスを提供。
- 詳細は不明ながらいろいろな情報をまとめると、このような事態だった模様
  - 新基幹システムの移行に失敗した(移行作業の問題なのか、移行後システムの品質の問題かは不明)
  - 旧システムでは新しい教育サービスの継続は出来なかった
- なお実は我が家はユーザとして影響を受けており、4月新学期の前後はかなり不安な状況だった。教材発送の遅れなどもあったが、無事に収束して良かったという印象
[1703]電力託送業務システム不具合で電力業者間で取引影響(2017/1/12)
- 電力会社のシステム不具合が相次ぐ、中部電力に続いて北海道電力でも (1/2) - スマートジャパン
- 北海道におけるエリアインバランス誤算定に関する報告について - 北海道電力
- プレスリリースにリンクされているPDFの整理が詳しいが「制度変更の情報収集不十分」「仕様確認不十分」などが原因でプログラムでまるっと考慮が漏れていた印象。
- しかし、他の送配電事業者～電量取引所を含めた関係者間の全体テストはどうやってパスしていんだろうという点は疑問。この手の算定業務は一度正解を作ってテストするのが自然だともうのだけれども・・・
[1704]電力料金請求システム不具合と運用ミスで誤請求など(2017/1/15)
- 中部電力｜電気料金に関わるシステム更新に伴うシステム不具合に起因したお客さまに対する誤請求等について - プレスリリース（2017年）
- 中部電力｜電気料金請求に関わるシステム不具合の調査結果等について - プレスリリース（2017年）
- 1/27プレスリリースの添付資料が詳しい。割と一般的なシステム開発のミスがフルセットでおきていた様子。
- 不謹慎だけれども、整理の仕方がキレイなので再利用できるなぁ、などと考えてしまったり
[1705]臓器移植患者検索システム不具合で臓器提供選定ミスなど(2017/1/27)
- ニュース - 臓器移植患者選定のシステムに不具合、患者2人が心臓移植受けられず：ITpro
- 日本臓器移植ネットワーク｜お知らせ - 2017年
- 日本臓器移植ネットワーク｜お知らせ - 2017年
- 日本臓器移植ネットワーク｜お知らせ - 2017年
- 2016年から稼動した新レシピエント検索システム(E-VAS)にプログラム不備があり選定誤りがあったもの。第三者検証がされており、かなり詳細な情報が閲覧できる。
- 優先順位の決定には待機時間の長さが関係しているようだが、患者データを更新する際にプログラム不備により「情報更新日」がデータベースに書き込まれなかったことが原因の模様。
- またテストはあったがテスト条件から問題に気づきにくい(初期登録日と同一日に更新している＝更新成功が検証できない)とかテストシナリオが漏れているとかお腹の痛くなる説明である。
[1706]電力託送業務システム障害で電力業者間で誤請求(2017/1/27)
- 東京電力が託送料金を誤請求、41社に3145件 - スマートジャパン
- 小売電気事業者さまに対する託送料金の誤請求について｜プレスリリース・お知らせ一覧｜東京電力パワーグリッド株式会社
- 小売電気事業者さまへの託送料金誤請求に関する報告について｜プレスリリース・お知らせ一覧｜東京電力パワーグリッド株式会社
- 2/14のプレスリリースに添付された報告書だと「サービスシート」という名前の不整合データを検知するシステム機能があったものの、この出力結果をもとに人間が実施するフォロー業務のマニュアル不整備などが原因で、うまくいかなかったように見える。
- 一方で SEC Journal記事だと「4営業日以内に通知すべき需要データ未通知」「誤通知」などの記載もあり、もっといろいろソフトウェア的な問題が発生したようにも見える。
[1707]電子申告納税システムがアクセス集中と不具合で手続出来ず等(2017/1/27)
- ニュース - eLTAXが一時接続障害、総務省は地方公共団体に申告期限の延長を要請：ITpro
- eLTAX ｜ eLTAXへの接続障害について（これまでの経緯等）
- eLTAX ｜ eLTAXへの接続障害について（これまでの経緯と再発防止対策）
- アクセス集中によりシステムの負荷上限を超過したというものらしいが、上記プレス等では「つながりにくい」という表現になっている一方で、SEC Journalの記事だと「受付が未完了なのに送信完了と表示される」といった記載もあるのでいろいろ起こっていた模様。
[1708]電車運行管理システム作業ミスで運行影響発生(2017/1/27)
- ＪＲ鹿児島線：トラブル相次ぐ６万７０００人に影響 - 毎日新聞
- 会員登録のお願い - 毎日新聞
- 外部業者が指令所内の電源装置のバッテリーの交換をしていた際、予備電源に切替える際に不具合が発生。さらに予備電源を供給するための配線にも誤りがあってトラブルを防ぐことができなかったとのこと。
[1709]マイナンバーコンビニ交付システム、ネットワーク障害で利用できず(2017/2/13)
- 地方公共団体情報システム機構ネットワークの障害による一部の団体におけるコンビニ交付サービスの支障について（ご報告）
- 地方公共団体情報システム機構 2月13日に発生した「ネットワークの障害による一部団体におけるコンビニ交付サービスの支障」に係る再発防止策について（報道発表）
- 微妙に報告書がぼやかされている印象があるが、ルータ故障の問題というよりは、その後の復旧手順の不備（ルータ再起動、回線切り戻しがうまく実行できなかった）の模様。
[1710]動画配信サービス、アクセス集中と障害で視聴できず(2017/2/26)
- DAZN、Jリーグ視聴不具合の原因はスケジューリングシステム構築誤差--CEOがコメント - CNET Japan
- 「DAZN」Jリーグ中継不具合、原因が判明データベースが破損 - ITmedia NEWS
- 発生当時いろいろ話題になったので各種報道があるのだけれども、結論としては見逃し配信やハイライトの編集を行うパッケージソフトウェアで大量の編集ログが生成されDB圧迫、最終的にはエンコーディングを行うシステムが停止したというもの。また予備系はあったものの、切り替えてもダウンする可能性あり切替不能だったとのこと。
[1711]免許管理システム不具合で免許更新事務できず(2017/3/15)
- いろいろ調べたが報道記事発見できず。
- SEC Journalによれば、12日施行の改正道路交通法の対応でプログラム修正したところ不具合があったとのこと。
[1712]免許証システムトラブルで免許証発行できず(2017/3/26)
- 免許証交付できずセンター不具合深夜までに復旧 - 大分のニュースなら大分合同新聞プレミアムオンライン Gate
- 当初は通常通り作業できていたが、途中から新たな免許証発酵ができなかったとのこと。詳細不明。
[1713]銀行振込システムトラブルで振込できず(2017/3/24)
- りそな銀、一時システム障害４万６千件振り込みできず：朝日新聞デジタル
- 回線トラブルであった模様
[1714]コンテナ車両待機上入退場システムでトラブル(2017/3/28)
- 東京港埠頭、新車両待機場の運用を中断システムトラブル原因特定できず - 物流ニッポン
- 大井新車両待機場システム障害で運用中断 | ロジウィークリー・物流業界No.1の専門紙
- ToPo-INFo 全体状況
- 詳細不明だが、原因不明で現在も運用されていないようだ。
[1715]カードネットワーク機器故障でカード決済できず(2017/4/15)
- ニュース - CARDNETのクレジット決済に6時間強障害、原因はL3スイッチ故障：ITpro
- 4月15日 CARDNETセンターの障害について
- L3スイッチ故障、二重化してあったがトラフィック集中で輻輳とのこと。JCBやニコス、JR東日本のえきねっとなどに影響が出たとの事。
[1716]気象予報士会サイト設定ミスで個人情報流出(2017/4/23)
- 気象予報士389人の個人情報流出日本気象予報士会：日本経済新聞
- 表題の通りだが、パスワード設定漏れ。特定の集団だけが利用する団体サイトとはいえ、設定ミスは大事になるという例のような。
[1717]マイナンバーカード発行システム設定ミスで利用できず(2017/4/28)
- ニュース - J-LIS、マイナンバーカード発行システムのバージョンアップで不具合：ITpro
- 新機能を利用するためのバージョンアップをすると利用できないという不具合、設定ミスとあるが詳細は不明
[1718]動画配信サービス移行障害で視聴できず等(2017/5/17)
- システムリニューアルに伴う不具合のお詫びについて | Hulu News&Information
- huluのリニューアル・トラブル、問題を残しつつ収束へ～それは、なぜ起こったか～(境治) - 個人 - Yahoo!ニュース
- Hulu、リニューアルによる不具合で謝罪--動画が再生されず - CNET Japan
- 複合的要因でサービスが一時的にまっとうに利用できなかった例。最後のCNETの記事が事象に対して俯瞰的。
[1719]銀行送金システム障害で送金遅延(2017/5/25)
- ニュース - 新生銀行で障害、データ送信の漏れが生じ送金3.7万件に遅延：ITpro
- 送金情報のサーバ間連携で漏れ（データロスト？）がありエラー発生。欠損を除去して再処理したそうだが、詳細は不明。
[1720]気象観測システムハード障害で空港運行遅延(2017/5/26)
- 羽田空港の気象観測システム故障、出発機に遅延 - 空からマリコ「安全第一」
- ニュース記事がほとんど見当たらなかったのだけれども、気象庁が管理している羽田空港の気象観測システムのサーバ故障によりデータ配信がされず、出発便に遅延が発生したとのこと。冗長化はどうなっていたのだろうか。
[1721]クラウド決済システム障害で電子マネー決済できず(2017/5/29)
- ニュース - イオングループでクラウド決済「J-Mups」に障害、システム更改が原因か：ITpro
- ソフトウェア障害とのことだが「障害の原因などの詳細は公表を差し控える」というのがちょっと残念。
[1722]ネットオークションサイトトラブルで出品や決済サービス利用できず(2017/6/19)
- ニュース - ヤフオク！のシステム障害、出品や発送が2日間停止：ITpro
- オーダーフォームにアクセスできない不具合【復旧済み】 -お知らせ - ヤフオク!
- 詳細は不明だが、出品者向けツールに不具合があった模様。
[1723]郵便e発送サービス障害で荷発送できず(2017/6/28)
- ニュース - ［続報］日本郵便の「e発送サービス」障害、全面復旧は週明け以降に：ITpro
- 「e発送サービス」におけるコンビニエンスストアとのシステム連携障害について - 日本郵便
- 「e発送サービス」におけるコンビニエンスストアでの荷物の差出再開 - 日本郵便
- 原因は不明だが、なんと6月末に発生した問題の解消が10月までかかっていた模様。
- ゆうゆうメルカリ便でトラブル多発！多いトラブルは？（10/12追記あり） - メルカリに出品してみた。の記事で生々しい経緯確認ができる。日本郵政のシステムとLoppiの連携に問題があったように読み取れるが、ソース不明である。

数が多すぎて、調べるのも一苦労。

失敗学のすすめ (講談社文庫)

作者: 畑村洋太郎
出版社/メーカー: 講談社
発売日: 2005/04/15
メディア: 文庫
購入: 30人クリック: 182回
この商品を含むブログ (169件) を見る

上司・部下間のコミニュケーションのKY問題

Project Management

最近コミニュケーションに関するいくつかの問題が身近にあって、いろいろと考えたことを書く記事。上司部下間のコミニュケーションの問題には階層があって、いちばん改善すべきなのは部下側ではなく上司側の問題だと思っていることについて。なお、顧客との（もしくは受発注者間の）コミュニケーションの話はまた別。

「コミュ力」の問題はだいたい上司の問題説

あくまで主観的なものだけれども、いわゆる「コミュニケーション能力（いわるゆコミュ力）」の問題の多くは実際には上司（情報の受取り手）の問題で、部下（出し手）の問題は小さいと思っている。

最近読んだ本だと「職場の問題地図」がこの問題を非常に明快に示していた(ちなみに同書はとてもおすすめ)。

3丁目報連相できていない

部下の伝えるスキルが低い

報・連・相のやり方がなっていない

適切なタイミングで報・連・相していない

上司の受け止めるスキルが低い

報連相をする場やルールがない

上司が忙しすぎて、部下が話しかけるタイミングがない

報・連・相のフォーマットがない

職場の問題地図 ?「で，どこから変える？」残業だらけ・休めない働き方

職場の問題地図 ?「で，どこから変える？」残業だらけ・休めない働き方

作者: 沢渡あまね
出版社/メーカー: 技術評論社
発売日: 2016/09/16
メディア: Kindle版
この商品を含むブログを見る

「部下の伝えるスキルが低い」と書かれていると部下の問題のようにも読めるけれども、適切な報告の仕方を指導教育していないという意味ではこれも職場や上司の問題である。同書でオススメしている指導フォーマットは次のようなもの。

所用時間を示し相手の都合を確認する
まず「報」か「連」か「相」かを伝える
結論を伝える
論点を数で示す（ナンバリング）

「小松課長、いま５分間お時間よろしいですか？決算早期化プロジェクトの進め方について、ご相談が２点あります。キックオフの日程と、会場についてです。まず１点目の日程について。日程は延期すべきと思います。なぜなら・・・・」
職場の問題地図 ?「で，どこから変える？」残業だらけ・休めない働き方

こういった情報の受け止め方、どういう形で吸い上げるのかという業務プロセス設計上の問題を無視して、「アイツはコミュニケーション能力が低くて、情報が上がってこないんだよな」などと言ってはいけないという話だと思っている。

部下／メンバーに空気を読ませる時点で負け

報告の仕方というテクニック的な側面もあるとは思うけれど、むしろ問題の根っこには、雑なアサインメントやプロセスの組み立てによって、部下やメンバーに「空気を読ませすぎている」ことだと考えている。もちろん問題にはグラデーションがあって、どこまでやれば正解で、どこからが不備という線引きはできないのだろうが、

責任範囲が不明確
裁量の範囲があいまい
やっていいことと、いけないことの線引きがあいまい
上司や組織の意思決定が場当たり的で一貫していない
過去の意思決定の精度が不明なので踏襲していいのか常に不明

などが原因となって、なにをどこまでコミニュケーションすべきか常に空気を読みながらやらなければいけない状況が発生して、非効率やコンフリクトが発生しやすくなるのではないだろうか。

ではどうするか。いろいろ考えてみたのだけれどもまずは空気を読ませないために、個々人の役割を具体的かつ明確にするのが良いかと思っている。たとえばちゃんと職務記述(Job Descriotion)を書けばいいのではないだろうかというのが現時点での個人的な結論だ。

職務記述書 - Wikipedia
Associate Solutions Architect - ジョブID：533787 - Amazon.jobs　例としてのAWSさんのJob Descriotion
7 Steps to Writing the Best Job Descriptions | The Magnet || presented by Ongig

ひょっとしたらうまく対応できている組織や現場も多いのかもしれないが、割と日本企業の多くはこういった形で個々人の職務内容を明確化しないのが一般的じゃないかと思っている。

マネジメント側が組織やプロジェクトへのアサイン完了した段階で思考停止しまう
何をすべきかを「考えることからが仕事だ」といってしまう、組織設計不備の責任転嫁

というあたりが根っこにあるのではないだろうか。

つまり、「空気読めよ」という批判はどれも他のフレーズに言い換えることができるわけだ。「空気読め」と言って個人を批判すれば、自分の考えや意向、思っていることを明確に言葉にする必要がないので、話者のコミュニケーションの怠慢とも言えなくはない。自分を含めた“周りの意向”を非常に曖昧な「空気」という言葉で表現し、空気にそぐわない個人へ責任転嫁しているだけの話である。
なぜ「空気読め」が日本人のコミュニケーションをダメにするのか？「空気読めない人」に対する海外の反応

場の空気 - Wikipedia

ただし、これはあくまで組織内の話でである

というわけで、組織やプロジェクト内部で部下に「空気を読ませる」ことは悪手だと思っている。が、顧客や発注者に対しても同じ論法が通じるかというと、それはまた別の話だろう。「空気を読ませるようなRFPを出す発注者が悪い」と言ってはいけない（もちろん限度はある）。この場合は「空気が読める」ことは付加価値だからである。このあたりはまたどこかで考えてみるつもり。

一流の人は空気を読まない (角川oneテーマ21)

作者: 堀紘一
出版社/メーカー: 角川グループパブリッシング
発売日: 2008/10/10
メディア: 新書
購入: 9人クリック: 202回
この商品を含むブログ (21件) を見る

2017-09-06

日経コンピュータ2017/8/3号特集「変わるITトラブル」を読んだ

Project Management Postmortem

趣味のITトラブルウォッチャー活動として、日経コンピュータ2017/8/3号の特集「変わるITトラブル　実例1096件分析、新事実が明らかに」を読んだ感想。日経コンピュータ創刊の1981年から現在まで「動かないコンピュータ」コーナーなどに掲載された事例を分析したというもの。なお記事には残念ながらデータは掲載されておらず。

突然のシステムダウン、システム刷新プロジェクトの失敗----。
1981年の本誌創刊号から2017年までにわたって「動かないコンピュータ」などに載せたトラブル事例は実に1098件。これらを分析して、トラブル防止につながる知見を得られないか、こう考え、セキュリティ関連、システムダウン、開発失敗というITトラブルの3大リスクを対象に様々な角度から調べてみた。すると、知られざる傾向と対策が見えてきた。

日経コンピュータ2017/8/3号特集「動かないコンピュータ変わるITトラブル　実例1096件分析、新事実が明らかに」

なお記事の詳細は同誌を確認いただきたい。

三大リスクは本当に「三大リスクなのか？」

最初に気になったのは、この特集で取り上げられた三大リスク（セキュリティ、システムダウン、開発失敗）が本当に重要なものなのかがよく分からなかったというもの。概要でもいいのでデータ全体に触れられていれば良かった。もちろん掲載されているリスクはそれぞれ重要なものではあるが。

三大リスク①セキュリティ編

不具合やハードの故障以外の要因として、サイバー攻撃や脆弱性関係のトラブルが大きなリスクとなりつつあるという分析。記事の中では以下のような分析があって興味深い。

システムダウンの原因別割合(年代別) 日経コンピュータ調べ
- 2010年代から急増
セキュリティに関連したトラブルの原因別割合(2010年代) 日経コンピュータ調べ
- サイバー攻撃・脆弱性関係が8割以上を占めている
クレジットカード不正使用被害の発生状況(2014年-2016年) 日本クレジット協会調べ
- 2015年以降急速に増加

嫌な世の中になったものだ、といっても仕方が無いのだけれども、ユーザの要求に従ってシステムを構築しただけではNGな時代に突入したということだと理解している。また、セキュリティのリスクは常に(攻撃手法等や発見される脆弱性が)変化するので、システム開発時だけではなく運用でもどう刈り取っていくのかよく考えなくてはならない点だ。個別エンジニアのスキルで討ち取るのは困難なので、支援体制がちゃんと整っているかどうかがポイントだと思っている。

しかし、この傾向は別に日本に限った話でもないわけで、そういう意味ではグローバルのトレンドも気になるところだけれども、どこかに整理されているものはないか、別の機会に調べてみようと思っている。

三大リスク②システムダウン編

システムダウンのうち「全面ダウン」の比率が10年代に比率として増加しているという話と、いくつかの最近増加しているトレンドについて整理されている。こちらの章で紹介されている分析は以下の通り

システムダウン全体に占める全面ダウンと一部ダウンの割合(年代別) 日経コンピュータ調べ
- 2000年代で若干全面ダウン比率下がるも、2010年代でまた上がる
全面システムダウンの原因別割合(年代別) 日経コンピュータ調べ
- ハード起因の比率が微増
ハードウェア故障の原因別割合(年代別) 日経コンピュータ調べ
- サーバーに起因するトラブルが増加
平均ダウン時間の変化(年代別) 日経コンピュータ調べ
- ダウン時間は増加トレンド

記事を注意して読まないといけないのは、システムダウン自体が増加しているわけではなくて、システムダウンのうち「全面ダウンの比率」が増えているという件。件数自体は2000年代から2010年代は減っている。もちろん、件数としてカウントされているのは日経コンピュータの取材、情報収集の範囲に限定されるので実際にシステムダウンが増えているのか、減っているのかというのはなんとも言えないように思える。

ただ、平均的なシステムの複雑度は以前より上がったのは事実だと思っている。

そもそものシステムに対する要求がゼロ年代から難易度アップ
システム間の連携も複雑化（というか世の中のシステムが増えた）
ゼロ年代に構築されたシステムが再構築を経て魔窟化、もしくは延命されて妖怪化
採用テクノロジーが複雑化、組み合わせが多様化

で、複雑度が上がれば予期せぬ全面ダウンのリスクも増えるわけで、アンチフラジャイルとかレジリエンスなどは今後重要なテーマになっていくような気がしている。

ソフトウェアにおけるアンチフラジャイルとレジリエンス - 勘と経験と読経

反脆弱性[上]――不確実な世界を生き延びる唯一の考え方

作者: ナシーム・ニコラス・タレブ,望月衛,千葉敏生
出版社/メーカー: ダイヤモンド社
発売日: 2017/06/22
メディア: 単行本
この商品を含むブログを見る

反脆弱性[下]――不確実な世界を生き延びる唯一の考え方

作者: ナシーム・ニコラス・タレブ,望月衛,千葉敏生
出版社/メーカー: ダイヤモンド社
発売日: 2017/06/22
メディア: 単行本
この商品を含むブログを見る

三大リスク③開発失敗編

システム開発失敗の主因は要件定義にあるというストーリー。ただ、ここでも注意が必要で、システム開発失敗の件数そのものは減少傾向である。失敗はしにくくなったが、失敗するときには要件定義工程で大コケする、という話と考えたほうがいいと思っている。本章で提示されている分析は以下の通り。

開発失敗の4大要因とその割合(年代別) 日経コンピュータ調べ
- 2000年代から2010年代について、トップ要因は「ユーザ企業が要件をまとめられず」であるが、2位の「ベンダーが要件を理解できず」が2000年代再開から急浮上している
工期遅延理由の分類 JUAS「ユーザ企業ソフトウェアメトリックス調査2016」より
- 遅延理由の4割が要件定義関連
開発失敗の事例におけるソフトウェア開発形態別の割合(年代別) 日経コンピュータ調べ
- パッケージ導入タイプの失敗が大幅に増加
開発失敗により稼動延期期間の割合(年代別)
- 稼動延期期間は短縮傾向、超リスケは減っている

システム構築の受注者側であるSIベンダ等の開発能力や管理能力の向上の結果、適切な要求オーダーがあればシステムを完成させる能力は向上していると思っている（もちろん色々な課題はある）。ボトルネックが要件定義などのいわゆる上流工程に移っているという理解。発注者・受注者の共同作業である要件定義で、どちらかの能力不足によって「ユーザ企業が要件をまとめられず」または「ベンダーが要求を理解できず」で失敗するというのは当然だろう。

あと記事では言及されていないけれど個人的に気になるのは、システム再構築プロジェクトの増加だと思っている。記事の中では「再構築プロジェクトは大規模・ビックバンになってしまい開発規模の大きさからトラブルになりやすい」といったニュアンスの言及はあるけれども、再構築プロジェクトそのものの難しさ、要求／仕様抽出の困難性や人的要因（「わかる人がもういない」）は失敗トレンドの変化に越境を強く与えているのではないか。まぁ、あくまで感覚論なのだが。

なぜ、システム開発は必ずモメるのか？

作者: 細川義洋
出版社/メーカー: 日本実業出版社
発売日: 2014/08/01
メディア: Kindle版
この商品を含むブログを見る

2017-08-28

ポジティブな客先常駐システム開発を考える

Project Management

株式会社アクシアさんのブログで、常駐開発バッシング(?)記事が最近掲載されている(http://axia.co.jp/2017-08-01)ことについて考えている。指摘されているような「不適切な常駐開発」というのは確かにあるのだろうけれども（ちなみにあまり目撃したことはない）、適切に運用すればポジティブな常駐開発も有りえるはずだし、自分は一応そうやってきたと思っている。じゃあ、注意すべきところは何だろうか。

なれる！SE7 目からウロコの？客先常駐術 (電撃文庫)

作者: 夏海公司,Ixy
出版社/メーカー: KADOKAWA / アスキー・メディアワークス
発売日: 2012/12/27
メディア: Kindle版
この商品を含むブログ (43件) を見る

何が問題なのか？

常駐や多重請負が問題なのではなくて、請負という形態において受注者が「裁量を持っているか」というのが最大の論点だと思っている。例えば以下のようなもの。

作業プロセスについての裁量（やり方を一定の範囲で自由に決定/変更できる）
スケジュールについての裁量（マイルストーンまでの進め方を自由に決定/変更できる）
リソースについての裁量（目標達成に必要なリソースを自由に決定/変更できる)

これらが制限された時に批判されるような不適切なプロジェクトになるのではないだろうか。逆に言えば、裁量の範囲について受発注者が事前に合意出来ていれば、ポジティブな常駐開発が実現できるのではないかと考えている。

もちろん多重請負の構造において、特に途中段階の契約会社がポンコツだった場合は裁量を維持するのは相当な努力を要するだろう。「発注者が＊＊と言っているのでその通りにしてください、反論は受け付けません」という契約関係は論外である。もちろん請負側も「すべて指示してください、自分たちでは考えられません、教えてください」というスタンスではいけないのは言うまでもない。

ところで非常駐開発は常駐開発に比べて上記の裁量を得やすいというのは事実だと思う。
ただし、非常駐開発が裁量を得られているのは非常駐開発が優れているからではなく、顧客に対して透明性が無いからにすぎない。

客から見えないから、作業プロセスを変えてもいいだろう
客から見えないから、スケジュールを変えてもバレないだろう
客から見えないから、リソース変更してもOK

はたしてこれが、常駐開発より優れているのかというと疑問である。

ポジティブな客先常駐システム開発

適切な裁量が確保されているのであれば、あとは常駐開発を選択するかはメリット／メリットの比較だと思う。

メリットとして最も大きいのはコミュニケーション効率化である。利害関係者が一箇所に集まって開発に従事することを、「缶詰」（組織パターン）や、「ウォールーム」と呼ぶのだが、このメリットは非常に大きい。またファシリティコストのメリットもあるだろう。

組織パターン

作者: James O. Coplien,Neil B. Harriosn
出版社/メーカー: 翔泳社
発売日: 2013/08/23
メディア: Kindle版
この商品を含むブログ (4件) を見る

一方でデメリットとしては、最初に紹介したブログ記事にも書かれている通り、顧客の拠点を間借りするためにドレスコードや勤務時間などの制限を受けることはあるだろう（交渉次第だと思うけれど）。また見える場所で作業していることから余計な割り込みの問合せ、コミュニケーションが発生するということもある。

このあたりを冷静に比較して、どのような形態でシステム開発するかは判断すればいい。
というわけで、どちらにしろ常駐開発＝悪というのは、ちょっと違うのではないかと考えたのだった。

2017-07-04

Fireタブレットだけでゼロから学ぶDeep Learning

Kindle programmer

ちょっと思うことがあって、Amazon Kindle Fire HD8で「ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装」(電子版はAmazonではなくOreillyから購入)を読みつつ、Fireタブレット上にPythonの実行環境を作ってコードの実行までやってみた。出来ないことも多いが、意外と戦える。実質的にFire 7980円＋電子書籍2938円で意外と面白い勉強環境を構築することができる。

View this post on Instagram

A post shared by Kent Ishizawa (@agnozingdays)

Fireタブレットで出来ることと、出来ないこと

Fire HD 8 タブレット (8インチHDディスプレイ) (第7世代) 16GB

発売日: 2017/06/06
メディア: エレクトロニクス

先に結論から。

簡易的なLinux環境を作り、各種ソフトウェアを導入してデータサイエンティスト向けのPython実行環境Jupyter Notebookをスタンドアロンで動くようにする
Jupyter上で一定の計算量までのコード実行や計算結果のグラフ表示などを行う
どこまで出来るかというと「ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装」の第3章までは楽勝。4章でニューラルネットワークのバッチ学習処理あたりから、計算途中でストップしてしまう（計算量の少ない誤差逆伝播法でも無理）。
PIL(Pillow)はうまく導入できない（同書の第3章で使っている画像関連のライブラリ)

なお今回はFire HD8でやってみたが、他のFireやAndroid タブレットでも同じことができると思う。

どうしてそうなった

家にもデスクトップPCはあるのだけど、家族共用なので長時間占有しにくい事情あり。コドモがマイクラやり始めたので状況悪化！
社用のノートPCもあるけど環境を汚したくない。
クラウドに学習環境を構築してタブレットから接続することも考えてたが、ローカルで戦えることがわかったので試してみたら意外と出来た！

FireでPython実行環境構築

実施環境はKindle Fire HD 8(第7世代)+FireOS 5.4
termuxというandroidアプリをインストールしてlinux環境を構築、Python及び必要なライブラリをセットアップ、Jupyter Nootebookまで導入する
- Termux
- ほとんど次のページに記載の通り:Running Jupyter and the Scipy stack on Android | Leonardo Uieda
- FireはGoogle Playが利用できないのでapkファイルをES File Explorerなどを使って直接インストール
- numpyの最新版はインストール失敗してしまうため、1.12.0を指定するのが良さそう（現在最新は1.13.0）

$ packages install clang python python-dev fftw libzmq libzmq-dev freetype freetype-dev libpng libpng-dev pkg-config git
$ LDFLAGS=" -lm -lcompiler_rt" pip install numpy==1.12.0 matplotlib pandas jupyter

「ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装」のサンプルコードをgithubからクローンする。

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

作者:斎藤康毅
発売日: 2016/09/24
メディア: 単行本（ソフトカバー）

$ git clone https://github.com/oreilly-japan/deep-learning-from-scratch.git

Jupyter notebook起動

$ jupyter notebook

表示されるURLにSilkブラウザでアクセス
ノートブックを作成してレッツコーディング
- 参考：Jupyter Notebook を使ってみよう – Python でデータサイエンス
Jupyterの終了はtermuxのコンソールに戻ってボリュームダウンのハードキー+cを押して終了確認のプロンプトを表示させ、yを入力

うまくいかない事

冒頭にも書いたけれど、Jupyterから計算量の多いバッチ処理を実行すると termux自体が死んでしまう。具体的には第4章にあニューラルネットワークのバッチ学習処理のサンプルコード「train_neuralnet.py」はJupyterからは実行できなかった
- おそらく原因はJupyterからの非同期コード実行プロセスにある印象。ipythonから実行すると物凄い遅いが、誤差逆伝播法の処理は実行できる。
まぁ、こいつはあくまでおもちゃの類なので、ちゃんとしたスペックの環境を別途構築しようかとは思っている(とりあえずCloud9に環境を建てて試し始めているところ)

スクリーンショット

具体的にはこのような感じになる。動く、動くよ！
f:id:kent4989:20170704225237p:plain:w200 f:id:kent4989:20170704225249p:plain:w200 f:id:kent4989:20170704225259p:plain:w200