Organizations

1 results for srelounge
  • 以下勉強会のメモと感想です。 DIPのSREの活動とこれから(ディップ株式会社 bayashi_ok さん) バイトルなどの求人情報サービスを運営 SREのスタート(小規模、中規模、大規模) 小規模だとはじめやすい DIPは会社規模は大きめ 入社時110人、インフラ8人 規模が拡大してきたのでSREとしての取り組みをはじめた 自動化 - Ansible - 導入の問題(Git, Ansible, コード化メリット) 分からない背景 問題を問題だと気がついていない 気づいていないから学べない よくわからないから変えたくない コード化するメリットを教える 作業の効率性を意識させる 他社事例を教える->メンバーの安心感を得る Git, Ansibleの使い方を何度もレクチャー、丁寧な説明 変更する頻度の高いサーバーから導入 結果、コード化する文化が根付いた 承認フローを確立 作業ミスの軽減、冪等性の担保 リリース作業負荷の軽減 ログの可視化 アラートには出ない404エラーが多数発生 可視化で見えてきたものを元手に組織の連携 速度改善が会社で依頼 Official Google Webmaster Central Blog: Using page speed in mobile search ranking Fastly導入 モバイルサイトUXレポートでカテゴリ単位の総合評価No.1 タップルSREの軌跡と描く未来(株式会社サイバーエージェント 袴田類さん) タップルSREのリーダー DevOpsチームの解散を経験 課題解決型チームだった 負債返却とシステムの更新 コスパのいい課題に重点をおいてやっていた(工数は低いけどインパクトがでかい) 課題解決のインパクトが出しづらくなってしまった ボーナスチャンスを優先的に解決 工数がでかい課題が増えた 足元課題の解決型チームからの脱却 事業目線に立つことが重要 足元課題解決を行いつつ、事業課題を解決 足元課題を極力SLOとして計測可能にする 組織の理想状態の実現に向けて中長期戦力を実行 現状、信頼性担保に振り切れていない SLO アプリケーションメトリクスから作成するSLO 稼働率 サクセスレート レスポンスタイム 組織も抱えるリスク リスクスコア 未実施の障害再発防止策をスコア化 障害対応スキルレベルのSPOF セキュリティー対策 自動化可能作業 CS問い合わせ数 Draw.
    SRE srelounge Created Wed, 29 May 2019 15:50:58 +0000