SRE (Site Reliability Engineer) in Tokyko


サーバ・ネットワークの構築・運用、システムの自動化や障害対応などのシステム管理者的な業務に加えて、システムのパフォーマンスや信頼性、スケーラビリティを向上させるためのソフトウェアの開発・運用を行います。・社内インフラ整備(OS環境:Windows) ⇒社内共有サーバの整備やPCセットアップ、アカウント管理・社内外開発サーバ管理(OS環境:Linux) ⇒ゲーム開発、QA、CIを安定かつ迅速に行うための環境の構築、運用・その他 ⇒システムの効率性や開発における課題検出・改善提案 ⇒高速なレスポンスを実現するためのアプリケーション、ミドルウェアのパフォーマンス改善 ⇒障害検知やキャパシティプランニングのためのモニタリング環境の構築、運用 ⇒各管理ツールの強化(CMS等)やゲームデータ分析を迅速に行うためのログ収集・分析基盤の構築、運用 ⇒デプロイや各種オペレーション自動化ツールの開発、運用We develop and operate software to improve the performance, reliability and scalability of the system, in addition to the system manager's work such as construction and operation of the server network, automation of the system and troubleshooting. Internal infrastructure improvement (OS environment: Windows)⇒ Internal server maintenance, PC setup, account management Internal and external development server management (OS environment: Linux)⇒ Build and operate an environment for stable and prompt execution of game development, QA, CI Others⇒ Suggestions for problem detection and improvement in system efficiency and development⇒ Performance improvement of applications and middleware to realize high-speed response⇒ Build and operate a monitoring environment for fault detection and capacity planning⇒ Construction and operation of log collecting and analysis base for quickly strengthening each management tool (CMS etc.) and game data analysis⇒ Development and operation of deployment and various operation automation tools